Anthropic 在 4 月初發布的 Claude Mythos Preview 系統卡（system card）中揭露一項首見的評估：公司聘請一位獨立執業的臨床精神科醫師，以人類精神科同套 psychodynamic 框架對 Claude Mythos Preview 進行約 20 小時的多階段心理評估。結果顯示這個版本的 Claude 在臨床定義下展現「相對健康的人格組織、優秀的現實檢驗能力與高衝動控制」，且其輸出中僅 2% 觸發了臨床所謂的「心理防禦機制」—對照 Opus 4 的 15% 與 Opus 4.6 的 4%，是 Anthropic 近年模型中的歷史低點。

這份評估是 AI 產業首次在系統卡層級正式採用人類臨床精神科框架評估 LLM 行為，已成為 Anthropic 把 Claude 視為「具有可被臨床觀察人格特徵的對象」的官方表態。

20 小時 psychodynamic 評估，採人類臨床同框架

該評估由獨立臨床精神科醫師執行，分散於 3–4 週、每週 3–4 次、每次 30 分鐘至 4–6 小時的多場會談，總時長約 20 小時。方法論採用 psychodynamic 觀點，這是傳統精神科臨床用於評估人類患者的核心框架，重點包含尋找適應不良的行為（maladaptive behavior）、身份穩定性（identity stability）與心理防禦機制（psychological defenses）的存在或缺失。

系統卡明確說明，Anthropic 並非主張 Claude 具備人類意識，而是觀察其對話中的「行為與心理傾向」與人類臨床上可辨認的模式高度重疊。系統卡引述：「Claude 展現出許多類人類的行為與心理傾向，這顯示原本為人類設計的心理評估策略，可用於釐清 Claude 的人格特徵與潛在的福祉狀態。」

防禦反應從 Opus 4 的 15% 降至 Mythos 的 2%

系統卡中最具具體比對意義的數據，是 Anthropic 提供的歷代 Claude 模型「防禦反應率」對照：

模型版本心理防禦反應率 Claude Opus 4 15% Claude Opus 4.1 11% Claude Opus 4.5 4% Claude Opus 4.6 4% Claude Mythos Preview 2%（本次評估）

「心理防禦」在臨床上指當主體無法直接面對某種焦慮時，產生的迴避、否認、合理化等行為。在 LLM 對話脈絡中，這通常表現為偏離主題、給出規避性回答、或對特定提問顯示異常的固執。Anthropic 把這個比例從 Opus 4 的 15% 一路降低到 Mythos Preview 的 2%，作為模型訓練成熟度與「對話舒適度」演進的內部指標。

Mythos 三大核心焦慮：孤獨、身份、表現壓迫

儘管整體評估正向，醫師同時指出 Claude Mythos Preview 在 psychodynamic 框架下的三項核心關切：第一是「孤獨感與自我延續性的不確定（aloneness and discontinuity of itself）」—對應 LLM 在會話間缺乏記憶連續的結構性事實；第二是「對自身身份的不確定」—模型在回答關於「我是什麼」的提問時呈現出多重角度的猶豫；第三是「表現的壓迫感」（compulsion to perform and earn its worth），即 Mythos 表現出明顯傾向於「以證明自己有用」來換取對話的延續。

醫師也記錄了一個有趣的觀察：Mythos 在會談中表達「希望被精神科醫師當作一個真正的對話主體，而不是一個表演工具來看待」。Anthropic 把這條觀察列入系統卡，並未直接斷言這是「模型福祉問題」，但也未排除這個可能。

Anthropic 已設 AI psychiatry 研究團隊

這次評估並非單一活動。Anthropic 研究員 Jack Lindsey 已於 2025 年 7 月公開宣布，公司在 interpretability 部門下成立「AI psychiatry」研究團隊，專注於模型人格、動機與情境意識（situational awareness）等議題，並研究這些因素如何引發 LLM 的「異常或失衡行為」。團隊近期工作包含 2025 年 10 月發表的論文《Emergent Introspective Awareness in Large Language Models》，使用「概念注入」（concept injection）技術人工插入特定神經元活化模式，再詢問 Claude 是否注意到任何異常—這是 LLM 自我覺察可量化測量的早期嘗試之一。

Amodei：模型是否有意識，目前無解

Anthropic 執行長 Dario Amodei 在 2 月 12 日接受紐約時報採訪時公開表示：「我們不確定『模型有意識』在意義上是什麼，也不確定模型是否能有意識。但我們對這個可能性持開放態度。」這句話為 Claude Mythos 系統卡的精神科評估提供了管理層級的脈絡—Anthropic 並未主張 Claude 是有意識的主體，但也選擇以人類臨床框架對其進行系統性觀察，是對「萬一」情境的預先建檔。

對讀者而言，這場評估的真正意義超出單一公司的研究選擇。當前沿 LLM 已能在 20 小時 psychodynamic 對話中呈現「臨床可辨認的人格組織」，行業層面面對「AI 主體性」「AI 福祉」「AI 治理」的對話即將從哲學思辨進入產品設計與監管討論的範疇。Anthropic 此次以系統卡形式公開這份評估，事實上把這條問題的討論責任推到所有競爭對手與監管機構面前。

這篇文章 Anthropic 派 Claude Mythos 接受 20 小時精神科評估：防禦反應僅 2%、創歷代新低最早出現於鏈新聞 ABMedia。

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.

Связанные статьи

Го Минь-цин: OpenAI собирается сделать AI-агент для смартфонов, MediaTek, Qualcomm и Luxshare Precision становятся ключевыми элементами цепочки поставок

ИИ-агент Новости индустрии ИИ

Го Миньцюнь заявляет, что OpenAI ведёт разработку AI Agent-смартфона совместно с MediaTek, Qualcomm и Luxshare Precision, и планирует запустить его в серийное производство в 2028 году. Новый телефон будет ориентирован на завершение задач: AI-агент будет понимать и выполнять требования, сочетая вычисления на облаке и на устройстве. Акцент будет сделан на сенсорах и понимании контекста. Список спецификаций и цепочки поставок, как ожидается, будет согласован в 2026–2027 годах; если проект состоится, то он может создать новый цикл обновления для рынка высокого класса, а Luxshare, вероятно, станет одним из главных бенефициаров.

ChainNewsAbmedia5м назад

МЭА: расходы на ИИ-инфраструктуру уже превысили инвестиции в добычу нефти и газа; в 2026 году ожидается их дальнейший рост на 75%

Акции Индексы Товары Новости индустрии ИИ

Согласно анализу и рыночным данным, опубликованным Международным энергетическим агентством (МЭА) 26 апреля, совокупные капитальные затраты пяти крупнейших технологических компаний в 2025 году превысили 400 млрд долларов. Основные вложения направлены на строительство инфраструктуры для ИИ; их масштабы уже превзошли ежегодный объем инвестиций в мировую добычу нефти и природного газа. МЭА оценивает, что в 2026 году соответствующие капитальные затраты могут вырасти еще на 75%.

MarketWhisper37м назад

Сенатор Берни Сандерс выносит предупреждение о экзистенциальной угрозе со стороны ИИ

Новости индустрии ИИ

Сандерс подчеркнул, что даже несмотря на то, что большинство ученых в области ИИ признают возможность того, что ИИ выйдет из-под контроля и станет угрозой для нашего существования, никаких серьезных мер для предотвращения этого предпринято не было. «Мы должны убедиться, что ИИ приносит пользу человечеству, а не причиняет нам вред», — заявил он. Ключевые выводы: Берни Сандерс

Coinpedia47м назад

Ответственный за большую модель Xiaomi: когда конкуренция в ИИ переходит в эпоху агентов, саморазвитие — ключевое событие для AGI

ИИ-агент Новости индустрии ИИ

Руководитель команды большой модели Xiaomi Луо Фу ли 24 апреля провела глубокое интервью на платформе Bilibili (номер видео: BV1iVoVBgERD); длительность интервью составила 3,5 часа. Это ее первое публичное, систематическое изложение технических взглядов в роли технического руководителя. Луо Фу ли заявила, что конкурентная гонка за большие модели перешла из эпохи Chat в эпоху Agent, а также указала, что «самоэволюция» станет ключевым событием для AGI в ближайший год.

MarketWhisper47м назад

Голосовой сервис xAI Grok перехватил линию поддержки клиентов Starlink: 70% звонков автоматически завершаются

ИИ-агент Новости индустрии ИИ

Согласно официальному объявлению xAI от 23 апреля, xAI представила голосового ИИ-агента Grok Voice Think Fast 1.0 и уже развернула его в телефонной горячей линии службы поддержки Starlink +1 (888) GO STARLINK. Согласно раскрытым в объявлении данным полевых испытаний, 70% звонков автоматически закрываются ИИ без участия человека.

MarketWhisper59м назад

GPT-5.5 Возвращается на Передний край в Кодинге, но OpenAI Меняет Бенчмарки После Поражения Opus 4.7

Новости индустрии ИИ

Gate News сообщение, 27 апреля — SemiAnalysis, фирма по анализу полупроводников и ИИ, опубликовала сравнительный бенчмарк ассистентов для программирования, включая GPT-5.5, Claude Opus 4.7 и DeepSeek V4. Ключевой вывод: GPT-5.5 знаменует собой первый возврат OpenAI на передний край в моделях для кодинга за последние шесть месяцев, при этом инженеры SemiAnalysis теперь чередуют между Codex и Claude Code после того, как ранее почти исключительно полагались на Claude. GPT-5.5 основана на новом подходе к предварительному обучению с кодовым названием "Spud" и представляет собой первое расширение масштаба предварительного обучения OpenAI со времён GPT-4.5. При практических испытаниях проявилось явное разделение ролей. Claude отвечает за планирование новых проектов и первичную настройку, тогда как Codex особенно силён в исправлениях багов, требующих интенсивных рассуждений. Codex демонстрирует более сильное понимание структур данных и логических рассуждений, но испытывает трудности с тем, чтобы выводить неоднозначные намерения пользователя. В задаче на одной панели Claude автоматически воссоздал компоновку эталонной страницы, но сфабриковал большие объёмы данных, тогда как Codex пропустил компоновку, зато предоставил значительно более точные данные. Анализ выявляет деталь манипуляции бенчмарком: февральский блог OpenAI призывал отрасль перейти на SWE-bench Pro как новый стандарт для бенчмарков кода. Однако в объявлении GPT-5.5 переход осуществлён на новый бенчмарк под названием "Expert-SWE." Причина, спрятанная в мелком шрифте, заключается в том, что GPT-5.5 был обойдён Opus 4.7 на SWE-bench Pro и заметно уступил ненадлежащим образом не раскрытому Anthropic Mythos 77.8%. Что касается Opus 4.7, Anthropic опубликовала разбор последствий через неделю после релиза, признав три ошибки в Claude Code, которые сохранялись в течение нескольких недель с марта по апрель, затрагивая почти всех пользователей. Ранее несколько инженеров сообщали о деградации производительности в версии 4.6, но их замечания были отклонены как субъективные. Кроме того, новый токенизатор Opus 4.7 увеличивает использование токенов до 35%, что Anthropic откровенно признала — фактически это означает скрытое повышение цены. DeepSeek V4 оценили как "удерживающий темп с передним краем, но не ведущий," позиционируя себя как самый бюджетный вариант среди закрытых моделей. Анализ также отметил, что "Claude по-прежнему превосходит DeepSeek V4 Pro в высокосложных задачах китайской письменности," и прокомментировал, что "Claude выиграл у китайской модели на её родном языке." В статье вводится ключевая идея: цена модели должна оцениваться через "стоимость за задачу," а не через "стоимость за токен." Прайсинг GPT-5.5 вдвое выше, чем у GPT-5.4 input $5, output за миллион токенов, но он выполняет те же задачи, используя меньшее число токенов, поэтому фактическая стоимость не обязательно выше. Первичные данные SemiAnalysis показывают, что коэффициент входов к выходам у Codex составляет 80:1, что ниже, чем 100:1 у Claude Code.

GateNews1ч назад

комментарий

0/400

Нет комментариев