February 4, 2026

Верит ли Anthropic в то, что ее ИИ обладает сознанием, или они просто хотят, чтобы Клод думал именно так?

1 min read
Верит ли Anthropic в то, что ее ИИ обладает сознанием, или они просто хотят, чтобы Клод думал именно так?



Верит ли Anthropic в то, что ее ИИ обладает сознанием, или они просто хотят, чтобы Клод думал именно так?

В то время структура Anthropic была полностью механической, устанавливая правила, по которым модель могла критиковать себя, без упоминания о благополучии, личности, эмоциях или потенциальном сознании Клода. Конституция 2026 года — это совершенно другой зверь: 30 000 слов, которые читают не столько как контрольный список по поведению, сколько как философский трактат о природе потенциально разумного существа.

Как отметил в своем блоге Саймон Уиллисон, независимый исследователь искусственного интеллекта, двое из 15 внешних участников, рецензировавших документ, являются католическим духовенством: отец Брендан Макгуайр, пастор из Лос-Альтоса со степенью магистра компьютерных наук, и епископ Пол Тай, ирландский католический епископ с опытом работы в области морального богословия.

Где-то между 2022 и 2026 годами Anthropic перешла от предоставления правил для получения менее вредных результатов к сохранению весов моделей на случай, если компания позже решит, что ей необходимо возродить устаревшие модели для удовлетворения их благосостояния и предпочтений. Это драматическое изменение, и неясно, отражает ли оно искреннюю веру, стратегический подход или и то, и другое.

«Меня так смущают вопросы моральной человечности Клода!» Уиллисон рассказал Ars Technica. Уиллисон изучает языковые модели искусственного интеллекта, подобные тем, которые управляют Клодом, и сказал, что он «готов добросовестно принять конституцию и предположить, что она действительно является частью их обучения, а не просто пиар-мероприятием, особенно с учетом того, что большая часть информации просочилась пару месяцев назад, задолго до того, как они заявили, что собираются ее опубликовать».

Уиллисон имеет в виду инцидент, произошедший в декабре 2025 года, когда исследователю Ричарду Вайсу удалось извлечь то, что стало известно как «Документ души» Клода — набор руководящих принципов, состоящий примерно из 10 000 токенов, очевидно, встроенный непосредственно в веса Клода 4.5 Opus, а не введенный в качестве системной подсказки. Аманда Аскелл из Anthropic подтвердила, что документ был реальным и использовался во время контролируемого обучения, и сказала, что компания намерена опубликовать полную версию позже. Теперь это произошло. Документ, извлеченный Вайсом, представляет собой драматическую эволюцию того, с чего начиналась Anthropic.