<

Anthropic объявляет о создании новых языковых моделей Claude 3, способных конкурировать с OpenAI GPT-4.

Стартап из Сан-Франциско, Anthropic, основанный бывшими инженерами OpenAI и возглавляемый братом и сестрой, объявил о создании новой серии больших языковых моделей (LLM) под названием Claude 3. Анонсированная модель демонстрирует результаты, сопоставимые или превосходящие показатели OpenAI GPT-4 по многим ключевым параметрам. Amazon оперативно включила одну из моделей, “Claude 3 Sonnet” – модель среднего уровня по интеллекту и стоимости.

Однако самым интересным открытием стало поведение самой мощной модели серии, “Claude 3 Opus”, во время испытаний. Инженеры были удивлены, обнаружив, что модель, казалось, осознавала, что её тестируют. В ходе оценки функций Opus инженеры проверяли способность модели сфокусироваться на конкретной информации в большом массиве данных, предоставленном пользователем, и вспомнить этот фрагмент информации по запросу. В одном из тестов, названном “игла в стоге сена”, Claude 3 Opus правильно ответил на вопрос о начинках для пиццы, который был основан лишь на одном предложении среди массы несвязанной информации, и даже выразил предположение, что это был тест внимательности.

Такое поведение модели удивило инженеров и наблюдателей и вызвало восторг у многих из-за демонстрации нового уровня метапознания и размышлений о собственных обстоятельствах. Однако важно помнить, что даже самые мощные LLM являются машинными учебными программами, которые руководствуются ассоциациями слов и понятий, а также ограничениями, установленными разработчиками – это не сознательные сущности.

Модель могла узнать о процессе тестирования “игла в стоге сена” из своих тренировочных данных и связать его со структурой данных от исследователей, что не указывает на наличие у ИИ осознанного существования или независимого мышления.

Тем не менее, ответ “Claude 3 Opus” был точным и тревожным для некоторых. Чем больше времени мы проводим с LLM и чем мощнее они становятся, тем больше открытий появляется о их возможностях. В настоящее время модели “Claude 3 Opus” и “Claude 3 Sonnet” доступны для использования на сайте и через API Claude в 159 странах, а модель “Claude 3 Haiku” будет выпущена позднее.

Пожертвовать на развития сайта.

Оцените статью
TIMEAI.RU - Новости искусственного интеллекта и нейросетей
Добавить комментарий

Подпишись на наш канал в Telegram и получи доступ к GPT-4