Google представила новое семейство «рассуждающих» ИИ-моделей Gemini 2.5. Они делают паузу перед ответом для размышлений.
Первой из серии выпущена экспериментальная версия Gemini 2.5 Pro. Мультимодальная нейросеть с рассуждениями «является самой интеллектуальной на сегодняшний день». Она доступна на платформе для разработчиков Google AI Studio и в приложении Gemini для владельцев подписки Advanced стоимостью $20 в месяц.
«В Gemini 2.5 мы достигли нового уровня производительности, объединив значительно улучшенную базовую модель с усовершенствованным пост-обучением», - говорится в блоге корпорации.
Компания добавила, что в будущем все ее модели будут обладать способностью рассуждать.
В тесте Aider Polyglot, отслеживающем навыки программирования, Gemini 2.5 Pro набрала 68,6% баллов, опередив ведущие решения от OpenAI, Anthropic и DeepSeek.
В бенчмарке SWE-bench Verified, измеряющим способности разработчиков ПО, решение от Google проиграло Claude 3.7 Sonnet — 63,8% против 70,3%.
В мультимодальном тесте Humanity’s Last Exam, состоящем из тысячи вопросов в области математики, гуманитарных и естественных наук, Gemini 2.5 Pro набрала 18,8%, превысив результаты конкурентов.
Gemini 2.5 Pro имеет контекстное окно в 1 млн токенов — модель способна воспринимать примерно 750 000 слов за раз. В будущем планируется удвоение показателя.
«Рассуждающим» ИИ необходимо больше времени и вычислительных ресурсов для предоставления точного и обширного ответа. Первой «думающую» нейросеть показала OpenAI — в сентябре 2024 года она выпустила o1. Другие ИИ-разработчики занялись созданием собственных решений. Среди них DeepSeek, Anthropic, Alibaba и другие.
Напомним, в марте Google анонсировала ряд ИИ-продуктов и функций для сектора здравоохранения.
Ранее компания обучила своего ИИ-помощника Gemini анализировать и учитывать историю поиска пользователя для предоставления более релевантного ответа.