Компания LifePrompt сообщила о результатах тестирования модели GPT-5.2 Thinking на реальных японских вступительных экзаменах. Нейросети передавали задания в виде изображений, после чего она формировала полные ответы, включая эссе. Проверкой работ занимались преподаватели крупной частной подготовительной школы Kawai Juku.

На медицинском направлении Токийского университета модель набрала на 50 баллов больше, чем лучший реальный участник экзаменов, а также получила максимальный результат по математике. По данным Kyodo News, это особенно заметный прогресс на фоне 2024 года, когда модель GPT-4 не смогла пройти аналогичные испытания. Высокие результаты GPT-5.2 показала и в других блоках Токийского университета. В гуманитарном направлении ИИ набрал 452 балла из 550 возможных, а в естественно-научном — 503 балла, что также оказалось выше рекордных проходных показателей среди поступивших студентов.

При этом сильные и слабые стороны модели проявились неравномерно. Английский язык нейросеть выполнила примерно на 90%, тогда как эссе по всемирной истории оценили лишь на 25%. Это показывает, что даже при впечатляющих общих результатах ИИ пока не одинаково силён во всех дисциплинах. Похожие итоги были зафиксированы и в Киотском университете. На юридическом факультете система получила 771 балл при проходном максимуме в 734, а на медицинском направлении — 1176 баллов против 1098 у лучшего абитуриента.

Глава LifePrompt Satoshi Endo заявил, что бизнесу уже сейчас стоит готовиться к глубокой интеграции ИИ в рабочие процессы на десятилетия вперёд. В то же время профессор Университета Кэйо Сатоси Курихара отметил, что прямое сравнение человека и машины не всегда корректно, поскольку люди сохраняют преимущество в создании новой ценности и нестандартных идей. Эксперты также считают, что столь высокие результаты GPT-5.2 могут подтолкнуть университеты к пересмотру традиционных экзаменационных систем.