В четверг OpenAI анонсировала GPT-5.4 — свое новейшее семейство моделей, созданных для решения реальных профессиональных задач. Компания позиционирует их как самые функциональные и эффективные на сегодняшний день, особенно в работе с документами, таблицами, кодом и многоэтапными процессами.
GPT-5.4 доступна в трех вариантах. Стандартная модель предназначена для API и инструментов разработчика. GPT-5.4 Thinking добавлена в ChatGPT как опция, ориентированная на логическое мышление и построение цепочек рассуждений. GPT-5.4 Pro — для пользователей, которым нужна максимальная производительность в сложных задачах. По данным OpenAI, модель показала лучшие результаты в бенчмарках OSWorld-Verified и WebArena Verified, оценивающих взаимодействие ИИ с программными средами и онлайн-инструментами. В тесте OpenAI GDPval (написание текстов, исследования, анализ) модель набрала 83 процента. В бенчмарке APEX-Agents от Mercor, проверяющем профпригодность в юриспруденции и финансах, GPT-5.4 заняла первое место.
Как отмечает гендиректор Mercor Брендан Фуди, модель особенно сильна в создании длинных профессиональных материалов — презентаций, финансовых моделей, юридических анализов, при этом работая быстрее и дешевле конкурентов. Важное улучшение — эффективность использования токенов. GPT-5.4 решает те же задачи, тратя значительно меньше токенов, чем GPT-5.2, что снижает вычислительные затраты и время отклика. В API поддерживаются контекстные окна до 1 миллиона токенов — достаточно для обработки огромных документов без потери нити.
OpenAI добавила функцию «поиска инструментов» (Tool Search). Раньше системные промпты включали определения для каждого доступного инструмента, что при росте библиотек съедало уйму токенов. Теперь модель ищет нужные определения только по запросу, экономя ресурсы и ускоряя ответы. Кроме того, GPT-5.4 получила расширенные возможности прямого взаимодействия с компьютерами. Агенты ИИ могут работать с софтом, перемещаться по приложениям и выполнять сложные процессы в разных системах, сохраняя контекст на всем протяжении.
OpenAI уделила внимание и безопасности. В версии Thinking риск «обмана» (когда модель скрывает свои истинные рассуждения) оценивается как низкий. По заявлению компании, мониторинг цепочки рассуждений остается эффективным инструментом контроля. Точность тоже выросла: вероятность ошибок в отдельных утверждениях снизилась на 33 процента по сравнению с GPT-5.2, а общая частота фактических ошибок — на 18 процентов.
В ChatGPT версия Thinking может показывать пользователю предварительный план рассуждений до генерации полного ответа. Это позволяет корректировать направление прямо в процессе, добиваясь лучших результатов без дополнительных промптов. GPT-5.4 уже доступна разработчикам и пользователям ChatGPT. Ставка сделана на профессионалов, и, судя по цифрам, ставка оправдана.















