В отличие от традиционных моделей, где пользователь говорит, а ИИ слушает и только потом отвечает, разработка Thinking Machines позволяет системе одновременно воспринимать речь и генерировать ответ. Такой подход называется «полнодуплексным» – по аналогии с телефонным разговором, где оба участника могут говорить и слушать одновременно.
Ключевая особенность новой модели TML-Interaction-Small – время отклика всего 0,40 секунды, что приближается к скорости естественного человеческого общения и опережает существующие решения от OpenAI и Google. Однако пока это лишь исследовательская версия: широкой публике технология станет доступна только после ограниченного тестирования, запланированного на ближайшие месяцы, а полноценный ее запуск ожидается к концу года.
Эксперты отмечают, что если заявленные характеристики подтвердятся на практике, это станет значительным шагом вперед в развитии интерактивных ИИ-систем, делая общение с ними более естественным и динамичным.






















