GPT-5 как сборка из двух моделей: лёгкой для простых запросов и тяжёлой для сложных, что сокращает расходы на вычисления.
Маршрутизирующая модель распределяет запросы между версиями, позволяя обрабатывать большинство задач менее ресурсозатратно.
Автоматическое переключение режима рассуждений уменьшает количество генерируемых токенов и затраты, при этом бесплатные пользователи не могут включать его вручную.
Снятие поддержки прежних моделей (включая GPT-4o) для экономии ресурсов вызвало критику, но частично было отменено.
Контекстное окно не увеличено для ChatGPT: 8 000 токенов для бесплатных и 128 000 для платных пользователей, уступая конкурентам.
Через API доступно окно до 400 000 токенов, однако стоимость его использования значительно выше.
Решения по восстановлению GPT-4o, настройкам скорости ответов и увеличенным лимитам сообщений приняты после критики пользователей.
OpenAI планирует удвоить вычислительные мощности в течение года, при этом приоритет будет отдан платным клиентам и API.
Get notified when new stories are published for "Hacker News 🇷🇺 Русский"