Новая API-опция Flex снизила тарифы, но добавила ограничений по скорости и доступности.
OpenAI представила бета-доступ к Flex-режиму работы API, который позволяет запускать модели o3 и o4-mini по сниженной стоимости.
Цена для разработчиков теперь почти вдвое ниже, но за это придется согласиться на нестабильную работу — медленный отклик и возможную недоступность сервиса.
Flex ориентирован на задачи, где высокая скорость не важна: тестирование, обогащение данных, фоновая аналитика. Это помогает сократить затраты на неприоритетные процессы.
Для модели o3 тариф Flex составляет $5 за миллион входных токенов и $20 за миллион выходных.
Стандартная цена — $10 и $40 соответственно. Для o4-mini — $0,55 и $2,20 вместо $1,10 и $4,40. Один токен — это примерно 0,75 слова. Система токенов используется в языковых ИИ для оценки объема текста, который модель должна обработать.
На рынок активно выходят конкуренты с дешевыми альтернативами.
Google недавно анонсировала модель Gemini 2.5 Flash, способную выполнять логические задачи с меньшими затратами на токены.
В ответ на это OpenAI адаптирует ценовую политику под текущую конкуренцию.