Оплата нейросетей: подписка или по факту

Разбираем, когда малому бизнесу выгоднее платить за нейросети по факту использования, а когда фиксированная подписка предсказуемее и дешевле.

Малый бизнес часто подключает нейросети «на всякий случай», а через месяц обнаруживает два разных сценария: либо сервис почти не трогали, но подписка уже списалась, либо команда активно генерировала тексты, запускала агентов и неожиданно упёрлась в лимиты. Правильная модель оплаты зависит не от модного названия тарифа, а от объёма задач: сколько сотрудников работают с ИИ, сколько токенов уходит на запросы и насколько тяжёлые сценарии вы запускаете.

Что именно вы оплачиваете: не только «доступ к нейросети»

В B2B-задачах важно отличать три сущности:

Доступ к моделям — возможность работать с GPT-5.5, Claude, Gemini и другими моделями в одном кабинете O·LESA.
Объём использования — сколько текста вы отправляете в модель и получаете обратно. Это измеряется в токенах.
Сложность сценария — простой вопрос в чат и агент, который анализирует документы, ищет данные и пишет отчёт, потребляют ресурсы по-разному.

Токен — это не ровно слово, но для прикидки можно считать: 1 000 токенов — примерно 600–800 слов русского текста. Если менеджер пишет короткий запрос и получает короткий ответ, расход небольшой. Если маркетолог загружает ТЗ, расшифровку интервью, таблицу конкурентов и просит подготовить статью, расход растёт в разы.

Фиксированная подписка удобна тем, что бюджет предсказуем. Оплата по факту использования удобна тем, что вы не платите за простой. Вопрос только в точке безубыточности: при каком объёме фактическая оплата становится дороже подписки.

Три типовых сценария малого бизнеса

У большинства небольших компаний использование нейросетей укладывается в один из трёх сценариев.

1. Лёгкий чат для операционных задач

Это ежедневные короткие запросы:

переписать письмо клиенту;
сформулировать ответ на претензию;
сделать краткое резюме встречи;
придумать 5 вариантов заголовка;
перевести или упростить текст.

Пример: 3 сотрудника делают по 10 коротких запросов в день. Один запрос вместе с ответом — около 1 500 токенов. В месяце 22 рабочих дня.

Расчёт: 3 × 10 × 22 × 1 500 = 990 000 токенов в месяц.

Это меньше 1 млн токенов. Для такого сценария фиксированная подписка часто оказывается избыточной, если она покупается «на всех» и используется нерегулярно. Оплата по факту выигрывает: команда платит только за реальные обращения к моделям.

2. Регулярная генерация контента

Сюда попадают маркетинг, продажи, HR и обучение:

посты для соцсетей и рассылок;
SEO-статьи и лендинги;
коммерческие предложения;
описания товаров;
скрипты продаж;
базы знаний и инструкции.

Пример: маркетолог готовит 12 статей в месяц, 20 постов, 4 рассылки и 8 коммерческих материалов. На одну статью с брифом, планом, черновиком и редактурой может уйти 25 000–60 000 токенов. На пост — 3 000–8 000. На коммерческое предложение — 10 000–20 000.

Усреднённый расчёт:

статьи: 12 × 40 000 = 480 000 токенов;
посты: 20 × 5 000 = 100 000 токенов;
рассылки: 4 × 12 000 = 48 000 токенов;
коммерческие материалы: 8 × 15 000 = 120 000 токенов.

Итого: 748 000 токенов в месяц. Но если в процесс добавить анализ конкурентов, переработку интервью, несколько итераций правок и генерацию иллюстративных промптов, объём легко вырастает до 2–5 млн токенов.

Здесь модель оплаты зависит от дисциплины процесса. Если контент выходит волнами — например, перед выставкой или запуском продукта, — выгоднее платить по факту. Если отдел маркетинга стабильно работает с ИИ каждый день, фиксированная подписка может быть удобнее.

3. Тяжёлые AI-агенты

Агенты — это не просто чат. Они могут выполнять цепочку действий: принять задачу, прочитать файлы, разложить данные, сделать промежуточные выводы, обратиться к нескольким моделям, подготовить итоговый документ.

Типовые задачи:

анализ тендерной документации;
обработка входящих заявок и лидов;
подготовка отчётов по продажам;
классификация обращений в поддержку;
извлечение данных из договоров;
сбор черновика аналитической справки.

Пример: агент анализирует 30 документов в месяц. Каждый документ — 20 страниц. На чтение, промежуточные рассуждения, проверку и итоговый отчёт уходит около 150 000 токенов.

Расчёт: 30 × 150 000 = 4,5 млн токенов в месяц.

Если таких агентов несколько, расход может быстро перейти в диапазон 10–30 млн токенов. В этом сценарии важно не просто выбрать оплату, а настроить лимиты, роли, шаблоны промптов и контроль качества. Иначе тяжёлый агент будет «думать» слишком подробно там, где достаточно короткой классификации.

Как найти точку, где оплата по факту выгоднее подписки

Формула простая:

Точка безубыточности = стоимость подписки / цена 1 000 токенов × 1 000

Возьмём условный пример для расчёта. Допустим, фиксированный пакет стоит 4 900 ₽ в месяц, а оплата по факту — 1,20 ₽ за 1 000 токенов на типовых текстовых задачах.

Тогда:

4 900 / 1,20 × 1 000 = 4 083 333 токена.

Это значит:

если команда использует меньше 4,1 млн токенов в месяц, оплата по факту дешевле;
если стабильно больше 4,1 млн токенов, подписка начинает выглядеть выгоднее;
если расход скачет от 500 тыс. до 8 млн токенов, лучше считать среднее за 2–3 месяца, а не принимать решение по одному пиковому периоду.

Для разных моделей цена 1 000 токенов может отличаться. Чем дороже модель и чем сложнее задача, тем ниже порог, после которого фиксированный пакет становится привлекательным.

Пример сравнения:

Сценарий	Расход в месяц	По факту при 1,20 ₽ / 1 000 токенов	Подписка 4 900 ₽	Что выгоднее
Лёгкий чат	1 млн	1 200 ₽	4 900 ₽	По факту
Контент регулярно	3 млн	3 600 ₽	4 900 ₽	По факту
Контент + агенты	5 млн	6 000 ₽	4 900 ₽	Подписка
Тяжёлые агенты	15 млн	18 000 ₽	4 900 ₽	Подписка или корпоративный лимит

Цифры в таблице — пример методики. Для финального решения нужно подставлять актуальные условия вашего тарифа и выбранных моделей в O·LESA.

Почему «дешевле за токен» не всегда значит выгоднее

Малому бизнесу важно считать не только стоимость токенов, но и организационные издержки.

Фиксированная подписка хороша, когда:

нужно заранее заложить бюджет;
ИИ используют каждый день несколько сотрудников;
есть регулярные задачи в маркетинге, продажах, поддержке;
важна простота: оплатили месяц и работаете;
руководитель не хочет согласовывать каждую всплесковую нагрузку.

Оплата по факту лучше, когда:

использование нерегулярное;
команда только тестирует AI-процессы;
есть сезонность: выставки, распродажи, отчётные периоды;
важно не платить за месяцы простоя;
разные отделы подключаются постепенно.

Есть и смешанный подход: базовый фиксированный пакет для ядра команды плюс оплата сверх лимита по факту. Для малого бизнеса это часто самый практичный вариант: бухгалтерия видит понятный ежемесячный платёж, а команда не останавливается, если в конкретный месяц задач стало больше.

Как снизить расход без потери качества

Независимо от модели оплаты, расход можно оптимизировать. Обычно экономия появляется не за счёт «запрета пользоваться ИИ», а за счёт грамотной настройки процессов.

Разделяйте задачи по сложности. Не нужно отправлять простую классификацию самой мощной модели. Для черновиков, сортировки и коротких ответов подойдут более лёгкие режимы.
Используйте шаблоны промптов. Хороший шаблон сокращает количество уточнений и повторных генераций.
Не загружайте лишние документы. Если агенту нужен один раздел договора, не надо отправлять весь архив.
Ограничивайте длину ответа. Просьба «дай краткий вывод на 7 пунктов» дешевле, чем «подробно распиши всё».
Вводите лимиты по ролям. Маркетологу, юристу и менеджеру продаж могут быть нужны разные объёмы и разные модели.
Смотрите статистику по отделам. Иногда 80% расходов создают 2–3 сценария, которые можно перепроектировать.

В O·LESA удобно собирать работу с разными моделями и агентами в одном кабинете: бизнес видит не разрозненные эксперименты сотрудников, а управляемую AI-инфраструктуру с оплатой через привычные российские способы — ЮKassa или Т-Банк.

Практическое правило для малого бизнеса

Если коротко, ориентируйтесь на три диапазона.

До 1–2 млн токенов в месяц — почти всегда стоит начинать с оплаты по факту. Это лёгкий чат, разовые тексты, тестирование гипотез.
2–5 млн токенов в месяц — пограничная зона. Считайте стоимость подписки, цену 1 000 токенов и стабильность нагрузки. Если объём повторяется 2–3 месяца подряд, можно переходить на фиксированный пакет.
От 5 млн токенов в месяц и выше — подписка или индивидуально настроенный лимит часто выгоднее и спокойнее. Особенно если работают агенты, документы и несколько отделов.

Главное — не выбирать тариф «на глаз». Начните с фактического месяца, посмотрите статистику, выделите тяжёлые сценарии и посчитайте точку безубыточности. Тогда оплата нейросетей станет не статьёй непредсказуемых расходов, а понятным инструментом роста производительности.

Заключение

Оплата по факту выгодна, когда ИИ используется нерегулярно или в небольших объёмах. Подписка выигрывает при стабильной ежедневной нагрузке, регулярном контенте и тяжёлых агентах. Для малого бизнеса лучший первый шаг — измерить реальное потребление токенов в O·LESA, а затем выбрать модель оплаты по цифрам, а не по ощущениям.