Токены и оплата работы нейросети - - Урок №12

Как проходить урок?
Время выполнения Д/З

1 день
Время урока

10 минут
В этом уроке мы разберемся сколько стоят услуги нейросетей, и научимся рассчитывать выгоду.
3. После выполнения ДЗ - переходите к следующему уроку!
2. Внизу будет домашнее задание для выполнения (займет от 10 до 20 минут).
1. Читайте текст урока.
Когда вы работаете с нейросетями вроде ChatGPT, Claude или Mistral — вы платите не за «запрос», как в Яндекс.Директе, и не за «время работы», как у фрилансера. Вы платите за токены.
Многие слышали про токены, но мало кто реально понимает, что это такое, как они считаются, и главное — как не слить бюджет в первый же день.
Давайте разбираться. Простым, человеческим языком.

Что такое токен?

Токен — это не слово. Это кусочек слова.
Пример:
Фраза «Здравствуйте, меня зовут Тимур» — это примерно 6 токенов. Потому что:
  • «Здра»
  • «вствуйте»
  • «,»
  • «меня»
  • «зовут»
  • «Тимур»
ИИ делит текст на такие «кирпичики смысла», и за каждый кирпичик вы платите — и за вход (то, что вы отправили), и за выход (то, что модель сгенерировала).

И увы, да - за каждый запрос нейросети нужно платить. Платить за токены.

Но, это недорого. Разберемся потом сколько.

Плохая новость - оплачивать нужно и на вход (чтобы ИИ обработал ваше сообщение) и на выход (за полученный результат).

Например, если я напишу ИИ "Привет, как дела", то я заплачу и за фразу "Привет" и за ответ искусственного интеллекта на мой вопрос.


Сколько стоит токен?

Зависит от модели. Пример цен (май 2025):

Модель

Вход (1К токенов)

Выход (1К токенов)

GPT-4 Turbo

$0.01

$0.03

GPT-3.5 Turbo

$0.0015

$0.002

Claude 3 Opus

$0.015

$0.075

Mistral

$0.002

$0.002

DeepSeek

$0.001–0.003

$0.001–0.003


Один «письменный» токен плюс минут 0.75 слова.


На простые запросы уходит до 1000 токенов.
Например, генерация текста простого письма на 150 слов — 200–300 токенов на вход (чтобы ИИ обработал запрос) и , 200–300 на выход
Задачи с файлами стоит дороже. Например, расшифровка звонков по 7-10 минут (одного большого звонка обойдется обычно в 2500-3000 окенов)

Как посчитать токены заранее?

Проще всего это сделать через этот сайт
Вбиваем запрос и сайт считает количество токенов.

Если хотите посчитать токены для других нейросетей - можете воспользоваться вот этим сервисом.
Также вбивайте запрос и он просчитает количество токенов каждой модели.

Как управлять расходом токенов?

Сначала разберемся как контролировать расходы. Для этого входим в настройки аккаунта Platform OpenAi в раздел Usage (там где мы регистрировали ваш аккаунт).

И там видим какие у вас траты на токены. И там же пополняем аккаунт, закидывая туда деньги.





У DeepSeek тоже имеется своя платформа для контроля оплат.
Все происходит в этом разделе.

Тамже происходит пополнение денег на аккаунте.


Пополнение, увы, происходит через зарубежную карту.
Но, в России множество сервисов, позволяющих платить за зарубежные сервисы (например, МТС Pay). Ими тоже можно воспользоваться для оплаты.

Также - важное примечание. На новых аккаунтах ChatGtp ограничивает количество операций. После расходования 20 долларов лимит на операции увеличивается.




А сколько обычно выходит?

Здесь расскажу на собственном опыте.
За месяц у нас прослушивается порядка 900 звонков, расшифровывается и ChatGtp по ним пишет рекомендации для менеджеров.
Обычно это обходится в 25-30 долларов в месяц. Плюс-минус (зависит от длительности звонка).

Если бы мы наняли специального менеджера, который расшифровывал бы звонки и писал рекомендации, то он бы работал примерно 6000 минут в месяц или 13 часов в день и мы бы платили ему порядка 120 тыс рублей в месяц.

Таким образом, мы экономим ежемесячно около 115 тысяч рублей в месяц.

Написание 500 текстов в месяц (пишем для внутренних нужд компании) обходится порядка 5 долларов в месяц.





Как сэкономить на токенах?

Вот простые способы сэкономить, не жертвуя качеством:


1) Сокращайте ввод
Например, вместо
«Это звонок с клиентом. Проанализируй, пожалуйста, его речь. Вот полный текст разговора за 8 минут.»
→ Используйте:
«Оцени менеджера по 5 критериям. Вот текст: [текст].»
Без «вежливостей», без вступлений. ИИ всё равно — он не обижается. А вы экономите по 100–300 токенов на каждом запросе.


2) Уменьшайте длину ответа
Например, добавляйте в промпт:
«Ответ — максимум 100 слов. Без повторов и воды.»
Или:
«Оцени по 5 критериям. По каждому — 1 предложение. В конце — вывод (до 3 строк).»

Так вы экономите на выходе, а это зачастую самая дорогая часть.


3) Ограничивайте количество потраченных токенов.
Это можно сделать в настройках модуля OpenAI в N8N или Make.com

Для этого внутри модуля (который в вашем бизнес процессе выполняет задание) - вы нажимайте "add option' и ограничивайте максимальное количество потраченных токенов.

Вот так вот:

4) Используйте GPT-3.5 вместо GPT-4

Да, GPT-4 круче. Но если вы просто генерируете шаблонное письмо — не обязательно платить в 10 раз больше. 90% бизнес-задач GPT-3.5 закроет спокойно. GPT-4 оставьте на сложный анализ, генерацию стратегий и нестандартные кейсы.

Также для массовых и простых задач используйте DeepSeek (он также просто подключается в n8n или make.com).
Токены в DeepSeek стою копейки, но DeepSeek работает хуже чем Grok и ChatGTP, поэтому рекомендую простые задачи отдавать DeepSeek, а сложные ChatGtp.

Например, для анализа сообщения клиента можно использовать DeepSeek (он перескажет, что клиент хочет в email письме), а для написания автоматического ответа - ChatGtp. Все это можно собрать в единой связке в N8N или make.com


5) Используйте temperature и top_p грамотно
Эти параметры не напрямую влияют на стоимость, но чем выше креативность — тем длиннее может быть ответ, потому что модель будет «разгоняться».
Для отчётов, писем, бизнес-анализа → ставьте temperature = 0.3–0.6
Для идей, креатива, контента → можно 0.8–1.0

Настройки температуры и top_p также указываются внутри модуля ИИ с помощью add option.

  1. Просчитайте количество токенов, которое уйдет на ваш проект. Воспользуйтесь калькулятором.
  2. Подумайте как сократить количество токенов с помощью указанных выше рекомендаций
Домашнее задание
Перейти к следующему уроку
Нажмите на кнопку, чтобы перейти к следующему занятию нашего курса