AI‑агенты для не‑технаря

Урок 4. Лимиты API и стоимость запросов#

Цель: понять, что у API есть ограничения и как не превысить лимиты.

API не может обрабатывать бесконечное количество запросов. Поэтому сервисы устанавливают лимиты:

Если вы превысите лимит, API вернёт ошибку:

{
  "error": "Rate limit exceeded. Try again in 60 seconds."
}

Лимиты защищают сервис от:

перегрузки (если все начнут делать миллион запросов одновременно, сервис упадёт)
злоупотребления (например, DDoS-атаки)
неэффективного использования (если ваш агент делает 1000 запросов вместо 1, это плохой код)

Лимиты всегда указаны в документации API. Ищите раздел:

Пример: OpenAI API (ChatGPT)

На бесплатном тарифе (2026):

На платном тарифе (Pay-as-you-go):

1. Делайте запросы только когда нужно

Не делайте запрос на каждое сообщение пользователя, если можно обработать локально.

2. Используйте кеширование

Если данные не меняются часто (например, список товаров), кешируйте их на 5–10 минут.

3. Используйте batch-запросы

Некоторые API поддерживают массовые запросы (например, прочитать 100 клиентов за один запрос вместо 100 отдельных запросов).

4. Добавьте задержки (throttling)

Если API позволяет 10 запросов в секунду, добавьте задержку 100 мс между запросами.

5. Обрабатывайте ошибки

Если API вернул ошибку «Rate limit exceeded», подождите указанное время и повторите запрос.

Многие API платные. Стоимость зависит от:

количества запросов (например, $0.01 за 1000 запросов)
объёма данных (например, $0.02 за 1 GB переданных данных)
использования ресурсов (например, OpenAI берёт деньги за количество токенов)

Пример: OpenAI API (2026)

GPT-5.2 Pro: $0.015 за 1000 input tokens, $0.045 за 1000 output tokens
GPT-5: $0.01 за 1000 input tokens, $0.03 за 1000 output tokens
GPT-4o mini: $0.00015 за 1000 input tokens, $0.0006 за 1000 output tokens (в 100 раз дешевле GPT-5!)

Альтернативы (китайские модели, 2026):

Что такое токен? Примерно 4 символа. Фраза «Привет, как дела?» — это ~5 токенов.

Пример расчёта:

Пользователь пишет 100 символов (~25 токенов input)
Агент отвечает 400 символов (~100 токенов output)
Стоимость (GPT-5): (25 / 1000) × $0.01 + (100 / 1000) × $0.03 = $0.0025 + $0.003 = $0.0055 (~$0.006 за диалог)
Стоимость (DeepSeek-R1): (25 / 1000) × $0.003 + (100 / 1000) × $0.003 = $0.000075 + $0.0003 = ~$0.0004 за диалог (в 15 раз дешевле!)
Если 1000 диалогов в месяц → GPT-5: ~$6/месяц, DeepSeek: ~$0.40/месяц

1. Установите лимиты в настройках сервиса

Многие сервисы позволяют установить лимит расходов (например, «не больше $50 в месяц»).

2. Мониторьте использование

Проверяйте статистику использования API раз в неделю.

3. Используйте более дешёвые модели

Если GPT-5 дорого → используйте GPT-4o mini (в 100 раз дешевле) или китайские модели DeepSeek/GLM (в 3-5 раз дешевле).

4. Оптимизируйте промпты

Чем короче промпт → тем меньше токенов → тем дешевле.