Модуль 09Урок 4

Урок 4. Лимиты API и стоимость запросов

Практика: Coze

Урок 4. Лимиты API и стоимость запросов#

Цель: понять, что у API есть ограничения и как не превысить лимиты.

Что такое лимиты (Rate Limits)#

API не может обрабатывать бесконечное количество запросов. Поэтому сервисы устанавливают лимиты:

  • запросов в секунду (например, 10 запросов/сек)
  • запросов в минуту (например, 100 запросов/мин)
  • запросов в день (например, 10 000 запросов/день)

Если вы превысите лимит, API вернёт ошибку:

{
  "error": "Rate limit exceeded. Try again in 60 seconds."
}

Зачем нужны лимиты#

Лимиты защищают сервис от:

  • перегрузки (если все начнут делать миллион запросов одновременно, сервис упадёт)
  • злоупотребления (например, DDoS-атаки)
  • неэффективного использования (если ваш агент делает 1000 запросов вместо 1, это плохой код)

Как узнать лимиты#

Лимиты всегда указаны в документации API. Ищите раздел:

  • Rate Limits
  • Quotas
  • Usage Limits

Пример: OpenAI API (ChatGPT)

На бесплатном тарифе (2026):

  • 3 запроса в минуту (RPM)
  • 200 запросов в день (RPD)

На платном тарифе (Pay-as-you-go):

  • 3 500 запросов в минуту (RPM) для GPT-5
  • 10 000 запросов в минуту (RPM) для GPT-4o mini

Как не превысить лимиты#

1. Делайте запросы только когда нужно

Не делайте запрос на каждое сообщение пользователя, если можно обработать локально.

2. Используйте кеширование

Если данные не меняются часто (например, список товаров), кешируйте их на 5–10 минут.

3. Используйте batch-запросы

Некоторые API поддерживают массовые запросы (например, прочитать 100 клиентов за один запрос вместо 100 отдельных запросов).

4. Добавьте задержки (throttling)

Если API позволяет 10 запросов в секунду, добавьте задержку 100 мс между запросами.

5. Обрабатывайте ошибки

Если API вернул ошибку «Rate limit exceeded», подождите указанное время и повторите запрос.

Стоимость запросов#

Многие API платные. Стоимость зависит от:

  • количества запросов (например, $0.01 за 1000 запросов)
  • объёма данных (например, $0.02 за 1 GB переданных данных)
  • использования ресурсов (например, OpenAI берёт деньги за количество токенов)

Пример: OpenAI API (2026)

  • GPT-5.2 Pro: $0.015 за 1000 input tokens, $0.045 за 1000 output tokens
  • GPT-5: $0.01 за 1000 input tokens, $0.03 за 1000 output tokens
  • GPT-4o mini: $0.00015 за 1000 input tokens, $0.0006 за 1000 output tokens (в 100 раз дешевле GPT-5!)

Альтернативы (китайские модели, 2026):

  • DeepSeek-R1: $0.003 за 1000 input tokens (в 5 раз дешевле GPT-5)
  • GLM-4.5: $0.004 за 1000 input tokens
  • Kimi K2: $0.005 за 1000 input tokens

Что такое токен? Примерно 4 символа. Фраза «Привет, как дела?» — это ~5 токенов.

Пример расчёта:

  • Пользователь пишет 100 символов (~25 токенов input)
  • Агент отвечает 400 символов (~100 токенов output)
  • Стоимость (GPT-5): (25 / 1000) × $0.01 + (100 / 1000) × $0.03 = $0.0025 + $0.003 = $0.0055 (~$0.006 за диалог)
  • Стоимость (DeepSeek-R1): (25 / 1000) × $0.003 + (100 / 1000) × $0.003 = $0.000075 + $0.0003 = ~$0.0004 за диалог (в 15 раз дешевле!)
  • Если 1000 диалогов в месяц → GPT-5: ~$6/месяц, DeepSeek: ~$0.40/месяц

Как контролировать расходы#

1. Установите лимиты в настройках сервиса

Многие сервисы позволяют установить лимит расходов (например, «не больше $50 в месяц»).

2. Мониторьте использование

Проверяйте статистику использования API раз в неделю.

3. Используйте более дешёвые модели

Если GPT-5 дорого → используйте GPT-4o mini (в 100 раз дешевле) или китайские модели DeepSeek/GLM (в 3-5 раз дешевле).

4. Оптимизируйте промпты

Чем короче промпт → тем меньше токенов → тем дешевле.