GETAPIdocs
Войти
Создать аккаунт
GETAPI/Документация/Лимиты

Лимиты

GETAPI старается не вводить дополнительных ограничений сверх тех, что есть у самих провайдеров. Если у вас высокая нагрузка — мы сразу настроим персональный лимит, чтобы вы не упирались в потолок.

Базовые лимиты по умолчанию

ПараметрЗначение
Запросов в минуту (RPM)500 на ключ
Параллельных запросов50 на ключ
Размер тела запроса20 МБ
Тайм-аут одного запроса10 минут
Размер одного изображения20 МБ

Лимиты провайдеров

Поверх лимитов GETAPI действуют лимиты самих провайдеров: контекстное окно модели, максимальный размер ответа (max_tokens), частота TPM (tokens per minute) и т. п. Они зависят от выбранной модели — детали смотрите в карточке модели в разделе «Модели и цены» и в документации провайдера.

Что значит 429

Если вы упёрлись в лимит, сервис вернёт 429 Too Many Requests. В заголовках ответа будут подсказки:

http
HTTP/1.1 429 Too Many Requests
Retry-After: 12
X-RateLimit-Limit-Requests: 500
X-RateLimit-Remaining-Requests: 0
X-RateLimit-Reset-Requests: 12s
  • Retry-After — через сколько секунд можно повторить запрос.
  • X-RateLimit-Remaining-Requests — сколько ещё запросов доступно в текущем окне.

Стратегия ретраев

Большинство официальных SDK уже умеют ретраить с экспоненциальной задержкой. Если пишете свой клиент — придерживайтесь следующего:

  • Сначала смотрите на Retry-After; если его нет — ждите 1, 2, 4, 8 секунд.
  • Делайте максимум 3–5 повторов, чтобы не зацикливаться.
  • Не ретрайте 4xx, кроме 408, 409, 425, 429.

Как увеличить лимит

Напишите в поддержку через личный кабинет или на support@getapi.ru. Расскажите про сценарий — модель, средний RPS, пик. Базовые лимиты повышаются в течение рабочего дня, специальные требования (выделенный пул) — индивидуально.

Назад
Стоимость запроса
Далее
Логирование