GETAPI/Документация/Лимиты

Лимиты

GETAPI старается не вводить дополнительных ограничений сверх тех, что есть у самих провайдеров. Если у вас высокая нагрузка — мы сразу настроим персональный лимит, чтобы вы не упирались в потолок.

Базовые лимиты по умолчанию

Параметр	Значение
Запросов в минуту (RPM)	500 на ключ
Параллельных запросов	50 на ключ
Размер тела запроса	20 МБ
Тайм-аут одного запроса	10 минут
Размер одного изображения	20 МБ

Лимиты провайдеров

Поверх лимитов GETAPI действуют лимиты самих провайдеров: контекстное окно модели, максимальный размер ответа (max_tokens), частота TPM (tokens per minute) и т. п. Они зависят от выбранной модели — детали смотрите в карточке модели в разделе «Модели и цены» и в документации провайдера.

Что значит 429

Если вы упёрлись в лимит, сервис вернёт 429 Too Many Requests. В заголовках ответа будут подсказки:

http

HTTP/1.1 429 Too Many Requests
Retry-After: 12
X-RateLimit-Limit-Requests: 500
X-RateLimit-Remaining-Requests: 0
X-RateLimit-Reset-Requests: 12s

Retry-After — через сколько секунд можно повторить запрос.
X-RateLimit-Remaining-Requests — сколько ещё запросов доступно в текущем окне.

Стратегия ретраев

Большинство официальных SDK уже умеют ретраить с экспоненциальной задержкой. Если пишете свой клиент — придерживайтесь следующего:

Сначала смотрите на Retry-After; если его нет — ждите 1, 2, 4, 8 секунд.
Делайте максимум 3–5 повторов, чтобы не зацикливаться.
Не ретрайте 4xx, кроме 408, 409, 425, 429.

Как увеличить лимит

Напишите в поддержку через личный кабинет или на support@getapi.ru. Расскажите про сценарий — модель, средний RPS, пик. Базовые лимиты повышаются в течение рабочего дня, специальные требования (выделенный пул) — индивидуально.

← Стоимость запроса

Логирование →