Лимиты
GETAPI старается не вводить дополнительных ограничений сверх тех, что есть у самих провайдеров. Если у вас высокая нагрузка — мы сразу настроим персональный лимит, чтобы вы не упирались в потолок.
Базовые лимиты по умолчанию
| Параметр | Значение |
|---|---|
| Запросов в минуту (RPM) | 500 на ключ |
| Параллельных запросов | 50 на ключ |
| Размер тела запроса | 20 МБ |
| Тайм-аут одного запроса | 10 минут |
| Размер одного изображения | 20 МБ |
Лимиты провайдеров
Поверх лимитов GETAPI действуют лимиты самих провайдеров: контекстное окно модели,
максимальный размер ответа (max_tokens), частота TPM (tokens per minute) и
т. п. Они зависят от выбранной модели — детали смотрите в карточке модели в разделе
«Модели и цены» и в документации провайдера.
Что значит 429
Если вы упёрлись в лимит, сервис вернёт 429 Too Many Requests. В заголовках
ответа будут подсказки:
HTTP/1.1 429 Too Many Requests Retry-After: 12 X-RateLimit-Limit-Requests: 500 X-RateLimit-Remaining-Requests: 0 X-RateLimit-Reset-Requests: 12s
- Retry-After — через сколько секунд можно повторить запрос.
- X-RateLimit-Remaining-Requests — сколько ещё запросов доступно в текущем окне.
Стратегия ретраев
Большинство официальных SDK уже умеют ретраить с экспоненциальной задержкой. Если пишете свой клиент — придерживайтесь следующего:
- Сначала смотрите на
Retry-After; если его нет — ждите 1, 2, 4, 8 секунд. - Делайте максимум 3–5 повторов, чтобы не зацикливаться.
- Не ретрайте 4xx, кроме 408, 409, 425, 429.
Как увеличить лимит
Напишите в поддержку через личный кабинет или на support@getapi.ru. Расскажите про сценарий — модель, средний RPS, пик. Базовые лимиты повышаются в течение рабочего дня, специальные требования (выделенный пул) — индивидуально.