GETAPIdocs
Войти
Создать аккаунт
GETAPI/Документация/Запрос по изображению, аудио и видео

Запрос по изображению, аудио и видео

Gemini — самая мультимодальная модель: одним запросом можно отправить текст, картинки, аудио и видео. Через GETAPI это работает либо через inline-данные (base64), либо через Files API.

Inline base64

curl "https://api.getapi.ru/google/v1beta/models/gemini-2.5-flash:generateContent?key=$GETAPI_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "contents": [{
      "parts": [
        {"text": "Что на фото?"},
        {"inline_data": {"mime_type": "image/jpeg", "data": "<base64-encoded-image>"}}
      ]
    }]
  }'

Files API

i

Поддержка files.upload через GETAPI уточняется. Если этот режим критичен для интеграции, напишите в поддержку до начала работ.

Для крупных файлов и видео сначала загрузите их через files.upload, потом передавайте по ссылке file_data.file_uri:

curl "https://api.getapi.ru/google/v1beta/models/gemini-2.5-pro:generateContent?key=$GETAPI_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "contents": [{
      "parts": [
        {"text": "Сделай тайм-коды основных тем"},
        {"file_data": {"file_uri": "<uploaded-file-uri>"}}
      ]
    }]
  }'

Лимиты

  • До 3 600 секунд видео в одном запросе у Pro-моделей.
  • До 9.5 минут аудио без потери точности.
  • Изображения масштабируются автоматически.
i

Полностью видео — самая «токеноёмкая» модальность. Перед обработкой длинного ролика оцените стоимость в калькуляторе или сделайте короткий пробный запрос.

Назад
Генерация текста Gemini
Далее
OpenRouter