Запрос по изображению, аудио и видео
Gemini — самая мультимодальная модель: одним запросом можно отправить текст, картинки, аудио и видео. Через GETAPI это работает либо через inline-данные (base64), либо через Files API.
Inline base64
curl "https://api.getapi.ru/google/v1beta/models/gemini-2.5-flash:generateContent?key=$GETAPI_KEY" \
-H "Content-Type: application/json" \
-d '{
"contents": [{
"parts": [
{"text": "Что на фото?"},
{"inline_data": {"mime_type": "image/jpeg", "data": "<base64-encoded-image>"}}
]
}]
}'Files API
i
Поддержка files.upload через GETAPI уточняется. Если этот режим критичен для интеграции, напишите в поддержку до начала работ.
Для крупных файлов и видео сначала загрузите их через files.upload, потом
передавайте по ссылке file_data.file_uri:
curl "https://api.getapi.ru/google/v1beta/models/gemini-2.5-pro:generateContent?key=$GETAPI_KEY" \
-H "Content-Type: application/json" \
-d '{
"contents": [{
"parts": [
{"text": "Сделай тайм-коды основных тем"},
{"file_data": {"file_uri": "<uploaded-file-uri>"}}
]
}]
}'Лимиты
- До 3 600 секунд видео в одном запросе у Pro-моделей.
- До 9.5 минут аудио без потери точности.
- Изображения масштабируются автоматически.
i
Полностью видео — самая «токеноёмкая» модальность. Перед обработкой длинного ролика оцените стоимость в калькуляторе или сделайте короткий пробный запрос.