GETAPI/Документация/Embeddings

Embeddings

Embeddings превращают текст в числовой вектор. На таких векторах строят семантический поиск, кластеризацию, классификацию, RAG. GETAPI поддерживает text-embedding-3-small и text-embedding-3-large.

Простой запрос

curl https://api.getapi.ru/openai/v1/embeddings \
  -H "Authorization: Bearer $GETAPI_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "text-embedding-3-small",
    "input": ["GETAPI — единый API ко всем AI-моделям"]
  }'

Батч

В input можно передать массив строк — за один запрос обработаются все, это в десятки раз дешевле и быстрее, чем по одной.

Параметр dimensions

У моделей семейства text-embedding-3 можно сократить размер вектора без повторной обработки текста — передайте dimensions=512 или 1024. Хранение в БД станет дешевле, при этом качество поиска просядет несильно.

RAG-сценарий

Разбейте документ на чанки по 500–1000 токенов.
Получите embeddings для всех чанков и сохраните в векторную БД (Qdrant, pgvector, Weaviate).
На запрос пользователя считайте embedding и достаньте топ-K похожих чанков.
Сложите чанки в системный промпт и попросите LLM ответить.

Советы

Нормируйте векторы (L2) и используйте cosine similarity — обычно это даёт лучшие результаты.
Считайте embeddings в фоновом батч-задании, не на каждый запрос пользователя.
Для русского текста text-embedding-3-large заметно точнее small, разница в цене несущественна для большинства проектов.

← Управление компьютером

Модели Anthropic Claude →