GETAPIdocs
Войти
Создать аккаунт
GETAPI/Документация/Embeddings

Embeddings

Embeddings превращают текст в числовой вектор. На таких векторах строят семантический поиск, кластеризацию, классификацию, RAG. GETAPI поддерживает text-embedding-3-small и text-embedding-3-large.

Простой запрос

curl https://api.getapi.ru/openai/v1/embeddings \
  -H "Authorization: Bearer $GETAPI_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "text-embedding-3-small",
    "input": ["GETAPI — единый API ко всем AI-моделям"]
  }'

Батч

В input можно передать массив строк — за один запрос обработаются все, это в десятки раз дешевле и быстрее, чем по одной.

Параметр dimensions

У моделей семейства text-embedding-3 можно сократить размер вектора без повторной обработки текста — передайте dimensions=512 или 1024. Хранение в БД станет дешевле, при этом качество поиска просядет несильно.

RAG-сценарий

  1. Разбейте документ на чанки по 500–1000 токенов.
  2. Получите embeddings для всех чанков и сохраните в векторную БД (Qdrant, pgvector, Weaviate).
  3. На запрос пользователя считайте embedding и достаньте топ-K похожих чанков.
  4. Сложите чанки в системный промпт и попросите LLM ответить.

Советы

  • Нормируйте векторы (L2) и используйте cosine similarity — обычно это даёт лучшие результаты.
  • Считайте embeddings в фоновом батч-задании, не на каждый запрос пользователя.
  • Для русского текста text-embedding-3-large заметно точнее small, разница в цене несущественна для большинства проектов.
Назад
Управление компьютером
Далее
Модели Anthropic Claude