Embeddings
Embeddings превращают текст в числовой вектор. На таких векторах строят семантический поиск, кластеризацию, классификацию, RAG. GETAPI поддерживает text-embedding-3-small и text-embedding-3-large.
Простой запрос
curl https://api.getapi.ru/openai/v1/embeddings \
-H "Authorization: Bearer $GETAPI_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "text-embedding-3-small",
"input": ["GETAPI — единый API ко всем AI-моделям"]
}'Батч
В input можно передать массив строк — за один запрос обработаются все, это в десятки раз дешевле и быстрее, чем по одной.
Параметр dimensions
У моделей семейства text-embedding-3 можно сократить размер вектора без
повторной обработки текста — передайте dimensions=512 или 1024.
Хранение в БД станет дешевле, при этом качество поиска просядет несильно.
RAG-сценарий
- Разбейте документ на чанки по 500–1000 токенов.
- Получите embeddings для всех чанков и сохраните в векторную БД (Qdrant, pgvector, Weaviate).
- На запрос пользователя считайте embedding и достаньте топ-K похожих чанков.
- Сложите чанки в системный промпт и попросите LLM ответить.
Советы
- Нормируйте векторы (L2) и используйте cosine similarity — обычно это даёт лучшие результаты.
- Считайте embeddings в фоновом батч-задании, не на каждый запрос пользователя.
- Для русского текста
text-embedding-3-largeзаметно точнееsmall, разница в цене несущественна для большинства проектов.