分享
嵌入(Embeddings)
输入“/”快速插入内容
嵌入(Embeddings)
概述
OpenAI 的文本嵌入衡量文本字符串的相关性。嵌入通常用于:
•
搜索(结果按与查询字符串的相关性排序)
•
聚类(其中文本字符串按相似性分组)
•
推荐(推荐具有相关文本字符串的项目)
•
异常检测(识别出相关性很小的异常值)
•
多样性测量(分析相似性分布)
•
分类(其中文本字符串按其最相似的标签分类)
嵌入是浮点数的向量(列表)。两个向量之间的距离衡量它们的相关性。小距离表示高相关性,大距离表示低相关性。
访问我们的
定价页面
以了解嵌入定价。请求根据发送的输入中的Token数量计费。
如何获得嵌入
要获得嵌入,请将您的文本字符串连同选择的嵌入模型 ID(例如,text-embedding-ada-002)一起发送到嵌入 API 端点。响应将包含一个嵌入,您可以提取、保存和使用它。
示例请求:
代码块
Plain Text
curl
https://api.openai.com/v1/embeddings
\
-H "Content-Type: application/json" \
-H "Authorization: Bearer $OPENAI_API_KEY" \
-d '{
"input": "Your text string goes here",
"model": "text-embedding-ada-002"
}'
示例响应:
代码块
Plain Text
{
"data": [
{
"embedding": [
-0.006929283495992422,
-0.005336422007530928,
...
-4.547132266452536e-05,
-0.024047505110502243
],
"index": 0,
"object": "embedding"
}
],
"model": "text-embedding-ada-002",
"object": "list",
"usage": {
"prompt_tokens": 5,
"total_tokens": 5
}
}
在
OpenAI Cookbook
中查看更多 Python 代码示例。
嵌入模型
OpenAI 提供了一个第二代嵌入模型(在模型 ID 中用 -002 表示)和 16 个第一代模型(在模型 ID 中用 -001 表示)。