嵌入（Embeddings）

概述

OpenAI  的文本嵌入衡量文本字符串的相关性。嵌入通常用于：​

•
搜索（结果按与查询字符串的相关性排序）​

•
聚类（其中文本字符串按相似性分组）​

•
推荐（推荐具有相关文本字符串的项目）​

•
异常检测（识别出相关性很小的异常值）​

•
多样性测量（分析相似性分布）​

•
分类（其中文本字符串按其最相似的标签分类）​

嵌入是浮点数的向量（列表）。两个向量之间的距离衡量它们的相关性。小距离表示高相关性，大距离表示低相关性。​

访问我们的定价页面以了解嵌入定价。请求根据发送的输入中的Token数量计费。​

如何获得嵌入

要获得嵌入，请将您的文本字符串连同选择的嵌入模型  ID（例如，text-embedding-ada-002）一起发送到嵌入  API  端点。响应将包含一个嵌入，您可以提取、保存和使用它。​

示例请求：

代码块

curl https://api.openai.com/v1/embeddings \​
  -H "Content-Type: application/json" \​
  -H "Authorization: Bearer $OPENAI_API_KEY" \​
  -d '{​
    "input": "Your text string goes here",​
    "model": "text-embedding-ada-002"​
  }'​

示例响应：

代码块

{​
  "data": [​
    {​
      "embedding": [​
        -0.006929283495992422,​
        -0.005336422007530928,​
        ...​
        -4.547132266452536e-05,​
        -0.024047505110502243​
      ],​
      "index": 0,​
      "object": "embedding"​
    }​
  ],​
  "model": "text-embedding-ada-002",​
  "object": "list",​
  "usage": {​
    "prompt_tokens": 5,​
    "total_tokens": 5​
  }​
}​

在 OpenAI Cookbook 中查看更多 Python 代码示例。

嵌入模型

OpenAI  提供了一个第二代嵌入模型（在模型  ID  中用  -002  表示）和  16  个第一代模型（在模型  ID  中用  -001  表示）。​

嵌入（Embeddings）​

嵌入（Embeddings）