分享
目录:微软与Claude教程等
输入“/”快速插入内容
目录:微软与Claude教程等
简介
OpenAI
中的 GPT-3、
GPT-3.5
和
GPT-4
模型基于提示。 使用基于提示的模型时,用户通过输入文本提示与模型交互,该文本提示通过文本补全进行响应。 补全是模型的输入文本的延续。
虽然这些模型非常强大,但它们的行为对提示也非常敏感。 这使得提示构造成为开发的重要技能。
提示构造可能很困难。 在实践中,
提示的作用是配置模型权重以完成所需的任务
,但它更像艺术而不是科学,通常需要经验和直觉来制作成功的提示。 本文的目的是帮助你开始学习此学习过程。 它会尝试探讨适用于所有
GPT
模型的一般概念和模式。 但是,请务必了解,每个模型的行为方式不同,因此这些学习成果可能不适用于所有模型。
基本信息
本部分介绍
GPT
提示的基本概念和元素。
文本提示是用户与
GPT
模型交互的方式。 与所有生成语言模型一样,GPT 模型会尝试生成最有可能紧跟上一个文本的下一系列字词。 就好像我们在说“
当我说
<prompt>
时,你想到的第一件事是什么?”
. 以下示例演示了此行为。 给定注明内容的第一个单词,模型能够准确地延续文本。
在开发更复杂的提示时,记住这一基本行为会很有帮助。 无论提供的提示是什么,
模型都只是使用它确定的最有可能的情况(基于
训练数据
和训练目标)做出响应。
如果在提示中提出问题,则模型不会遵循单独的“Q&A”代码路径,而是看起来在回答问题,因为回答即是输入的给定问题最有可能的响应。
提示组件
当使用补全
API
而提示的不同部分之间没有区别时,它对于学习和讨论以识别基础提示组件仍然很有用。 使用
聊天补全 API
时,提示的不同部分以具有关联角色(系统、用户和助手)的字典数组的形式发送到 API。 本指南将更宽泛地侧重于如何考虑提示构造,而不是提供特定于某个 API 的规范性指导。
同样重要的是要了解,虽然可能存在其他有效的方法来剖析提示,但这种分解的目标是提供一种相对简单的方法来理解提示构造。 使用补全
API
时,所有组件都是可选的,但必须至少有一个组件存在,而大多数提示包含多个组件。 组件之间也可能存在一些灰色区域。 下面显示的顺序大致对应于每个组件的使用方式(从最多到最少)。
Instructions(指示)
指令可能是最常用的提示组件。 指令很简单:向模型说明要执行的操作。 虽然概念简单,但它在实践中可能比较复杂。 下表以两种不同形式显示简单和复杂的指令,借此来说明这一点。
主要内容
主要内容是指模型正在处理或转换的某种文本。 主要内容通常与指令一起使用。 一个简单的示例是语言翻译。 在下面的示例中,英语文本被视为主要内容,而“翻译为法语:”是指令。
主要内容也可以更长。 在以下示例中,主要内容是
维基百科「时间复杂度」条目
的简介部分,长度近 300 字。 为了便于显示,此内容已在表中缩写。
GPT
模型还可以处理结构化的主要内容。 在下面的示例中,有关比利时啤酒的 TSV(本文中为显示为缩写)作为提示的一部分传递给模型。 它能够正确解释内容并回答有关数据的问题。