直播一期：知识库及 GPT 基础介绍

💡

一、知识库及社群介绍

欢迎来到《通往 AGI 之路》的知识空间页面！这里旨在提供一个全面系统、易于理解的 AI 学习路径，帮助您了解 AI 从概念到应用等各方面知识，更重要的是希望引发您思考：「我可以用 AI 做什么，帮助自己更强大」。​

最新知识库精选同步

50%

专注于AI绘画，分享优质设计Prompt

50%

二、知识库目录导览

三、ChatGPT入门

🧠 Chat GPT 的工作原理

四个字概括 Chat GPT 的实质功能：词语接龙

具体来说就是给他任意⻓的上文，他会用自己的模型去生成下一个词​

那他是怎么回答那些⻓内容的呢？

答案是把它自己生成的下一个词，和之前的上文组合成新的上文，再让它生成下一个词，不断重复就可以生成任意⻓的下文。该过程也叫做自回归生成。 ​

上文：我爱

下文：香菜？中国？原神？

每一次的回答就像掷骰子或抽卡，训练模型可以让答案更接近用户想要的答案（当然提示词的撰写也非常重要，后面的直播会说到）​

🌐 大型模型的训练方式

Chat GPT 🙅🏻‍♀️ 搜索引擎

难道说要把所有的提问回答组合都给chat GPT t来做单字接⻰吗？其实不需要​

训练的主要目的不是记忆,而是学习以单字接⻰的方式来训练模型。不仅仅是为了让模型记住某个提问和回答,数据库已经将所有信息都记忆好了,直接搜索就可以得到回答​

非要训练单字接⻰,为的就是让模型学习提问和回答的通用规律。以便在遇到没记忆过的提问时，也能利用所学的规律生成用户想要的回答，这种举一反三的目的也叫做泛化。​

学习材料的作用只是调整模型，以得到通用模型，为的是能处理未被数据库记忆的情况​

因此chat GPT 也被称为生成模型，生成模型与搜索引擎非常不同，搜索引擎无法给出没被数据库记忆的信息，但生成语言模型可以创造不存在的文本。​

❎ Chat GPT 的短板

会一本正经的胡说八道、高度依赖数据、且不受约束

搜索引擎不会混淆记忆，但如果问题交给 Chat GPT ，询问它现实中不存在的内容，它可能会依据训练材料中学习的某些规律进行混合捏造​

当然，这个问题也可以通过一些提示词技巧来减少发生的概率，但不能保证百分百避免​

其次， Chat GPT 高度依赖数据

直播一期：知识库及 GPT 基础介绍​