分享
直播一期:知识库及 GPT 基础介绍
输入“/”快速插入内容
直播一期:知识库及 GPT 基础介绍
💡
直播回放:
https://www.bilibili.com/video/BV1QN411j719/
一、知识库及社群介绍
欢迎来到《通往 AGI 之路》的知识空间页面!这里旨在提供一个全面系统、易于理解的 AI 学习路径,帮助您了解 AI 从概念到应用等各方面知识,更重要的是希望引发您思考:「
我可以用 AI 做什么,帮助自己更强大
」。
欢迎订阅我们的X(Twitter)
最新知识库精选同步
50%
通往 AI 绘画之路
(小红书)
专注于AI绘画,分享优质设计Prompt
50%
二、知识库目录导览
三、ChatGPT入门
🧠 Chat GPT 的工作原理
四个字概括 Chat GPT 的实质功能:词语接龙
具体来说就是给他任意⻓的上文,他会用自己的模型去生成下一个词
那他是怎么回答那些⻓内容的呢?
答案是把它自己生成的下一个词,和之前的上文组合成新的上文,再让它生成下一个词,不断重复就可以生成任意⻓的下文。该过程也叫做自回归生成。
上文:我爱
下文:香菜?中国?原神?
每一次的回答就像掷骰子或抽卡,训练模型可以让答案更接近用户想要的答案(当然提示词的撰写也非常重要,后面的直播会说到)
🌐 大型模型的训练方式
Chat GPT 🙅🏻♀️ 搜索引擎
难道说要把所有的提问回答组合都给chat GPT t来做单字接⻰吗?其实不需要
训练的主要目的不是记忆,而是学习以单字接⻰的方式来训练模型。不仅仅是为了让模型记住某个提问和回答,数据库已经将所有信息都记忆好了,直接搜索就可以得到回答
非要
训练单字接⻰,为的就是让模型学习提问和回答的通用规律
。以便在遇到没记忆过的提问时,也能利用所学的规律生成用户想要的回答,这种举一反三的目的也叫做泛化。
学习材料的作用只是调整模型,以得到通用模型,为的是能处理未被数据库记忆的情况
因此chat GPT 也被称为生成模型,生成模型与搜索引擎非常不同,
搜索引擎无法给出没被数据库记忆的信息,但生成语言模型可以创造不存在的文本。
❎ Chat GPT 的短板
会一本正经的胡说八道、高度依赖数据、且不受约束
搜索引擎不会混淆记忆,但如果问题交给 Chat GPT ,询问它现实中不存在的内容,它可能会依据训练材料中学习的某些规律进行混合捏造
当然,这个问题也可以通过一些提示词技巧来减少发生的概率,但不能保证百分百避免
其次, Chat GPT 高度依赖数据