分享
02-银海:基础通识课
输入“/”快速插入内容
02-
银海:
基础通识课
用户8537
用户8537
用户5962
用户5962
用户4392
用户4392
用户9236
用户9236
2025年4月12日修改
会议信息
会议主题:10-09 | 校园AIPO系列共学
会议时间:10月9号(周三) 19:36 - 22:37 (GMT+08)
参会人:
参会人信息统计
课程课件:
智能纪要
智能纪要依据会中总结与录制内容生成,不代表平台立场,请谨慎甄别后使用
📄
总结
会议讨论了 AI 模型、发展历程、原理应用、相关工具及编程准备等多方面内容。主要内容包括:
•
AI模型及相关进展
:讨论了AI模型的基础、最新进展,包括视频生成模型、相关论文,以及AI在诺奖和蛋白质研究领域的应用等。
•
人工智能的发展历程与大语言模型
◦
人工智能发展历程
:从图灵测试、早期的图灵机器人和ELISA,到IBM的语音控制打印机、完全由人工智能创作的小说、微软的同声传译系统,再到OpenAI发布ChatGPT模型,经历了萌芽、积累沉淀到如今大模型和多模态模型百花齐放的阶段。
◦
大模型的基石
:大模型由数据、算法、算力构成,算法有技术架构的迭代,如英伟达的显卡辅助模型训练,而数据的质量对生成理想的大模型至关重要。
◦
弱智8相关活动
:针对弱智8的问题对大模型进行测试,还开展了让大模型回复问题并找出真人回复的活动,且国内大模型的回答能力有很大改进。
◦
大语言模型的特点
:早期大语言模型回复缺乏情感,如今有所改进,后续将体验几个大模型的回复场景。
•
大语言模型的介绍与原理
◦
国内大模型的分类
:国内大模型有通用模型如文心一言、讯飞星火等,处理自然语言;还有垂直模型,专注特定领域如小语种交流、临床医学、AI蛋白质结构预测等。
◦
大模型的体验
:以‘为什么我爸妈结婚的时候没有邀请我参加婚礼’和‘今天我坐在凳子上’为例,体验了Kimi、通义千问、豆包等大模型的回答和续写能力,发现回复有差异,且大模型基于统计模型预测生成内容。
◦
大语言模型的工作原理
:大语言模型工作原理包括训练数据、算力、模型参数,在训练数据一致情况下,模型参数越大能力越强,参数用b链形容大小。
◦
Transformer架构
:Transformer是大语言模型训练架构,17年出现用于翻译,具备自我注意力机制能理解上下文和文本关联,其工作原理是单词预测,通过嵌入、位置编码、自注意力机制生成内容,模型调教中有控制输出的temperature。
•
关于大语言模型的原理、应用及相关概念
◦
Transformer模型原理
:通过不断检索和匹配来寻找依赖关系,处理词和词之间的位置组合,预测下一个词的概率,是一个偏向概率预测的统计模型。
◦
大模型幻觉
:大模型通过训练数据猜测下一个输出结果,可能因错误数据导致给出错误答案,优质数据集对其很重要。
◦
Prompt的分类和法则
:分为system prompt、user prompt和assistant prompt,写好prompt的法则包括清晰说明、指定角色、使用分隔符、提供样本等,核心是与模型好好沟通。
◦
Fine tuning微调
:基于通用大模型,针对特定领域任务提供数据进行学习和调整,以适应特定领域的需求。
◦
RAG概念
:未对RAG的具体内容进行详细阐述,仅提出了这个概念。
•
大语言模型及多模态大模型的应用与原理
◦
RAG的原理和应用
:RAG通过引用外部数据源为模型做数据补充,适用于动态知识更新需求高的任务,其原理是在基础大模型基础上引用外部数据,对搜索到的数据信息进行切片、拆分和语义理解,再根据用户提问进行检索和回答,但比基座模型更耗时。
◦
RAG可在本地运行
:RAG是一个检索生成框架,能够支持在本地运行。
◦
AI搜索的能力
:AI搜索结合了多种能力,如fine tuning、实时联网查询和查询知识源等,能够为用户整理出想要的内容,一些AI搜索平台专注于特定领域,如为程序员提供代码搜索。
◦
多模态大模型的特点
:多模态大模型像能唱会跳、精通多种技能的机器人,能看见、听见、思考、说话,例如能识别物体、听取指令等。
◦
生成式模型和决策式模型的区别
:决策式模型偏向逻辑判断,按预设程序固定输出;生成式模型偏随机性,能动态组合并结构化呈现,如在图像识别中,决策式模型返回关键词,生成式模型用语言表达结构化信息。
•
多模态大模型及相关应用
◦
多模态大模型的架构和原理
:基于大圆模型,能识别页面组件结构和位置绝对值信息,并与组件、文本映射。由解码器、backbone、Generator等部件组成,左侧多模态理解,右侧生成输出。
◦
stable diffusion模型原理
:是生成模型,通过加噪和去噪实现图像的正向扩散和反向还原,解决潜在空间模型中的速度问题。
◦
stable diffusion的应用场景
:包括带货商品图生成、模特服装展示、海报生成、装修设计等。
◦
吉梦AI和吐司平台的使用体验
:吉梦AI提供AI视频生成等能力,通过简单提示词生成图像,对数字体有专项场景训练;吐司是类似的在线生成平台。