你好,我是 Sanjana Reddy,一名 Google 高级解决方案实验室的机器学习工程师。目前围绕生成 AI 和新进展有很多令人兴奋的事情,包括新的 AI 功能,例如 Gen AI、Gen AI API。在这个简短的分享中,我们的目标是让您对一些使所有 Gen AI 的基本概念有一个坚实的基础。
注意力机制
今天,我将讨论所有 transformer 模型背后的注意力机制,它是 LEM 模型的核心。
示例:翻译句子
假设您想将英语句子 "the cat ate the mouse" 翻译成法语。您可以使用编码器-解码器,这是用于翻译句子的流行模型。编码器-解码器一次取一个词,并在每个时间步对其进行翻译。