谷歌开源可商用的大语言模型Gemma

飞书用户8537

2024年2月22日修改

common.docs_name - LarkCCM_Docs_Menu_Image

27%

作者小小将

华中科技大学工学硕士

73%

刚刚，谷歌破天荒地开源了LLM大模型Gemma：Gemma是一系列轻量级的最先进开源模型，它们是基于创建Gemini模型的相同研究和技术构建的。由Google DeepMind和Google的其他团队开发，Gemma的灵感来自于Gemini，其名称反映了拉丁语中“宝石”的意思。除了模型权重，谷歌还发布了一些工具来支持开发者的创新，促进合作，并指导Gemma模型的负责任使用。​

这次开源的Gemma重点如下：

•
共两个尺寸的模型权重：Gemma 2B和Gemma 7B。每种尺寸都提供了预训练和指令调优的版本。​

模型地址：Models - Hugging Face，Gemma

•

开源一个负责任的生成式AI工具包提供了指导和必要工具，用于使用Gemma创建更安全的AI应用程序。

•

提供了用于推理和监督式微调（SFT）的工具链：通过原生Keras 3.0支持JAX、PyTorch和TensorFlow。

•

随时可用的Colab和Kaggle notebook，以及与流行工具如Hugging Face、MaxText、NVIDIA NeMo和TensorRT-LLM的集成，使得开始使用Gemma变得简单。

谷歌开源可商用的大语言模型Gemma​

谷歌开源可商用的大语言模型Gemma