分享
谷歌开源可商用的大语言模型Gemma
输入“/”快速插入内容
谷歌开源可商用的大语言模型Gemma
飞书用户8537
2024年2月22日修改
27%
作者
小小将
华中科技大学 工学硕士
73%
刚刚,谷歌破天荒地开源了LLM大模型Gemma:Gemma是一系列轻量级的最先进开源模型,它们是基于创建Gemini模型的相同研究和技术构建的。由Google DeepMind和Google的其他团队开发,Gemma的灵感来自于Gemini,其名称反映了拉丁语中“宝石”的意思。除了模型权重,谷歌还发布了一些工具来支持开发者的创新,促进合作,并指导Gemma模型的负责任使用。
这次开源的Gemma重点如下:
•
共两个尺寸的模型权重:Gemma 2B和Gemma 7B。每种尺寸都提供了预训练和指令调优的版本。
模型地址:
Models - Hugging Face
,
Gemma
•
开源
一个负责任的生成式AI工具包
提供了指导和必要工具,用于使用Gemma创建更安全的AI应用程序。
•
提供了用于
推理和监督式微调(SFT)的工具链
:通过原生Keras 3.0支持JAX、PyTorch和TensorFlow。
•
随时可用的
Colab
和
Kaggle notebook
,以及与流行工具如Hugging Face、MaxText、NVIDIA NeMo和TensorRT-LLM的集成,使得开始使用Gemma变得简单。