智谱·AI 开源模型列表

用户8537

2024年1月26日修改

智谱·AI 开源模型列表

画板

自 2019 年成立以来，智谱 AI 致力于大模型技术的研究和推广工作。在 2023 年，我们推出并开源了多款模型（如上图所示），它们具有不同的能力，开发者可以对这些模型进行使用和定制。​

本文档将列出相关模型及链接，方便开发者查阅。

common.docs_name - LarkCCM_Docs_Menu_Image

请注意：

Token数代表了模型支持的总Token数量，包括了 输入 + 输出的所有token。​

同时，Token数不代表用户输入字符的数量。在我们的模型中，一个token约等于1.8个汉字。​

Chat模型

下表为智谱 AI 开源的语言模型列表

模型	介绍	上下文token数	代码链接	模型权重下载链接
ChatGLM3-6B	第三代 ChatGLM 对话模型。ChatGLM3-6B 采用了全新设计的 Prompt 格式，除正常的多轮对话外。同时原生支持工具调用（Function Call）、代码执行（Code Interpreter）和 Agent 任务等复杂场景。	8K	ChatGLM3	Huggingface \| 魔搭社区 \| 始智社区 \| Swanhub \| 启智社区
ChatGLM3-6B-base	第三代ChatGLM基座模型。ChatGLM3-6B-Base 采用了更多样的训练数据、更充分的训练步数和更合理的训练策略。在语义、数学、推理、代码、知识等不同角度的数据集上测评显示，ChatGLM3-6B-Base 具有在 10B 以下的基础模型中最强的性能。	8K			Huggingface \| 魔搭社区 \| 始智社区 \| Swanhub \| 启智社区
ChatGLM3-6B-32k	第三代ChatGLM长上下文对话模型。在ChatGLM3-6B的基础上进一步强化了对于长文本的理解能力，能够更好的处理最多32K长度的上下文。	32K			Huggingface \| 魔搭社区 \| 始智社区 \| Swanhub \| 启智社区
ChatGLM2-6B	第二代 ChatGLM 对话模型。相比一代模型，具有更强的性能，且其基座模型的上下文长度从 2k 扩展到 32k，并在对话阶段使用 8K 的上下文长度训练。推理速度相比初代提升42%。	8K	ChatGLM2	Huggingface \| 魔搭社区 \| 始智社区 \| 启智社区
ChatGLM2-6B-int4	ChatGLM2-6B的 int4 量化版本，具备最小 5.1GB 显存即可运行。INT4 量化下，6G 显存支持的对话长度由 1K 提升到了 8K。	8K			Huggingface \| 魔搭社区 \| 始智社区 \| 启智社区
ChatGLM2-6B-32k	第二代 ChatGLM 长上下文对话模型。ChatGLM2-6B-32K在ChatGLM2-6B 的基础上进一步强化了对于长文本的理解能力，能够更好的处理最多32K长度的上下文。具体地，我们基于位置插值（Positional Interpolation）的方法对位置编码进行了更新，并在对话阶段使用 32K 的上下文长度训练。在实际的使用中，如果您面临的上下文长度基本在 8K 以内，我们推荐使用ChatGLM2-6B；如果您需要处理超过 8K 的上下文长度，我们推荐使用ChatGLM2-6B-32K。	32K			Huggingface \| 魔搭社区 \| 始智社区 \| 启智社区
ChatGLM2-6B-32k-int4	ChatGLM2-6B-32K的int4版本	32K			Huggingface \| 魔搭社区 \| 始智社区 \| 启智社区
ChatGLM-6B	第一代 ChatGLM 对话模型。支持中英双语的对话语言模型，基于 General Language Model (GLM) 架构，具有 62 亿参数。结合模型量化技术，用户可以在消费级的显卡上进行本地部署。	2K	ChatGLM	Huggingface \| 魔搭社区 \| 始智社区 \| 启智社区
ChatGLM-6B-int4	ChatGLM-6B的Int4版本。最低只需 6GB 显存即可部署，最低只需 7GB 显存即可启动微调（P-Tuning v2）	2K	ChatGLM		Huggingface \| 魔搭社区 \| 始智社区 \| 启智社区
ChatGLM-6B-int8	ChatGLM-6B的Int8版本	2K		Huggingface \| 魔搭社区 \| 始智社区 \| 启智社区
AgentLM-7B	1. 我们提出了一种 AgentTuning 的方法； 2. 我们开源了包含 1866 个高质量交互、6 个多样化的真实场景任务的 Agent 数据集 AgentInstruct 3. 基于上述方法和数据集，我们利用 Llama2 微调了具备超强 Agent 能力的 AgentLM-7B、AgentLM-13B、AgentLM-70B。	4K	AgentTuning	🤗Huggingface Repo
AgentLM-13B				4K		🤗Huggingface Repo
AgentLM-70B				8K		🤗Huggingface Repo

多模态模型

智谱AI致力于推动多模态模型的发展，因此，我们推出了具有视觉和语言双模态的模型。​

模型	介绍	代码链接	模型下载
CogAgent-18B	基于 CogVLM-17B 改进的开源视觉语言模型。CogAgent-18B 拥有110亿视觉参数和70亿语言参数，支持 1120*1120 分辨率的图像理解，在CogVLM功能的基础上，具备GUI图像的Agent能力。	CogVLM & CogAgent	Huggingface \| 魔搭社区 \| Swanhub \| 始智社区
CogVLM-17B	强大的开源视觉语言模型（VLM）。基于对视觉和语言信息之间融合的理解，CogVLM 可以在不牺牲任何 NLP 任务性能的情况下，实现视觉语言特征的深度融合。我们训练的 CogVLM-17B是目前多模态权威学术榜单上综合成绩第一的模型，在14个数据集上取得了state-of-the-art或者第二名的成绩。	CogVLM & CogAgent		Huggingface \| 魔搭社区
Visualglm-6B	VisualGLM-6B 是一个开源的，支持图像、中文和英文的多模态对话语言模型，语言模型基于 ChatGLM-6B，具有 62 亿参数；图像部分通过训练 BLIP2-Qformer 构建起视觉模型与语言模型的桥梁，整体模型共78亿参数。	VisuaGLM	Huggingface \| 魔搭社区
RDM	Relay Diffusion Model：级联扩散模型，可以从任意给定分辨率的图像快速生成，而无需从白噪声生成。	RDM

智谱·AI 开源模型列表​

智谱·AI 开源模型列表