国产开源GLM-Image实测：文字渲染登顶SOTA，画面质感仍是最大瓶颈丨302.AI 基准实验室

用户4242

1月22日修改

🔗 原文链接： https://302.ai/blog/302-ai-benchmar...

•
I. 实测模型基础信息​

•
Ⅱ. 测评案例​
◦
案例 1：文生图-人物拟真测试​
◦
案例 2：文生图-信息卡片​
◦
案例 3：文生图-产品海报​
◦
案例 4：文生图-影视作品年表​
◦
案例 5：文生图-小红书笔记封面​

•
III. GLM-Image 图像模型实测结论​
◦
实测结果汇总：​
◦
Ⅳ. 如何在 302.AI 上使用​
▪
使用模型 API​
​

导读：首个在国产芯片上完成全流程训练的 SOTA 模型 GLM-Image ，带着“文字渲染开源第一”的光环来了。我们将其与 Qwen-Image-Max 、 Nano Banana Pro 在多场景下横向实测，发现它确是一款长处与短板都极为鲜明的“特长生”：在需要精准图文排版的商用场景中表现出色，但在画面质感、艺术表现等更广泛的创作需求上，与顶尖模型仍有一定差距。

1月14日，智谱 AI 与华为联合开源新一代图像生成模型 GLM-Image 。值得注意的是，该模型是首个完全基于国产芯片（昇腾 Atlas 800T A2）与 AI 框架（昇思 MindSpore）完成全流程训练的 SOTA 多模态模型，标志着国产全栈算力已具备支撑前沿模型训练的能力。

common.docs_name - LarkCCM_Docs_Menu_Image

GLM-Image 最突出的亮点在于其 精准的文字渲染能力 ，直接针对 AI 生图中常见的“文字乱码”痛点。在 CVTG-2K 与 LongText-Bench 等权威 文本生成榜单 中，它均位列 开源模型第一 ，尤其在汉字生成准确度上超越了包括谷歌 Nano Banana 在内的多款知名模型。这使其在海报、PPT、社交媒体封面等需精准图文结合的商用场景中更具可用性。同时，其 API 调用成本也极具竞争力，性价比突出。 ​

国产开源GLM-Image实测：文字渲染登顶SOTA，画面质感仍是最大瓶颈丨302.AI 基准实验室​

国产开源GLM-Image实测：文字渲染登顶SOTA，画面质感仍是最大瓶颈丨302.AI 基准实验室