国产开源GLM-Image实测:文字渲染登顶SOTA,画面质感仍是最大瓶颈丨302.AI 基准实验室
输入“/”快速插入内容
国产开源GLM-Image实测:文字渲染登顶SOTA,画面质感仍是最大瓶颈丨302.AI 基准实验室
用户4242
用户4242
1月22日修改
🔗 原文链接:
https://302.ai/blog/302-ai-benchmar...
•
I. 实测模型基础信息
•
Ⅱ. 测评案例
◦
案例 1:文生图-人物拟真测试
◦
案例 2:文生图-信息卡片
◦
案例 3:文生图-产品海报
◦
案例 4:文生图-影视作品年表
◦
案例 5:文生图-小红书笔记封面
•
III. GLM-Image 图像模型实测结论
◦
实测结果汇总:
◦
Ⅳ. 如何在 302.AI 上使用
▪
使用模型 API
导读:首个在国产芯片上完成全流程训练的 SOTA 模型
GLM-Image
,带着“文字渲染开源第一”的光环来了。我们将其与
Qwen-Image-Max
、
Nano Banana Pro
在多场景下横向实测,发现它确是一款长处与短板都极为鲜明的“特长生”:在需要精准图文排版的商用场景中表现出色,但在画面质感、艺术表现等更广泛的创作需求上,与顶尖模型仍有一定差距。
1月14日,智谱 AI 与华为联合开源新一代图像生成模型
GLM-Image
。值得注意的是,该模型是首个完全基于国产芯片(昇腾 Atlas 800T A2)与 AI 框架(昇思 MindSpore)完成全流程训练的 SOTA 多模态模型,标志着国产全栈算力已具备支撑前沿模型训练的能力。
GLM-Image 最突出的亮点在于其
精准的文字渲染能力
,直接针对 AI 生图中常见的“文字乱码”痛点。在 CVTG-2K 与 LongText-Bench 等权威
文本生成榜单
中,它均位列
开源模型第一
,尤其在汉字生成准确度上超越了包括谷歌 Nano Banana 在内的多款知名模型。这使其在海报、PPT、社交媒体封面等需精准图文结合的商用场景中更具可用性。同时,其 API 调用成本也极具竞争力,性价比突出。