分享
4月模型汇总,心心念念的DeepSeek开了,国内头部模型比御三家还差多少?
输入“/”快速插入内容
4月模型汇总,心心念念的DeepSeek开了,国内头部模型比御三家还差多少?
用户4242
用户4242
4月30日修改
🔗 原文链接:
https://mp.weixin.qq.com/s/cI06uhQk...
原创 刘聪NLP 刘聪NLP 刘聪NLP
2026年4月30日 10:20 江苏
大家好,我是刘聪NLP。
又到月底了,我们持续进行国内开源模型总结。
这一个月,
各种Skills纵横
,hermes热度取代openclaw成为Agent新贵,
GPT-Image2炸裂效果,让有图有真相成为笑话
,
而在模型部分,国内持续在卷,
智谱GLM5.1、Kimi K2.6、Qwen3.6、混元HY-3.0-preview,
还有模型期待已久的DeepSeek-V4都开源了。
当然国内还发布了一些模型,但没开源,比如GLM-5V-Turbo、Qwen3.6-Plus等。
而Google开源的Gemma 4系列模型也是值得关注,是现在国外难得的开源好模型了。
从去年7月份开始,这已经是第10个篇了,
模型汇总对我来说更像是一个月的查缺补漏,
信息爆炸的时代,一些有意思的模型,很可能没有被发现。
下面为4月汇总模型,
4月1日,阿里开源QwenPaw-Flash系列小模型,共3个尺寸2B、4B、9B,基于Qwen3.5系列模型微调得来,是一群更适配智能体的小模型。QwenPaw,前身CoPaw。
4月2日,京东发布JoyAI-Image,一个统一的多模态基础模型 ,用于图像理解、文本到图像的生成以及指令引导的图像编辑,并开源JoyAI-Image-Edit 图像编辑模型权重。最近还开源了OpenSpatial-3M 数据集。
4月7日,面壁智能开源VoxCPM2语音合成模型,基于MiniCPM-4构建,2B大小,支持30种语言、语音设计、可控语音克隆和48kHz 录音室品质音频输出。
4月8日,智谱开源GLM5.1模型,总744B参数,激活40B,主打长时间自主工作,现在应该是国内后端最强模型之一。
4月8日,阿里国际开源Marco-MoE 系列模型,模型极度稀疏,Marco-Mini-Instruct总参数17.3B,激活参数0.86B,Marco-Nano-Instruct模型,总参数8B,激活参数0.6B。