编码能力评测：Qwen3-235B-A22B

用户4242

用户1282

2025年5月12日修改

🔗 原文链接：编码能力评测：Qwen3-235B-A22B

评测时间：2025-4-30

评测人：EverAI

1.
概要​

Qwen3是阿里巴巴推出的混合推理大模型，支持两种模式：思考模式（逐步推理复杂问题）和非思考模式（快速响应简单任务），兼顾深度与效率。其采用MoE架构，在降低计算成本的同时实现高性能，激活参数量仅为同类模型的10%。多语言能力突出，覆盖119种语言和方言（包括粤语、东南亚及中东语言），满足国际化需求。模型已开源，支持灵活部署与按量付费，适配代码生成、数学运算及工业场景优化。综合表现超越部分竞品，成为开源领域标杆。​

Qwen3 现已上线，用户可通过以下地址进行体验： 👉 Qwen3 官方网址

common.docs_name - LarkCCM_Docs_Menu_Image

2.
编码能力评测​

为了全面评估 Qwen3 在编程任务中的表现，我们针对不同复杂度的任务进行了测试，涵盖 简单功能实现、复杂应用开发、2D & 3D 游戏设计、代码优化与解释等方面。​

2.1
网页应用的编码需求​

2.1.1
网页版计算器​

1.
【测评样例】​

✍️

创建一个简单的计算器网页应用程序。

2.
【输出】​

运行效果：视频的前半部分呈现的是运行效果，后半部分则是编码输出的过程。​

3.
【总结】​

💡

•
根据用户输入，正确推理出计算器的各项基本功能​

•
设计出计算器的用户界面，呈现出简单且美观的视觉效果，界面具有良好的交互反馈​

•
代码能够运行正常无bug​

2.1.2
创建烟花动画效果​

1.
【测评样例】​

✍️

帮我创建一个烟花动画，模拟烟花爆炸效果，并支持鼠标点击触发烟花的发射过程。​

2.
【输出】​

运行效果：视频的前半部分呈现的是运行效果，后半部分则是编码输出的过程。​

编码能力评测：Qwen3-235B-A22B​

编码能力评测：Qwen3-235B-A22B