科大讯飞刚刚发布了星火多模态大模型 X2-VL,号称是当前唯一基于全国产算力训练的主流大模型。在高考数学全国 I 卷上拿了 148 分,接近满分。这条消息对你有啥用?咱们一起看看。
星火 X2-VL 是什么?
星火 X2-VL 是科大讯飞最新发布的多模态大模型,支持图文理解。它采用专属 MoE(混合专家)架构,基于无锡本地算力平台——太湖星跃平台加速训练。最特别的是,它是当前唯一基于全国产算力训练的主流大模型,意味着从芯片到软件栈完全国产化,不依赖英伟达等国外硬件。
在测试中,面对高中各科图文结合的试题,答题准确率接近 95%。更亮眼的是,在媒体组织的测试中,由两位国家特级数学老师阅卷,挑战 2026 年高考数学全国 I 卷拿下 148 分(满分 150),超过了其他多个主流模型(如模型 A 144 分、模型 B 143 分等)。
对比其他模型,星火 X2-VL 表现如何?
根据公布的数据,星火 X2-VL 在高考数学上的得分如下:
| 模型 | 单选题 | 多选题 | 填空题 | 解答题 | 总分 |
|---|---|---|---|---|---|
| 星火 X2-VL | 40 | 18 | 15 | 75 | 148 |
| 模型 A | 40 | 18 | 15 | 71 | 144 |
| 模型 B | 40 | 18 | 15 | 70 | 143 |
| 模型 C | 40 | 18 | 10 | 69 | 137 |
| 模型 D | 40 | 18 | 15 | 72 | 145 |
| 模型 E | 40 | 18 | 15 | 69 | 142 |
可以看到,星火 X2-VL 在解答题上表现突出,比第二名高出 3 分。不过要注意,这只是高考数学单科测试,并不能代表综合能力。其他模型在语言理解、代码生成等方面可能更强。
对国内用户有啥意义?
星火 X2-VL 的意义在于:
- 国产算力突破:证明国内也能训练出高水平的大模型,不再完全依赖海外芯片。
- 教育场景潜力:接近满分的数学能力,未来可能用于 AI 辅导、自动批改等。
- 多模态能力:图文结合理解,适合文档分析、图表解读等场景。
但如果你需要更通用的 AI 助手,比如写代码、翻译、创意写作等,海外模型如 ChatGPT、Claude 仍然有优势。比如 ChatGPT 新手入门 和 Claude 对比 ChatGPT 可以帮助你选择。
国产 AI 和海外 AI 怎么选?
星火 X2-VL 很强,但海外 AI 在某些领域依然领先。比如:
- 代码生成:Cursor、Claude 在编程上更专业,参考 哪个 AI 写代码最好。
- 长文档分析:Claude 支持超长上下文,见 Claude 长文档分析。
- 翻译:ChatGPT 和 Claude 翻译质量高,见 哪个 AI 翻译最好。
如果你预算有限,可以搭配使用:国产 AI 免费处理简单任务,海外 AI 处理复杂工作。关于省钱方案,参考 AI 会员怎么充最省钱。
避坑注意
虽然星火 X2-VL 很厉害,但有几个点要注意:
- 测试数据有限:高考数学高分不代表所有任务都强,多模态能力还需更多实测。
- 全国产算力:虽然自主可控,但生态和工具链可能不如国外成熟。
- 海外 AI 支付:如果你决定用 ChatGPT、Claude 等,国内用户常遇到支付失败。这时可以考虑靠谱的代充服务,但要注意安全,参考 第三方代充安全吗。
国内怎么开通海外 AI 会员?
星火 X2-VL 目前是免费的吗?具体价格以官方为准。但如果你想用 ChatGPT、Claude 等海外 AI,国内用户常因没有海外信用卡而无法支付。这时可以通过支持支付宝/微信的代充平台开通,比如 GPT68.com 提供的代充服务,免海外卡,人民币计价,价格随汇率浮动。
具体操作:
- ChatGPT Plus:参考 ChatGPT Plus 充值教程。
- Claude Pro:参考 Claude Pro 充值教程。
- Gemini:参考 Gemini 充值教程。
另外,如果你不确定选哪个,可以看 2026 主流 AI 工具怎么选 和 AI 会员价格汇总。
信息来源:www.ithome.com。本文为基于公开资讯的原创整理与解读,非原文转载。