/ ai资讯

科大讯飞发布星火多模态大模型X2-VL

发布时间:2026-06-15 11:46:16

近日,在无锡举行的2026长三角机器人及自动化展览会暨无锡具身智能机器人产业链伙伴大会上,科大讯飞正式发布 星火多模态大模型X2-VL 。科大讯飞副总裁、江苏大区总经理孙东平在会上明确表示,这是 当前唯一基于全国产算力训练的主流大模型 ,采用专属MoE架构,从训练之初就主打多模态能力,看图片、读文档、分析图表、理解画面内容样样精通。

X2-VL基于讯飞星火MoE(混合专家)架构,采用 原生多模态范式训练 ,具备轻量化视觉编码器与快慢思考统一模型等技术特点。这意味着它不是先训练语言模型再外挂视觉模块,而是从训练阶段就将图像、文字、表格、场景等多模态信息统一建模,在视觉推理、图文理解、文档分析、图表理解等任务中表现突出。

在与多款国内外主流大模型的横向评测中,X2-VL在视觉推理、结构化文档分析、图表语义理解等核心维度均位列第一。

教育场景实测尤为亮眼:基于2026年度全国各地高考模拟试卷中的多模态试题测试,全学科平均答题准确率接近 95% 。在《新京报》组织的2026年新高考I卷数学评测中,X2-VL以148分/150分位列第一,北京市中学数学特级教师点评称其在数形结合、图形几何性质研究等方面明显优于其他模型。在澎湃新闻组织的上海卷作文评测中,X2-VL以65.5分在9款主流模型中排名第一。

经技术优化后,模型推理答案准确率提升 28.7% ,运行效率大幅增长,使用门槛显著降低。

X2-VL依托科大讯飞与无锡联合建设的太湖星跃算力平台训练而成,这也是其"全国产算力训练"定位的落地支撑。科大讯飞总裁吴晓如在会上透露,讯飞星火是中国首个基于全国产算力平台训练的全栈自主可控大模型,团队已将长思维链强化学习训练效率从30%提升至84%,MoE模型全链路训练效率提升至93%。

这与"在国产算力上部署推理"有本质区别——推理解决的是"能不能跑",训练解决的是"能不能持续进化"。对政企客户而言,后者才决定长期安全边界与能力上限。

吴晓如在会上公布了讯飞星火的 "1 2 2"模型体系

  • 1个多模态底座大模型 :即X2-VL
  • 2个垂类多模态大模型 :具身智能大模型、超拟人数字人大模型
  • 2个行业多模态大模型 :物联网多模态大模型、工业多模态大模型

同时,科大讯飞提出新一代具身模型 GEAR-VLA ,进一步提升空间任务精度与物体特征泛化能力,在公开评测集合中效果领先。目前正以物流拣选场景为切入点打造行业级具身机器人,加速软硬一体化解决方案落地。

此次发布标志着科大讯飞与无锡的合作从顶层布局进入实体运营阶段。科大讯飞已在无锡高新区成立子公司,专门负责X2-VL的日常运营与场景化应用开发。位于无锡(国家)软件园的产业加速中心已吸引近20家AI项目入驻。

截至2026年6月1日,无锡已集聚 6.1万名开发者、2.2万个应用 ,其中具身智能相关开发者达476家,开发者规模位居江苏第三,近一年增长26.3%。

在教育领域,讯飞智慧教育产品已在无锡规模化应用:近1200台AI黑板覆盖75所中小学,日均活跃率87%;星火智能批阅机部署128台,覆盖80所中小学。在司法领域,智慧法庭已覆盖全市两级法院,庭审时长缩短30%~50%,人力效率提升60%。

X2-VL的发布,本质上是讯飞星火"全国产算力底座 通用大模型能力 行业场景深耕"路线的一次关键落地——底座决定能力上限,场景决定价值兑现。

  • 机器人 机器人 关注

    关注

    215

    文章

    31835

    浏览量

    225142

免责声明:本文为转载,非本网原创内容,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。

如有疑问请发送邮件至:bangqikeconnect@gmail.com