/ ai资讯

百度文心大模型X1 Turbo获得信通院当前大模型最高评级证书

发布时间:2025-05-21 19:46:35

百度在520居然还领了个证?是它,信通院当前大模型最高评级证书

在5月20日的百度AI Day 上,中国信通院公布了大模型推理能力评估结果——

百度文心大模型X1 Turbo在24项能力评估中,16项达5分,综合评级获当前最高级“4 级”,成为国内首款通过该测评的大模型。文心X1 Turbo逻辑推理、代码推理、推理效果优化等技术能力及工具支持度、安全可靠度等应用能力均获得满分。

AI Day现场,百度吴甜系统性讲解了文心大模型最新版的技术创新。她介绍,文心大模型4.5是多模态基础大模型,文心4.5 Turbo源自文心4.5,效果更好、成本更低;基于文心4.5 Turbo,文心X1升级到X1 Turbo,性能提升的同时,具备更先进的思维链,问答、创作、逻辑推理、工具调用和多模态能力进一步增强。

中国信息通信研究院人工智能研究所平台与工程化部主任曹峰表示:

评估结果表明,文心X1 Turbo擅长结构化的逻辑思考,并具备平衡模型能力与效率的优化技术,其有效的数据机制保障了模型的可信及可用程度,其推理服务能广泛支持各类应用。文心X1 Turbo强化推理泛化能力,拓宽工具链应用生态,加强安全机制建设,构筑可信应用保障壁垒。

举两个例子——

当你把一张外文的药品说明书拍照上传到文心大模型4.5 Turbo,它可以:

◎ 看懂图片:不仅能识别图片中的文字,还能根据图片内容判断这是“用于缓解肌肉或关节疼痛的药品”;

◎ 多语种翻译:把识别出的日文翻译成中文,并根据图示中的红色字标记重点,比如注意事项等。

这样一来,即使你完全不懂日语,也能快速搞明白这药是干什么的、怎么用才安全。

你还可以拍照上传作业题目,让文心X1 Turbo解答:

◎它会先思考解答这个题目的思路;

◎ 自主规划,识别图片中的明面信息和隐藏含义;

◎ 再思考分析,反思每个答案的准确性;

◎ 最后,给出详细步骤和答案。

思维与行动融合的指导模式,绝对比家长辅导有耐心!

//多模态大模型:提升学习效率和效果

文心4.5和4.5 Turbo实现了文本、图像和视频的混合训练。

针对不同模态数据在结构、规模、知识密度上的差异,通过多模态异构专家建模、自适应分辨率视觉编码、时空重排列的三维旋转位置编码、自适应模态感知损失计算等技术,大幅提升跨模态学习效率和多模态融合效果,学习效率提高近2倍,多模态理解效果提升超过30%。

//自反馈增强框架:让模型学会“自我迭代”

后训练方面,百度研制了自反馈增强的技术框架,基于大模型自身的生成和评估反馈能力,实现了“训练-生成-反馈-增强”的模型迭代闭环,不仅解决了大模型对齐过程中,数据生产难度大、成本高、速度慢等问题,而且显著降低了模型幻觉,模型理解和处理复杂任务的能力大幅提升。

在训练阶段,通过融合偏好学习的强化学习技术,实现多元统一奖励机制,提升了对结果质量判别的准确率,通过离线偏好学习和在线强化学习统一优化,进一步提升了数据利用效率和训练稳定性,并增强了模型对高质量结果的感知。此外,因为通过偏好信号与奖励信号的融合运用,模型的理解、生成、逻辑和记忆等能力全面提升。

//深度思考:从“单线思维”到“复合思维”

深度思考方面,突破了仅基于思维链优化的范式,在思考路径中结合工具调用,构建了融合思考和行动的复合思维链,模型解决问题能力得到显著提升。同时,结合多元统一的奖励机制,实现了思考和行动链的端到端优化,大幅提升了跨领域的问题解决能力。

//数据建设闭环:实现快速、高效的数据生产

数据方面,打造了“数据挖掘与合成 - 数据分析与评估 - 模型能力反馈”的数据建设闭环,为模型训练源源不断地生产知识密度高、类型多样、领域覆盖广的大规模数据。同时,数据建设流程具备良好的可扩展性,能够轻松迁移到全新的数据类型,实现快速、高效的数据生产。

从多项基准测试结果来看,文心大模型4.5 Turbo、X1 Turbo表现出色,效果领先。

//更前瞻、更具想象力的创新应用

大模型的能力进一步拓展、效率进一步提升之后,可以探索更前瞻、更有想象力的创新应用。

以数字人为例,超拟真数字人需要具备出色的表现力、吸引人的内容、数字人与场景、物品的互动等,需要综合运用多模态AI技术。百度研制了“剧本”驱动多模协同的超拟真数字人技术,实现了语言、声音、形象的协调一致。目前这套技术已经支持超过10万数字人主播,直播转化率达31%,降低80%直播开播成本。

而在代码场景上,基于文心大模型的语言和代码能力,百度研制了代码智能体和智能代码助手——文心快码。百度每天新增的代码中,文心快码生成的代码占比已超过40%。截至目前,文心快码向全社会开放,累计服务760万开发者。

文心大模型的能力拓展和效率提升,得益于飞桨文心的联合优化。公开数据显示,飞桨文心开发者数量已超过2185万,服务超过67万家企业,创建的模型达到110万。此外,基于飞桨文心,百度在全国范围内落地了7个产业赋能中心和7个教育创新中心,以及两个数据生态中心,形成了繁荣的良性发展生态。

//16岁高中生:打开文心一言,就像打开新华字典一样

本次AI Day ,我们还邀请到了一位16岁的高中生——陈君航。这位来自福建惠安第三中学的高一学生,从2023年就开始接触文心一言,自那以后,文心一言几乎陪伴了他整个中考备考过程。

初次接触文心一言时,陈君航正为语文作文的修改发愁,于是就把作文和老师点评发给文心一言,让它逐句分析给出修改建议。他说,“我打开文心一言,就像打开新华字典一样频繁。在它的陪伴下,我的写作能力得到很大提升。”

陈君航还借助文心一言从零自学了Python,开发出“智能文案生成器”帮妈妈减轻繁重的教学任务,原本三天的工作,现在只需几小时就可以完成。

当大模型学会像人类一样感知世界,像人类一样思考和行动并自我进化,技术进步便真正转化为普惠的社会红利。正如陈君航所说:“技术真正的魅力不是惊艳谁,而是真正解决一个又一个真实的问题”。

“领证”并不是终点,大模型能力的进一步拓展,对创新应用的探索仍在继续!

免责声明:本文为转载,非本网原创内容,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。

如有疑问请发送邮件至:bangqikeconnect@gmail.com