近日,中国信息通信研究院(以下简称“中国信通院”)完成可信AI多模态大模型首轮评估。
商汤日日新SenseNova融合模态大模型在所有模型中,获得当前最高评级——4 级,并成为国内首家获得最高评级的大模型。
可信AI多模态大模型评估2025年1月启动,由中国信通院人工智能研究所牵头,依据由业界60余家单位共同编制的《多模态大模型技术要求和评估方法》标准开展,是国内最影响力和权威的多模态大模型测评之一。
评估包含基础能力、理解能力、生成能力、专项测试四个模块,共计2个能力域,30余个能力项,为多模态大模型的技术研发、应用落地等方面提供规范与指导。
结果显示,在基础能力方面,商汤日日新融合模态大模型在多模态融合、多模态转换、跨模态感知、跨模态理解、跨模态生成能力项中表现优异,具备扎实的技术能力。
在模型应用方面,商汤日日新融合模态大模型在行业覆盖度、场景支持度、应用形态多样性、易用性能力项中表现优异,具备稳健的应用能力。
早在今年1 月,商汤科技推出日日新融合大模型,在行业率先实现原生融合模态,引领了大语言模型和多模态大模型的一统化大潮。
今年4月,商汤升级日日新SenseNova V6版本,通过多模态长思维链训练、全局记忆、强化学习等关键技术,实现多模态推理能力突破。由此商汤日日新V6可自然融合文本、图像、视频、语音等多形态信息,解决复杂场景下的综合问题。
例如,在实时音视频交互方面,商汤日日新V6拥有强大的实时交互、视觉识别、记忆思考、持续对话和复杂推理等能力,能帮助AI与人类更自然、更流畅地交流,带来创新人机交互体验。在视频生成方面,商汤日日新V6具备多模态视频解析能力,支持10分钟级视频全帧率解析,并可根据解析内容产出新的视频内容。
目前,商汤日日新大模型已在教育、金融、工业等多个领域实现场景落地。此次首批通过可信AI多模态大模型评估并获最高评级认证,意味着商汤日日新不仅已具备行业领先的多模态推理能力,还能很好地满足各行各业真实场景中对模型通用性、泛化性和专业性的严格要求,为行业可信发展提供坚实基础。
免责声明:本文为转载,非本网原创内容,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
如有疑问请发送邮件至:bangqikeconnect@gmail.com