首页 / ai资讯

商汤科技发布“日日新5o”:对标GPT-4o 实现实时流式多模态交互

发布时间:2024-07-05 18:36:03

在2024年世界人工智能大会上,商汤科技发布了国内首个所见即所得模型“日日新5o”,这一模型的交互体验与GPT-4o相当,实现了实时的流式多模态交互。该模型通过整合声音、文本、图像和视频等跨模态信息,能够进行实时的理解和响应。例如,它能够识别工作人员佩戴的胸卡并判断出会场位置,描述小狗玩偶的外观和穿戴,以及对工作人员随手画的图画进行即时评价。

“日日新5o”模型的实时交互能力特别适用于实时对话和语音识别等应用,它能够在同一模型中处理多种任务,并且根据不同上下文自适应调整行为和输出。这一模型是基于“日日新5.5”基础模型,而“日日新5.5”是在今年4月发布的“日日新5.0”基础上的升级版,综合性能平均提升了30%,尤其在数学推理、英文能力和指令跟随等方面有显著提升。

“日日新5.5”采用了混合端云协同专家架构,通过超过10TB tokens的高质量训练数据,包括合成的思维链数据,来提升模型的推理思维能力。为了降低企业用户的接入门槛,商汤推出了“大模型0元Go”计划,为新注册用户提供多项免费服务,并赠送5000万Tokens包,同时提供专属搬家顾问帮助OpenAI用户迁移,实现零服务成本。


免责声明:本文为转载,非本网原创内容,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。

如有疑问请发送邮件至:bangqikeconnect@gmail.com