阿里国际推出最新多模态大模型 Ovis，看菜品就能提供烹饪步骤

发布时间：2024-09-20 09:35:50

在近日的发布会上，阿里国际 AI 团队揭晓了其最新研发的多模态大模型 Ovis，这一创新的 AI 技术无疑为各行业带来了新的机遇。Ovis 具备强大的图像理解和数据处理能力，让人耳目一新。

Ovis 的多模态能力极其强大，它能够处理文本、图像等多种数据，展现出优秀的综合实力。与传统的大语言模型相比，Ovis 不仅能理解文本，还能对图像等非文本信息进行深入分析。

比如说，用户只需上传一张菜品的照片，Ovis 便能迅速识别并提供详细的烹饪步骤，帮助用户轻松做出美味佳肴。

Ovis通过对图片的识别处理能够给出菜谱

根据多模态评测平台 OpenCompass 的数据，Ovis1.6-Gemma2-9B 在30B 参数以下的模型中，取得了综合排名第一，超越了 MiniCPM-V-2.6等一系列优秀模型。这项成就证明了 Ovis 在市场中的竞争力。

Ovis在OpenCompass上的测评数据情况

此外，Ovis 在数学推理、物体识别和复杂决策等领域表现出色。例如，它能精准地解答数学题、识别花卉品种，甚至在手写文本的翻译上也毫不逊色。Ovis 的五大核心优势中，最引人关注的是其创新的架构设计和高分辨率图像处理能力，使得它在多模态任务中的表现大幅提升。

Ovis 的开源策略同样令人称道。它的 License 采用 Apache2.0协议，意味着用户可以自由使用和改进这个模型。Ovis 系列的模型和代码都已在 GitHub 上开源，开发者们可以轻松获取并进行二次开发。

在自动驾驶、医疗诊断、视频内容理解等广泛应用场景中，多模态大模型 Ovis 都显示出了巨大的潜力。阿里国际团队透露，近半年的数据显示，商家对 AI 的需求不断增长，平均每两个月调用量翻一番，Ovis 无疑将助力更多商家提升运营效率。

免责声明：本文为转载，非本网原创内容，不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。

如有疑问请发送邮件至：bangqikeconnect@gmail.com

​阿里国际推出最新多模态大模型 Ovis，看菜品就能提供烹饪步骤