/ ai资讯

壁仞科技完成阿里巴巴通义千问Qwen3全系列模型支持

发布时间:2025-04-30 15:46:18

4月29日,阿里巴巴通义千问发布并开源8款新版Qwen3系列“混合推理模型”(简称“Qwen3”)。Qwen3发布后数小时内,壁仞科技完成全系列支持,并率先在壁仞科技开发者云平台上线。

性能卓越,Qwen3部署成本大幅下降

Qwen3包括两款混合专家(MoE)模型Qwen3-235B-A22B和Qwen3-30B-A3B;同时还包括六个密集(Dense)模型Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B。从官方披露的数据来看,旗舰模型Qwen3-235B-A22B在代码、数学、通用能力等基准测试中,与DeepSeek-R1、o1、o3-mini、Grok-3和Gemini-2.5-Pro等顶级模型相比,表现出极具竞争力的结果。此外,小型MoE模型Qwen3-30B-A3B的激活参数数量是QwQ-32B的10%,表现更胜一筹。

基于广泛的训练,Qwen3在推理、指令跟随、Agent能力和多语言支持方面取得了突破性的进展,不仅是国内首个“混合推理模型”,“快思考”与“慢思考”集成进同一个模型,大大节省算力消耗;部署成本大也幅下降,显存占用仅为性能相近模型的三分之一。

极速响应,数小时全系列适配

壁仞科技依托自研的壁砺系列通用GPU架构与深度优化的软件栈,在Qwen3正式发布后,仅用数小时完成Qwen3全系列模型的适配工作,并成功上线开发者云平台。

与此同时,壁仞科技快速响应,推出基于壁砺系列一体机,包括便捷4卡机、通用8卡机、高密16卡机,全面支持Qwen3全系列模型。

Qwen3开源更重要的行业意义在于推动大模型技术的普惠和应用的落地。据相关媒体报道,Qwen3显著降低了设备适配的技术门槛以及部署成本,可满足海量中小企业和AI开发者的需求,从而加速AI推理应用落地。

用户访问以下链接或点击阅读全文即可体验部分模型:

https://sgc.birentech.com:5000/

  • 阿里巴巴 阿里巴巴 关注

    关注

    7

    文章

    1631

    浏览量

    47978

免责声明:本文为转载,非本网原创内容,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。

如有疑问请发送邮件至:bangqikeconnect@gmail.com