本站报道(文/李弯弯)2025年8月8日凌晨1点,OpenAI以一场长达1小时的线上发布会正式推出GPT-5。这场被业界称为“AI进化分水岭”的发布,终结了长达两年的技术猜测,更以多维度性能跃升重新定义了人工智能的能力边界。OpenAI首席执行官山姆·奥特曼在发布会上直言:“这不仅是模型的升级,更是通往通用人工智能(AGI)的关键里程碑。”
GPT-5:集成模型,能力跃升
GPT-5是一款集成模型(integrated model),它巧妙地融合了大语言模型GPT系列和推理模型o系列。这一创新设计意义重大,用户在使用时无需再手动切换各类不同模型,极大地提升了使用的便捷性和效率。例如,奥特曼在其个人社交平台上连发十余条推文介绍GPT-5,首条就着重强调“GPT-5是一个集成模型,这意味着不再需要模型切换器,它将自行决定何时需要更深入地思考”。
GPT-5首次采用了内嵌式三位一体集成架构,系统由三部分组成。GPT-5-main模型负责处理常规问题,GPT-5-thinking深度思考模型用于解决复杂任务,实时决策的路由机制则根据对话类型、复杂程度、工具需求以及用户的明确意图,快速决定使用哪个模型,自主决定是否进入深度思考模式,自动匹配最适合的模型。此外,还有一个额度使用完后启动的mini版本。这种架构设计使得GPT-5能够更加智能、高效地应对各种任务。
OpenAI公开的测试数据显示,GPT-5在多个关键领域展现出了顶尖性能。在数学领域,GPT-5在2025年AIME测试中无工具辅助达到94.6%,大幅超过了o3模型;在编程领域,在SWE-bench Verified(一项基于GitHub真实编程任务的测试)中,GPT-5首次尝试的得分达到74.9%,略优于Anthropic最新的Claude Opus 4.1模型(得分74.5%)和谷歌DeepMind的Gemini 2.5 Pro模型(得分59.6%),展现出前沿水平;在视觉感知和健康领域,GPT-5的表现同样出色,大幅超越包括GPT-4o、o1、o3和o4-mini在内的所有前代模型。在大模型竞技场LMArena上,刚刚上线的GPT-5凭借着极强的性能在所有细分类目中都位列第一。
“AI幻觉”一直是所有大模型难以克服的痛点,而GPT-5在减少AI幻觉方面展现出了行业领先的水平。与GPT-4o相比,GPT-5的事实错误率降低了45%;在深度思考模式下,事实错误率更是比o3大幅下降80%,变得更加准确可靠。在开放性事实准确性基准LongFact和FActScore测试中,GPT-5的幻觉率比o3减少大约六倍,长篇内容生成的准确性显著提升。这使得GPT-5在提供信息时更加值得信赖,为用户提供了更可靠的交互体验。
能耗方面,GPT-5通过混合专家模型(MoE)架构,在保持性能的同时大幅降低计算资源消耗。实测数据显示,其输出token数量较前代减少50%-80%,这意味着在相同硬件条件下,GPT-5可支持更多并发用户或更复杂的任务。
GPT-5:应用多元,前景广阔
在应用场景方面,GPT-5展现出了强大的实力和广泛的适用性。现场展示的多个案例令人印象深刻,例如GPT-5编码能力突出,只需几句话就可以创建一个名为"Jumping Ball Runner”的游戏。该游戏界面色彩丰富,游戏角色采用卡通风格设计,且具备最高分记录功能、重试按钮、趣味音效等多种特色功能。此外,GPT-5还可以在几分钟内开发一个学习法语的网络应用、一个复杂的财务分析模版等等。
对于创意工作者来说,GPT-5也是一大助力。一位用喜剧传递科普内容的博主,利用GPT-5写剧本、写段子、测试角色逻辑和情绪动机、出分镜,甚至用语音和GPT-5“对戏”。在正经的科研场景中,GPT-5同样表现出色,免疫学教授用GPT-5解读实验数据,模型不仅能解释结果,还会预测未来实验趋势,并主动提出下一步实验方案,大大压缩了科研迭代周期。
在医疗健康领域,GPT-5也发挥着积极作用。一位名为Carolina的用户在短短一周内被诊断出三种不同形式的癌症,但她一直在排队等候报告解读,于是她将医院报告截图上传给GPT-5,模型迅速将复杂的医学术语转化为易于理解的语言。在后续治疗过程中,GPT-5不仅持续帮助她解读术语,还协助她评估治疗选项、准备就诊问题,甚至在是否接受放射治疗的决策上给予Carolina情感支持。尽管OpenAI并不把GPT-5定位为医疗设备,但它可以成为“健康素养支持工具”,让患者在慌乱和未知里,不再完全仰赖医生,而是成为有准备、有信息支持、能了解身体情况的患者。
GPT-5拥有GPT-5、GPT-5-mini、GPT-5-nano和GPT-5-pro四个版本,以满足不同用户的需求。免费用户的GPT-5用量有限,超过限额后将自动转至GPT-5-mini,GPT-5-pro仅供Pro订阅用户使用。在定价方面,GPT-5、GPT-5-mini、GPT-5-nano三款模型可面向开发者提供API服务,三款模型的输入、输出价格分别为每百万token 1.25美元/10美元、每百万token 0.5美元/5美元、每百万token 0.15美元/1.5美元。与主要竞争对手Anthropic和谷歌相比,OpenAI的GPT-5模型对于开发人员来说成本相当甚至更低,这无疑将吸引更多的开发者使用GPT-5进行创新和应用开发。
GPT-5的发布也引起了众多合作伙伴的关注和积极响应。微软首席执行官萨蒂亚·纳德拉在8月6日的X帖子中表达了对GPT-5的赞叹,他提到从首次在必应中向世界展示GPT-4以来,仅仅过去了两年半的时间,就已经取得了如此巨大的进步。新模型将于8月6日登陆微软产品,微软365 Copilot将获得GPT-5,以及面向消费者的Copilot和Azure AI Foundry,开发人员可以使用它们将人工智能模型整合到第三方应用程序中。帮助企业管理计算机文件的Box公司最近几周一直在各种数据集中测试GPT-5,Box公司首席执行官艾伦·列维表示,之前的人工智能模型在该公司许多最先进的测试中都失败了,因为它们难以理解长文档中的复杂数学或逻辑,但GPT-5是一个“彻底的突破”,该模型能够保留更多它正在查看的信息,然后使用更高水平的推理和逻辑能力来做出决策。
总结
GPT-5的发布是OpenAI在人工智能领域的一次重大突破。它以集成模型的创新设计、在多个领域的能力提升、显著降低的幻觉率等亮点,为用户带来了更智能、更准确、更便捷的交互体验。其广泛的应用场景、多样的版本选择和合理的定价策略,以及与众多合作伙伴的积极合作,都为GPT-5的未来发展奠定了坚实的基础。我们有理由相信,GPT-5将推动人工智能技术向更高水平发展,为人们的生活和工作带来更多的改变和惊喜,成为数字世界的重要基础设施,就像曾经的Office 365、Google和百度等产品一样,深刻地融入我们的生活。
免责声明:本文为转载,非本网原创内容,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
如有疑问请发送邮件至:bangqikeconnect@gmail.com