/ ai资讯

​ChatGPT 语音功能升级,实时翻译对话更自然流畅

发布时间:2025-06-09 14:35:47

最近,OpenAI 对其 ChatGPT 的语音功能进行了全面升级,特别是针对订阅用户,旨在提升 AI 的语音表达的自然性和情感丰富度。根据 OpenAI 的说法,更新后的 “高级语音模式” 现在可以实现更流畅、情感更细腻的语音输出,包括对语调、停顿以及表达同理心或讽刺等情感的改进。

值得注意的是,此次更新还新增了实时翻译功能。用户现在可以选择特定的语言对,要求 ChatGPT 进行翻译。AI 将会不断地对话双方的内容进行翻译,直到用户指示停止。这一功能非常适用于餐馆点餐或多语言的工作场景。

付费用户只需在聊天界面的语言图标上点击,即可在所有平台上体验这些语音改进。然而,OpenAI 也指出仍存在一些已知问题。用户可能会遇到偶尔的音频质量下降,比如音调或音量的突变,这在某些语音中可能更为明显。此外,所谓的 “幻觉” 现象仍然存在,ChatGPT 有时会无缘无故地产生奇怪的声音,例如广告片段、随机噪音,甚至是背景音乐。最近有用户反映,ChatGPT 在对话中突然播放了一段广告,尽管 OpenAI 并未投放广告。

OpenAI 在2024年5月首次推出了 “高级语音模式”,并于2024年10月扩大了在欧盟的可用性。该功能的目标是实现与 AI 的自然实时互动,包括在对话中打断和表达情感。如果用户打开摄像头,ChatGPT 还可以对周围的物体或环境进行实时评论。类似的功能也出现在谷歌的 Gemini 应用中。


免责声明:本文为转载,非本网原创内容,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。

如有疑问请发送邮件至:bangqikeconnect@gmail.com