OpenAI 正采取一种“以毒攻毒”的新策略,来提升其代理式网页浏览器 ChatGPT Atlas 的安全性。为了应对日益复杂的网络威胁,OpenAI 开发了一套“自动化攻击者”系统,通过模拟真实黑客的攻击手段,对 ChatGPT Atlas 进行全天候的压力测试。
这套系统的核心在于对抗提示注入(Prompt Injection)攻击。在这种攻击中,恶意第三方会悄悄向 AI 代理发送指令,诱导其执行违背用户意愿的操作,例如在用户不知情的情况下转发敏感邮件或删除云端文件。AIbase 获悉,OpenAI 的“自动化攻击者”利用了先进的强化学习技术,能够自主发现人类红队测试中未曾察觉的新型攻击路径。
在一次实际演示中,这个 AI 攻击者成功模拟了诱导 Atlas 向公司 CEO 发送辞职信的场景。虽然 Atlas 的防御机制最终拦截了这一请求并提醒了用户,但 OpenAI 坦言,安全博弈是一场持久战。由于代理式浏览器需要深度介入用户的数字化生活(如访问邮件、日历等),其便利性本身也带来了更大的风险暴露面。
尽管技术手段在不断进化,OpenAI 在最新报告中警示称,由于 AI 代理的本质特性,这类安全威胁可能永远无法被彻底“根治”。AIbase 提醒用户,在享受 AI 浏览器带来便利的同时,仍需保持警惕,关注官方发布的实时安全响应与防护建议。
免责声明:本文为转载,非本网原创内容,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
如有疑问请发送邮件至:bangqikeconnect@gmail.com