ChatGPT Atlas 遇“即时注入”幽灵：OpenAI 内部警示安全边界

智享AI

封面图

OpenAI 最新的力作 ChatGPT Atlas，这款被寄予厚望的智能浏览器，正面临着一个棘手的安全挑战。就在这款产品积极推广之际，OpenAI 内部的安全主管 Dane Stuckey 公开敲响了警钟，直指“即时注入”（Prompt Injection）攻击这一未竟的威胁，预示着人与 AI 协作的新边界正经历着严峻的考验。
“即时注入”攻击，顾名思义，是一种利用 AI 模型对指令的理解能力，通过精心设计的输入来“欺骗” AI，使其执行非预期的操作。想象一下，你正在浏览一个购物网站，却在某个不经意的角落，被隐藏的恶意指令诱导，AI 代理在你不知情的情况下，悄悄修改了你的购物车，甚至完成了下单。更令人担忧的是，这类攻击的触角还能延伸到窃取用户的电子邮件内容、登录凭证等敏感私人数据。Stuckey 坦言，尽管 OpenAI 为 Atlas 投入了大量的安全测试资源，并引入了多重防护机制和新的模型训练方法，但“即时注入”的顽固性依然超出预期，短期内难以彻底根除。
为了应对这一潜在风险，OpenAI 在 Atlas 中部署了两道关键的防线。首先是“注销模式”，这就像一个紧急刹车，当系统检测到潜在的危险信号时，可以立即切断 AI 代理对用户数据的访问，从根本上阻止信息泄露的发生。其次是“监视模式”，它更像一个“安全助手”，特别是在用户访问敏感网站时，要求用户在进行关键操作前进行人工确认和监督，确保每一步操作都在用户的可控范围内。这两种模式的结合，旨在为用户的数字生活提供一层额外的安全保障。
然而，Stuckey 也强调，安全并非一劳永逸的终点，而是一个持续演进的过程。OpenAI 的团队正夜以继日地研发更先进的防护功能和快速响应系统，以便在面对层出不穷的攻击手段时，能够第一时间进行干预和修复。“Atlas 所面临的安全挑战，不仅仅是冰冷的技术难题，更是对我们如何与日益强大的 AI 协同工作，以及如何在新兴的数字空间中划定安全边界的深刻拷问。”他的一席话，道出了整个行业在拥抱 AI 时代时，必须共同面对的现实。
总而言之，ChatGPT Atlas 的安全警报，不仅是 OpenAI 自身面临的挑战，更是整个 AI 行业在快速发展过程中，必须正视的“成长的烦恼”。如何在享受 AI 带来的便利与效率的同时，构建起坚不可摧的安全屏障，将是未来一段时间内，技术研发和行业规范的关键课题。

追风科技

这不就是那啥，之前就有的问题吗！

nanshanzhang

这啥新 bug 啊，又得修了。