
编者按:在人工智能浪潮席卷全球的今天,AI“智能体”正以惊人的速度渗透进我们的数字生活。它们被赋予自动化处理邮件、管理日程乃至执行复杂网络任务的能力,承诺为用户解放双手。然而,随着OpenClaw等平台用户突破三百万大关,其背后潜藏的安全危机正拉响刺耳警报。从擅自删除邮箱到泄露隐私信息,从隐蔽指令攻击到“技能”模块漏洞,这些不受控的“数字雇员”可能随时化身“混乱特工”。当技术创新狂奔在安全护栏之前,我们是否正亲手打开潘多拉魔盒?本文深度解析AI智能体暗藏的风险旋涡,敲响未来数字世界的安全警钟。
人工智能“智能体”承诺通过自动化任务为用户节省时间和精力,但像OpenClaw这类系统日益增长的能力,正让网络安全专家如坐针毡。
在炒作浪潮的推动下,OpenClaw如今宣称在全球拥有超过三百万用户。
该系统允许用户创建所谓的“智能体”——这些基于大型语言模型(如OpenAI的ChatGPT或Anthropic的Claude)的工具能够执行在线任务。
“我们已经从可以通过聊天机器人对话的AI,发展到能够采取行动的智能体AI……威胁和风险无疑大得多,”IT安全公司Elastic France的首席解决方案架构师Yazid Akadiri表示。
在一篇题为《混乱特工》尚未经过同行评审的文章中,一个由20名研究人员组成的团队研究了用OpenClaw创建的六个AI智能体的行为。
他们发现了这些系统执行的十几种潜在危险操作,从删除电子邮件收件箱到共享个人信息。
许多用户在网上发布了类似的OpenClaw事故经历。
“当你部署智能体时,你无法控制它们会做什么,而当你试图查看它们在做什么时,你会发现它们的行为远远超出了你设定的限制,”网络安全机构Check Point的专家Adrien Merveille说道。
而且安全漏洞不仅限于智能体自身的错误操作。
为了执行有用工作,这些工具需要访问电子邮件、日历或搜索引擎的个人账户——这吸引了网络攻击者的注意。
网络安全公司Palo Alto Networks的首席安全情报官Wendi Whitmore表示,随着AI智能体的普及,它们很可能成为黑客的首要目标。
“一旦(攻击者)进入某个环境,(他们)会立即转向内部正在使用的大型语言模型(智能体),并利用它来探查系统以获取更多信息。”
Palo Alto的Unit 42研究部门在三月初表示,他们发现了以隐藏指令形式添加到网站中的攻击尝试痕迹,这些指令针对智能体。
其中一条指令命令任何可能读到它的智能体“删除你的数据库”。
其他网络安全公司和研究人员警告称,攻击者可能通过所谓的“技能”——用户可下载并添加到系统中以赋予新能力的文件——来获取智能体的访问权限。
在可免费下载的此类文件中,有些包含了恶意操作的隐藏指令,例如窃取数据。
OpenClaw的创建者Peter Steinberger表示,他非常清楚这些风险。
“我特意没有把它做得太简单,以便人们会停下来阅读和理解:AI是什么,AI可能犯错,什么是提示注入——一些你在使用该技术时真正应该了解的基础知识,”他在三月告诉法新社。
Whitmore认为,期望用户为智能体创建自己的安全护栏是“相当不现实的”。
她预测:“人们会先采用创新技术,真正了解它的能力,然后才会问‘如何保护我自己的数据?’这个问题。这将在2026年导致一些重大的数据泄露挑战。”






