
OpenAI最新生成式人工智能模型GPT-5.5在网络安全能力评估中拿下顶尖表现,这次测试是由英国政府下属的AI安全研究所(AISI)主导的。
根据AISI网站17日发布的评估报告,GPT-5.5在专家级别的网络安全任务中,平均通过率高达71.4%。这个成绩远超上一代模型GPT-5.4的52.4%,也压过了Anthropic的Claude Mythos Preview的68.6%和Claude Opus 4.7的48.6%。
AISI通过95个任务来测试AI的网络安全能力,涵盖漏洞研究、漏洞利用、逆向工程、网络攻击以及密码分析等多个领域。
GPT-5.5成为第二个完整完成AISI企业网络渗透模拟“The Last Ones”全流程的模型。首个通过这个模拟的模型是Claude Mythos Preview。
“The Last Ones”是一个专为AI代理设计的任务,要求它们在无预先授权的情况下,自主寻找攻击路径,过程包括侦查、凭证窃取、内部网络移动、供应链绕过以及内部数据库数据泄露。这个任务被视为衡量AI作为自主攻击代理威胁性的关键指标。GPT-5.5在10次尝试中成功完成了两次全程,而Claude Mythos Preview之前在同一任务中10次尝试完成了三次。
AISI指出,AI模型的网络攻击能力正在快速提升,并预计短期内可能会迎来更多性能突破。






