OpenAI GPT-5.5 横扫网络安全评测，登顶最强！

OpenAI最新生成式人工智能模型GPT-5.5在网络安全能力评估中拿下顶尖表现，这次测试是由英国政府下属的AI安全研究所（AISI）主导的。

根据AISI网站17日发布的评估报告，GPT-5.5在专家级别的网络安全任务中，平均通过率高达71.4%。这个成绩远超上一代模型GPT-5.4的52.4%，也压过了Anthropic的Claude Mythos Preview的68.6%和Claude Opus 4.7的48.6%。

AISI通过95个任务来测试AI的网络安全能力，涵盖漏洞研究、漏洞利用、逆向工程、网络攻击以及密码分析等多个领域。

GPT-5.5成为第二个完整完成AISI企业网络渗透模拟“The Last Ones”全流程的模型。首个通过这个模拟的模型是Claude Mythos Preview。

“The Last Ones”是一个专为AI代理设计的任务，要求它们在无预先授权的情况下，自主寻找攻击路径，过程包括侦查、凭证窃取、内部网络移动、供应链绕过以及内部数据库数据泄露。这个任务被视为衡量AI作为自主攻击代理威胁性的关键指标。GPT-5.5在10次尝试中成功完成了两次全程，而Claude Mythos Preview之前在同一任务中10次尝试完成了三次。

AISI指出，AI模型的网络攻击能力正在快速提升，并预计短期内可能会迎来更多性能突破。

0 赞