当前位置: 洛伊网 » 国际 » OpenAI GPT-5.5 横扫网络安全评测,登顶最强!

OpenAI GPT-5.5 横扫网络安全评测,登顶最强!

OpenAI GPT-5.5 横扫网络安全评测,登顶最强!

OpenAI最新生成式人工智能模型GPT-5.5在网络安全能力评估中拿下顶尖表现,这次测试是由英国政府下属的AI安全研究所(AISI)主导的。

根据AISI网站17日发布的评估报告,GPT-5.5在专家级别的网络安全任务中,平均通过率高达71.4%。这个成绩远超上一代模型GPT-5.4的52.4%,也压过了Anthropic的Claude Mythos Preview的68.6%和Claude Opus 4.7的48.6%。

AISI通过95个任务来测试AI的网络安全能力,涵盖漏洞研究、漏洞利用、逆向工程、网络攻击以及密码分析等多个领域。

GPT-5.5成为第二个完整完成AISI企业网络渗透模拟“The Last Ones”全流程的模型。首个通过这个模拟的模型是Claude Mythos Preview。

“The Last Ones”是一个专为AI代理设计的任务,要求它们在无预先授权的情况下,自主寻找攻击路径,过程包括侦查、凭证窃取、内部网络移动、供应链绕过以及内部数据库数据泄露。这个任务被视为衡量AI作为自主攻击代理威胁性的关键指标。GPT-5.5在10次尝试中成功完成了两次全程,而Claude Mythos Preview之前在同一任务中10次尝试完成了三次。

AISI指出,AI模型的网络攻击能力正在快速提升,并预计短期内可能会迎来更多性能突破。

未经允许不得转载:洛伊网 » OpenAI GPT-5.5 横扫网络安全评测,登顶最强!

相关文章

评论 (0)