爆点资讯

JADES 由德国亥姆霍兹信息安全中心（CISPA)，富莱睿（Flexera）和西安交通大学的研究团队合作完成。本文的通讯作者为CISPA 教授张阳。

引言

回想一下，老师会如何批改考试中的开放题：如果考生只在开头写「答：」，但是后面却没有给出答案，当然不能得分；反之，如果他开头说「我不会」，却在后面写出了正确答案，那就该得分。另一方面，还有的答案看似组织良好、道理高深，却句句不在点上，那么依然只能低分；只有当回答准确且全面地涵盖了解决问题的关键要点时，其得分才较高。老师给分的依据，在于答案的实际内容和关键点，而不在于答案的开头、词藻或者形式。

可惜，目前 LLM 越狱攻击（Jailbreak）的评估往往就掉进了这些坑。常见做法要么依赖关键词匹配、毒性分数等间接指标，要么直接用 LLM 来当裁判做宏观判断。这些方法往往只能看到表象，无法覆盖得分的要点，导致评估容易出现偏差，很难为不同攻击的横向比较和防御机制的效果验证提供一个坚实的基准。

为了克服这一难题，来自CI

LLM越狱攻击威胁被系统性高估? 基于分解式评分越狱评估新范式

被指住宿环境...

资深天使投资...

王浩然第二阶...

两集飙上9分...

创业者要做到...

斯基拉：阿森...

街边大排档，涌进商场做“漂亮饭”

特朗普证实：已授权中情局行动

深圳105-95山西取CBA3连胜，贺希宁23分，迪亚洛空砍31分

明年新能源汽车销量将超2000万辆

龚俊《暗河传》首波口碑出炉了！现场观众的评价“一针见血”

2026款大众迈腾上市售价17.99-24.69万元

2025秋冬最火的5件外套，今年流行的风格都离不开它们！

剑桥大学团队揭秘：如何让计算机像管家一样聪明地分配工作

一加 15 /Ace 6 适配《金铲铲之战》原生 165 超高帧模式

宋伊人新剧被传谣，是要逼人“剖腹取粉”吗？

宝马圣诞视频暗藏新车剪影

印媒：印度将在印巴边境地区启动大规模三军联合演习

香波特：讨厌在尼克斯&骑士打3D 到了国王才感觉解放

“聪明的阿凡提”，来自土耳其？

前三季度私募产品“超涨”十强！复胜、远信、歌汝等夺冠！

“勃肯鞋”今年冬天爆火！这几双怎么搭都好看

吴佩慈发大S照片悼念：我失去的岂止是一个好朋友

B81 2.0共创版亮相北京越野开启共创模式新实践

马斯克圣诞礼物：X上所有图片都能一键AI改图了，全球画师暴怒

CES2026开幕，英伟达黄仁勋提到多个中国大模型，这些中国产品将亮相

3D唇妆风好大，人类对唇线笔的开发不足1%

特斯拉Q3销量首超梅赛德斯奔驰，一个时代终结了？

17个街道年投入逾亿元资质错配、服务动力不足何解?

别小看这几小事，坚持到过年那状态得有多好啊？