关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者3188人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

蔚来乐道发布换电站电池翻倍计划

电动知家 浏览 3581

谭松韵,为什么百搭?

温柔娱公子 浏览 3390

鲁本-迪亚斯:经验告诉我们,如果不在最佳状态就无法夺冠

懂球帝 浏览 3451

王浩然三分绝杀,深圳95-92险胜山东,克里斯空砍30分

懂球帝 浏览 3485

美前驻华大使不装了:凭啥和中国组G2划"势力范围"

观察者网 浏览 4380

宝马iX3增9款涂装 国产长轴距版或年底上市

车质网 浏览 105

剑南春|国米2-1客胜维罗纳,泽林斯基破门,皮奥造乌龙绝杀

懂球帝 浏览 3877

机酒价格普降两成 出境错峰游正当时

北京商报 浏览 4339

送走伊朗外长后 巴基斯坦打破停火再次对邻国重拳出击

健身狂人 浏览 33364

斗跑杨立昆后自己也要被废?汪滔赶忙“端菜上桌”

字母榜 浏览 2287

马斯克宣布X Money四月公测

财闻 浏览 2299

46岁邓超暴瘦引讨论,人前光鲜背后令人担忧

小梊搞笑解说 浏览 3155

阿尔特塔提醒阿森纳需警惕“危险”的诺丁汉森林

绿茵情报局 浏览 3146

英特尔AI双赛走出的万名开发者,正在弥合AI人才缺口

科技行者 浏览 3099

美国对伊朗考虑"军事选项" 中方回应

澎湃新闻 浏览 3134

阿根廷晋级世青赛决赛,梅西:挺进决赛啦,恭喜所有人

懂球帝 浏览 4147

朝鲜空军庆祝活动 现场2名女飞行员示范飞行

看看新闻Knews 浏览 3679

冬奥总结:雪上项目当主角 中国刷新境外参赛最佳

体坛周报 浏览 2659

刘强东又要敲钟:京东工业冲刺港股,估值67亿美元

蓝鲸新闻 浏览 4588

美称敲定"谅解备忘录" 伊朗否认

极目新闻 浏览 112

赣州队1-0宜春队,总比分3-0夺得赣超冠军,卢欣头球破门

懂球帝 浏览 3337
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1