关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者3192人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

张雨绮爆雷丢工作!省媒确认她不会上春晚

FancyMusic 浏览 3033

意天空:德布劳内至少伤缺3-4个月,需决定手术还是保守治疗

懂球帝 浏览 4081

E句话| 林依晨前男友被判刑了?

仙女事件簿 浏览 963

海哈金喜更新离婚后动态,状态不错

影视口碑榜 浏览 3400

普京:俄方已无兴趣等待乌从其占领区撤出

每日经济新闻 浏览 3384

钟欣潼前夫被曝婚变,第三任妻子删光合照

树娃 浏览 4070

海牛:从未拖欠兰克尔·泽薪酬

体坛周报 浏览 3808

随着广东+上海+广厦全赢球,CBA最新积分榜如下:2队全胜+2队全败

侃球熊弟 浏览 3531

普通人穿衣别太老气横秋!这些穿搭给你灵感,保暖耐看两不误

静儿时尚达人 浏览 2590

大众汽车将CARIAD降级,大象转身倒逼战略转向!

百姓评车 浏览 4437

外套+半身裙封神穿搭!6款显瘦神器保暖不臃肿,冬天美得出彩

Yuki女人故事 浏览 3545

竞逐AI内容,爱奇艺先出手了

连线Insight 浏览 4202

“食安AI博士”智能体首秀进博会!

文汇报 浏览 4041

多国领导人到访 朝鲜迎来外交潮

上观新闻 浏览 4183

清华大学团队NeurIPS 2025文章分析 RL 与 SFT 泛化性差异

机器之心Pro 浏览 4516

交警视角解密:腾势N8L如何定义“安全担当”

网易汽车 浏览 3211

普通人穿衣真的很简单!单品选对、搭配合理,大方舒适又得体

静儿时尚达人 浏览 2565

卡位AI算力基建狂潮,鸿辉光通加快实现向光器件隐形龙头的蜕变

第一财经资讯 浏览 4820

告别臃肿!这种简约的高级穿法,别拒绝

Yuki女人故事 浏览 3135

阿森纳:是巨大的错失机会还是宝贵的一分?唯有时间能证明

绿茵情报局 浏览 3146

小鹏汽车出海新动态:小鹏 MONA 正式发往中东非

IT之家 浏览 3754
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1