关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者3575人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

赌王长孙女近况曝光,定居澳门买下2300平海景房,悲惨人生终逆袭

萌神木木 浏览 4551

告别奥博穆时代,保时捷加速落子研发"中国棋"

网易汽车 浏览 4334

塔帅:庆祝警察?我尊重每一种观点,并把它们放在该在的地方

懂球帝 浏览 1262

股价年内涨近127%!汇量科技是如何做到的?

览富财经网 浏览 4378

日本新首相上任:首次将新型潜艇纳入国防政策

红星新闻 浏览 4541

企业来出题!首届重庆市AI大模型创新应用大赛落幕

上游新闻 浏览 4660

66岁倪萍身价过亿,26岁儿子却成她心头大患

手工制作阿歼 浏览 3693

中国女足近11次对澳大利亚未尝胜绩,但在亚洲杯还没输过对方

懂球帝 浏览 2574

小米公布团队接触相关KOL事件正式调查结果

IT之家 浏览 3599

速度提高62.5%!中国科学家突破世界难题

环球网资讯 浏览 3535

湖南慈利通报“网友反映因瓶装液化气销售价格引发矛盾、广告牌被损毁”:相关部门已介入调查

环球网资讯 浏览 4749

BIGME大我推出7英寸彩色墨水屏电纸书B751CS,1739元

IT之家 浏览 3905

联盟各队在恐慌雷霆 战绩第一还手握快船2026年首轮签

仰卧撑FTUer 浏览 4136

内需复苏叠加“反内卷” 聚焦两大方向投资机遇

证券时报 浏览 2976

黄仁勋放豪言:到2027年Blackwell和Rubin芯片至少创收1万亿美元

华尔街见闻官方 浏览 2541

东西卖出去钱却没进账 几个月后店长发现银行卡有问题

1818黄金眼 浏览 7750

东体:地区超重塑观众的心理认同,足协应让草根和职业贯通

懂球帝 浏览 4520

18.99万起,智享大六座旗舰SUV风云T11上市,又要卖爆?

电车通 浏览 3967

微软官方确认:Windows 11任务管理器出问题了!

快科技 浏览 4345

“锂王”炒股,赚了111万,赔掉2000亿

大猫财经Pro 浏览 2925

特朗普开价10亿美元招募 被指试图用新机构替代联合国

极目新闻 浏览 8013
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1