关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者2654人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

游戏规则变了,Stellantis或用中国技术再造Jeep

禾颜阅车 浏览 3591

智元精灵G2新一代工业级交互式具身作业机器人发布

IT之家 浏览 3782

女子出差遭客户强制猥亵致精神创伤:逃卫生间逃过一劫

大风新闻 浏览 14202

丁威迪考虑去海外联赛淘金 拜仁和奥林匹亚科斯成为热门候选

仰卧撑FTUer 浏览 3668

两个男演员冲上热搜!举止亲密惹关注

萌神木木 浏览 2634

人工智能时代如何深化跨区域知识产权保护协作,嘉定这场论坛进行了探讨

上观新闻 浏览 2928

美国政府效率部提前解散

北京商报 浏览 3209

87岁画家范曾有四段婚姻 亲生后代一女一子

红星新闻 浏览 20506

舞蹈与千年古镇碰撞 第二季新市古镇舞蹈艺术季启幕

国是直通车 浏览 3593

今年秋天最流行的6条半裙,怎么搭都好看!

LinkFashion 浏览 4401

中国女导演在柬坠亡 监控显示其随一法国籍男子进门

新民周刊 浏览 8793

女人老了别瞎穿,记住“衣不紧身,裙不上膝”,才是真的优雅

静儿时尚达人 浏览 3382

美媒:美军紧急出动F-16战机飞越叙中部城市上空"展示武力"

环球网资讯 浏览 3097

除了“薄底鞋”,今年最流行这5双鞋,怎么搭都好看!

LinkFashion 浏览 465

中国天眼新成果发布 揭示快速射电暴双星起源关键证据

环球网资讯 浏览 2628

已获海港等队邀约,茹子楠表态站好梅州这班岗:拼到最后一秒

懂球帝 浏览 3321

萨莫拉诺:巴萨必须引导好亚马尔,从没听过梅西说皇马偷窃

懂球帝 浏览 3363

普京:与乌克兰无条件停火不可能

每日经济新闻 浏览 3189

晒"妈妈牌"耐克书包男子已收到耐克礼物 当事人发声

极目新闻 浏览 25352

俄外长:向乌提供“战斧”将让俄美关系出现最危险局面

上观新闻 浏览 3655

崩老头爆火背后:20块一句“哥哥”,击穿百万中年男人

功夫财经 浏览 529
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1