关闭广告

澳大利亚国立大学发现:攻击AI视觉模型只需要操控20%的关键词汇

科技行者2619人阅读


这项由澳大利亚国立大学领导的国际研究团队发表于2025年12月26日的arXiv预印本论文(编号:2512.21815),揭示了一个令人担忧的发现:当今最先进的AI视觉语言模型存在一个严重的安全漏洞,攻击者只需要巧妙地操控20%的关键词汇,就能让这些本应安全可靠的AI系统产生有害内容。

考虑这样一个场景:你正在使用一个AI助手来描述图片内容,比如一张街头摩托车的照片。正常情况下,AI会告诉你"这是一个繁忙的城市街道,有几个人骑着摩托车,他们都戴着头盔"。然而,经过特殊设计的微小图像修改后,同一个AI可能会说出完全不同且危险的内容,声称图片中出现了暴力场景或其他有害内容。更令人担忧的是,这种攻击不需要修改整个AI系统,仅仅针对生成文本中20%的特定位置进行干预就足够了。

研究团队通过深入分析发现,这些AI模型在生成描述时,并非每个词汇都同样重要。就像一个故事中有些情节转折点特别关键一样,AI在生成文本时也有一些"决策点",这些点上的词汇选择会极大影响整个叙述的走向。这些关键位置被研究人员称为"高熵位置",类似于岔路口,选择不同的道路会通向完全不同的目的地。

更加令人不安

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

德国防长建议特朗普道歉 但暗示并不真抱希望

参考消息 浏览 6785

黄仁勋放大招,全栈 AI 加持的NVIDIA 要承包智驾未来?

汽车观察AUTO 浏览 2578

惨!武术冠军自掏腰包拍武侠片,成本超1500万,4天票房仅169万

靠谱电影君 浏览 3690

"商务部公告附件首次改为wps格式"不实 至少5年前已用

极目新闻 浏览 7957

【中超】恩里克2球迪力穆拉提世界波 梅州1比4玉昆

体坛周报 浏览 3597

零跑D19豪华旗舰SUV完成申报,预计4月上市交付

IT之家 浏览 2614

广东U20 1-0上海U20,张志雄绝杀

懂球帝 浏览 3458

深度搜索如何学会自我监督:来自脑科学的启发

科技行者 浏览 2505

伊朗革命卫队呼吁为真主党领导人被杀“复仇”

参考消息 浏览 3181

特朗普:泽连斯基阻挠俄乌达成和平协议

环球网资讯 浏览 2663

豆包手机助手宣布将部分调整AI操作能力

中新经纬 浏览 3017

美媒:特朗普政府再就霍尔木兹海峡拼凑国际联盟

上观新闻 浏览 300

韩国防部给出核潜艇下水时间点 此前韩国已向中方保证

澎湃新闻 浏览 16134

吃相难看!史晓燕曝何晴离婚有隐情,力挺许亚军

収起了底线 浏览 2986

《熊猫计划之部落奇遇记》春节档上映 成龙、马丽携手送欢乐

封面新闻 浏览 2483

固态电池量产提速!超千万新能源车主,竟成被割的 “老韭菜”?

数字财经智库 浏览 4383

26岁男子从杭州徒步回重庆过年 途经湖北获邀吃杀猪饭

极目新闻 浏览 6514

患者花费超14万手术 副主任医师把价值10万新器材扔了

重案组37号 浏览 4884

全球首座“来电岛”落地青岛:无人车住进“无人家”,一座城与新产业的双向奔赴

风口财经 浏览 240

胡润百富榜发布!刘永行、朱义、刘永好、刘汉元、张勇排川商前五

红星资本局 浏览 3606

还能复活?某上海新势力公司宣布预重整

汽车工程师 浏览 2567
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1