关闭广告

澳大利亚国立大学发现:攻击AI视觉模型只需要操控20%的关键词汇

科技行者2285人阅读


这项由澳大利亚国立大学领导的国际研究团队发表于2025年12月26日的arXiv预印本论文(编号:2512.21815),揭示了一个令人担忧的发现:当今最先进的AI视觉语言模型存在一个严重的安全漏洞,攻击者只需要巧妙地操控20%的关键词汇,就能让这些本应安全可靠的AI系统产生有害内容。

考虑这样一个场景:你正在使用一个AI助手来描述图片内容,比如一张街头摩托车的照片。正常情况下,AI会告诉你"这是一个繁忙的城市街道,有几个人骑着摩托车,他们都戴着头盔"。然而,经过特殊设计的微小图像修改后,同一个AI可能会说出完全不同且危险的内容,声称图片中出现了暴力场景或其他有害内容。更令人担忧的是,这种攻击不需要修改整个AI系统,仅仅针对生成文本中20%的特定位置进行干预就足够了。

研究团队通过深入分析发现,这些AI模型在生成描述时,并非每个词汇都同样重要。就像一个故事中有些情节转折点特别关键一样,AI在生成文本时也有一些"决策点",这些点上的词汇选择会极大影响整个叙述的走向。这些关键位置被研究人员称为"高熵位置",类似于岔路口,选择不同的道路会通向完全不同的目的地。

更加令人不安

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

Unity 中国官宣与零跑汽车合作,打造下一代智能座舱交互体验

IT之家 浏览 3169

ESPN:德容已与巴萨就续约达成协议,他的薪水将降低

懂球帝 浏览 3379

优必选联手云智汇科技 加速人形机器人全球布局

财闻 浏览 4079

特朗普:美国还将增加航空母舰数量

每日经济新闻 浏览 2526

国米官方:劳塔罗当选球队12月队内最佳球员

懂球帝 浏览 2359

哈梅内伊次子当选伊朗最高领袖 以色列扬言要"追杀"

国际在线 浏览 1492

347亿市值三一重能,80后出任董事长,身家超过4.7亿

华美财经 浏览 3149

特朗普涉俄乌冲突再次表态:有时候必须让他们打到底

鲁中晨报 浏览 8244

从每天只睡4小时到8小时:一个失眠者的自救指南

黎贝卡的异想世界 浏览 1565

虐囚事件发酵高官引咎辞职 以总理称遭"严重公关危机"

上观新闻 浏览 3229

甲骨文业绩不及预期,资本开支比预期多约150亿美元,盘后重挫超10%

华尔街见闻官方 浏览 2763

26款奔驰S级入门版不足90万起!外观豪华大气,搭载2.5T+48伏轻混

小史谈车 浏览 2286

漆面个性 全新定制迈凯伦750S Spider发布

车质网 浏览 2735

申花保住中超颜面!跃居东亚第5,打破首尔不败纪录,连破2魔咒

奥拜尔 浏览 3380

坑惨!史上最大投资欺诈案,让汇丰三季度少赚78亿

财通社 浏览 3220

冬天要有的鞋子!显高!显腿长!还显瘦!

Yuki女人故事 浏览 2608

黄一鸣才真清醒,大四怀孕不做“首富太太”

柠檬有娱乐 浏览 2789

性压抑时代,搞黄色成了AI的第一生产力

虎嗅APP 浏览 2233

Prada如何解构身体与气质?

时尚COSMO 浏览 5175

全球第一大女主,让内娱彻底红了眼

独立鱼 浏览 2324

记者:在对阵多特的欧冠比赛中,热刺将缺阵15人

懂球帝 浏览 2242
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1