关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者2357人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

女子结婚14年被丈夫打了13年 丈夫:我才是受害者

中国新闻周刊 浏览 13672

中国女足在进攻三区传球成功率仅为64%,为四强球队中最低

懂球帝 浏览 1355

英伟达“跌倒”,寒武纪“吃饱”?

经济观察报 浏览 3416

搭载1.5T发动机 奇瑞瑞虎5运动版官图发布

车质网 浏览 1479

赵丽颖新剧收视走势差,表演短板全暴露,后续没存货半年没进组

萌神木木 浏览 2362

邓卓翔:球员状态并不让人满意,技战术也没有可圈可点的地方

懂球帝 浏览 3083

最强“卖铲人” 寒武纪靠AI芯片疯狂掘金

21世纪经济报道 浏览 4003

李平康:国安在谈一名东欧外教,其人在北京&还是以前的渠道

懂球帝 浏览 3189

又一部国产剧,靠「擦边」火出圈了

独立鱼 浏览 2031

特朗普发起新一轮无差别攻击 外媒:中国巴西受益最大

澎湃新闻 浏览 37726

天津外援阿代米谈胜利:现在要做的是忘掉这一场比赛,准备下一场

直播吧 浏览 4094

荣耀 MagicPad3 Pro 13.3 平板电脑核心参数公布:165Hz LCD 面板

IT之家 浏览 3913

推广|| 被低估的百元级国货!推荐你们趁好价试试

黎贝卡的异想世界 浏览 5148

上海女子"喊冤"汽车压上石头爆胎无人赔偿 网友吵翻了

环球网资讯 浏览 8133

以总理办公室:内塔尼亚胡28日将启程访美

上观新闻 浏览 2021

五万亿的英伟达

诗与星空 浏览 3196

德容:弗里克很有个性,他思路非常清晰、平易近人

懂球帝 浏览 3450

老鹰124-112魔术豪取10连胜,沃克41分,杰伦约翰逊三双,班凯罗13中3

懂球帝 浏览 1346

孙艺珍最新生图撞脸老公玄彬,43岁显出老态,剪短发装嫩太违和

萌神木木 浏览 3444

诋毁蚂蚁集团,粉丝超1亿“专家”被封禁,什么信号?

一见财经 浏览 708

江苏88-84逆转天津获赛季首胜,庞峥麟34分,贾尔斯25+13

懂球帝 浏览 2567
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1