关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者2358人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

科学家发现首批 45 亿年前“原始地球”痕迹,揭示太阳系早期秘密

IT之家 浏览 3350

何猷君为6岁儿子何广燊庆生,儿子神似赌王

王稱吃吃喝喝 浏览 3320

李湘账号被封;蔡依林鸟巢开唱:张水华直播道歉

娱乐圈那档子事儿 浏览 2294

微信不敢加的功能,腾讯把它塞进了这个新App里。

差评XPIN 浏览 2229

“50%汽车芯片由格力产品替代”?广汽回应

第一财经资讯 浏览 2279

英伟达发布Alpamayo汽车大模型平台 黄仁勋:这是机器理解现实世界的转折点

快科技 浏览 2398

小米澎湃OS 3上线2026年元旦限定水印,三种版式自由选择

IT之家 浏览 2269

消费降级2年,大家2025年还会买什么?

黎贝卡的异想世界 浏览 3322

“沙僧”刘大刚去世!生前最后露面消瘦,去年师徒合体表演成绝唱

萌神木木 浏览 3161

赵丽颖玩大了!《小城大事》预告信息量炸裂,不愧是争剧王的大剧

娱乐圈笔娱君 浏览 2416

纯电汉兰达?丰田发布新款SUV预告,向新时代低头?

正在说车 浏览 2152

泰军方:已初步控制泰柬边境一处关键高地

上观新闻 浏览 2559

以总理:将确保哈马斯解除武装

国际在线 浏览 3363

调查高通,开辟第二战场

博闻财经 浏览 3483

质选车:丰田RAV4荣放以全球品质再续辉煌

车质网 浏览 2622

罗马诺:尤文等5队有意明格萨,塞尔塔目前不想将其出售

懂球帝 浏览 2311

3岁女童16楼走道坠亡 父母起诉开发商、物业索赔51万

红星新闻 浏览 15564

杰伦-约翰逊登顶老鹰队史三双榜 “新鹰王”已悄然诞生

仰卧撑FTUer 浏览 2752

39岁李思思离开央视两年,商演小县城不摆架子

范櫳舍长 浏览 1679

57岁具俊晔又瘦了很多,背影憔悴走路不稳

素素娱乐 浏览 323

伊朗陆军司令:伊斯法罕省行动失败是敌方停火主因

界面新闻 浏览 314
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1