关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者2652人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

营收净利双增、高股息估值,伊利股份进入「戴维斯双击」时刻

节点财经 浏览 189

伊萨克遭范德芬剪刀脚,伤病分析师:前者很大可能伤缺8-10周

懂球帝 浏览 2894

月销暴跌至不到50辆 小米SU7 Ultra专属销售团队解散

大象新闻 浏览 98265

中际旭创大股东拟高位减持22亿,机构持仓已提前“释压”

第一财经资讯 浏览 4342

无需多视角,单图重建可交互3D模型!南洋理工开源结构推理框架

新智元 浏览 766

IPO带病闯关遭通报批评未满一年 英虎机械重启资本路欲挂牌新三板

叩叩财讯 浏览 3799

30万的玛莎拉蒂,被一抢而空!超跑皇后暴击中国人

象视汽车 浏览 2975

天空:西汉姆联将继续信任努诺,俱乐部今天开会讨论引援问题

懂球帝 浏览 2599

以色列强调人质释放 加沙停火第一阶段协议达成

环球网资讯 浏览 3769

央视点名!这5位艺人现原形?

君笙的拂兮 浏览 3659

新卡罗拉锐放/腾势N8L/星耀6 三天10款新车密集上市

网易汽车 浏览 3745

爱奇艺发布2026年分账内容合作新规

封面新闻 浏览 2565

AI+消费电子硬核“出圈”,华强北亮相CEIC 2025

南方都市报 浏览 3597

成都天府国际空港综合保税区通过验收

央视财经 浏览 2642

啃下数百万骑手社保的“硬骨头”,美团花了五年

雪豹财经社 浏览 3505

埃尔多安指责以色列违反加沙停火协议

新华社 浏览 3630

达姆施塔特工业大学发布SCICOQA数据集

科技行者 浏览 2486

雷军谈被贴“营销大师”标签:这事得“怪刘强东”

三言科技 浏览 2728

车主针对FSD功能起诉特斯拉案将开庭:要求退一赔三

新京报 浏览 9141

72岁唐僧迟重瑞卖房,580亿财产成了笑话?

胡一舸南游y 浏览 3501

发投入同比“八连增”,贝壳Q3财报研发投入增长13.2%

市值Observation 浏览 3377
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1