关闭广告

东南大学突破:AI学会情境化拒绝能力

科技行者3410人阅读


由东南大学计算机科学与工程学院的杨俊明、许宁、刘彪、乔世奇和耿新等研究者组成的团队,最近在人工智能领域取得了一项重要突破。这项研究发表于2025年,论文编号为arXiv:2509.23371v1,提出了一种名为MetaAPO(Meta-Weighted Adaptive Preference Optimization)的全新AI训练方法。有兴趣深入了解的读者可以通过该编号查询完整论文。

要理解这项研究的重要性,我们先来看一个生活中的例子。假设你正在教孩子学习做饭,你有两种教学资源:一套经典的家传菜谱(就像AI训练中的离线数据),还有让孩子实际动手练习的机会(就像在线生成的数据)。传统的AI训练方法就像只用家传菜谱或只让孩子盲目练习,而东南大学团队的新方法则像是配备了一位智慧的厨艺老师,这位老师能够根据孩子当前的水平,灵活决定什么时候该参考菜谱,什么时候该放手让孩子实践,从而让学习效果达到最佳。

当前的大型语言模型训练面临着一个根本性的挑战:如何让AI既能从人类已有的经验中学习,又能通过实践不断改进自己。这就像是在平衡传承与创新的关系。传统方法要么过度依赖预先收集的人类反馈数据,导致AI无法适应新情况;要么完全

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

起底西贝供应商:同款冷冻西兰花和海鲈鱼还卖给了谁

界面新闻 浏览 16105

端侧AI芯片公司2025市值图谱

爱集微 浏览 2224

何超莲窦骁合体撒糖,赴澳洲旅游被偶遇,有说有笑力破婚变传闻

扒虾侃娱 浏览 3055

插混加持 新款捷途旅行者C-DM本月17日上市

车质网 浏览 3175

硅谷高管消息群一夜未停 H-1B新规让美企慌了白宫找补

红星新闻 浏览 26130

菜鸟与蜜雪集团达成合作,为蜜雪打造AI供应链产品

财闻 浏览 2699

14岁女孩被同学杀害案择日宣判 被告人在庭上跪求原谅

潇湘晨报 浏览 7626

媒体:野田佳彦看到机会要对高市下手 高市有可能下台

新民周刊 浏览 6513

充电十分钟、续航2000公里!宁德时代宣布:2027年量产全固态电池

优视汽车 浏览 2895

前女友曝19岁荣梓杉出轨打人,男方评论区沦陷,网友喊话道歉退圈

扒虾侃娱 浏览 3489

2026款ICON巧克力"心动紫"上市 限时7.98万起

网易汽车 浏览 3299

俄总统新闻秘书:普京愿与特朗普在莫斯科会晤

环球网资讯 浏览 38675

18.68万起!新款小鹏G7/P7+增程版上市

网易汽车 浏览 2473

央视一姐董卿“陨落”!51岁的她成于自己

君笙的拂兮 浏览 3964

OpenAI完成重组!微软持股缩减至27%,市值再超4万亿美元

澎湃新闻 浏览 3150

中科大团队实现AI图表数学逻辑理解

科技行者 浏览 3133

何猷君为6岁儿子何广燊庆生,儿子神似赌王

王稱吃吃喝喝 浏览 3319

迪拜多地发生爆炸起火 当地停工停课

极目新闻 浏览 1557

《树影迷宫》给10位演员演技排个名

皮皮电影 浏览 3099

被自称前女友的网友实名举报涉毒 短剧"顶流":别搞我

极目新闻 浏览 6590

特朗普与普京长时间通话 “会晤”与“战斧”成话题

极目新闻 浏览 3474
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1