关闭广告

苏州大学突破:8B模型实现长文理解媲美GPT-4o

科技行者3430人阅读


当我们阅读一本厚厚的小说时,大脑会自动筛选重要情节,忽略无关细节。然而,人工智能在处理长文本时却常常"迷失在细节中",就像一个初读者被海量信息淹没,难以抓住关键要点。现在,苏州大学的研究团队找到了解决这个问题的巧妙方法,他们提出的"语境降噪训练"技术,让AI模型学会了像经验丰富的读者一样,在冗长文本中精准定位关键信息。

这项由苏州大学唐泽成、季百倍、李俊涛等研究人员主导的突破性研究,于2025年1月发表在机器学习顶级预印本平台arXiv上(论文编号:arXiv:2510.05862v1)。令人振奋的是,通过他们的训练方法,一个仅有80亿参数的开源模型在处理长文本任务时,竟然达到了与GPT-4o相当的表现水平。这就好比一个刚入学的学生,通过特殊的学习方法,在阅读理解能力上追平了博士生。

长文本处理一直是AI领域的"老大难"问题。传统的语言模型在面对超长文档时,往往会被无关信息干扰,就像在嘈杂的派对上试图听清某个特定的对话一样困难。研究团队发现,这些模型虽然能"看到"整篇文档,却无法有效区分哪些内容真正重要,哪些只是"噪音"。

为了解决这个问题,研究人员开发了一种名为"语

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

枭龙突防S-400:中械武器如何改写印巴冲突

浏览 7600

女友BELLA+封面 | aespa GISELLE: 以努力为名的青春

伊周潮流 浏览 3668

刚性需求凸显,新型储能产业发展按下快进键!多家企业加码布局

览富财经网 浏览 1803

"太子集团"头目被指曾遭手下"黑吃黑" 后者已申请破产

红星新闻 浏览 8694

留几手为闫学晶叫屈?称网友自卑敏感

小徐讲八卦 浏览 2686

伊朗就新的最高领袖人选作出最终决定

新华社 浏览 1705

版博会观察:冰箱贴凭啥成文创顶流?AI+版权如何焕新意?

南方都市报 浏览 3686

陈乔恩带老公和父母聚餐,Alan负责拍照

黄谋仕 浏览 2727

“羽绒服+半身裙”,混搭风太好看了!保暖又气质!

Yuki女人故事 浏览 2766

一场战事 三重短缺冲击全球经济

上观新闻 浏览 741

曾获专班支持的“座上宾”,如今被追要1.4亿元投资款!光伏龙头50亿元项目推进不利,收地方政府“听证通知书”

每日经济新闻 浏览 2801

51岁的何炅自曝非常痛苦,如今谁都救不了他?

小梊搞笑解说 浏览 3733

“复古知识分子风”正流行,这5件单品谁穿谁时髦!

LinkFashion 浏览 2975

邱泽妈妈没想到 这个女人竟把她儿子狠狠“拿捏”

黄小仙的搞笑视频 浏览 3074

卖房炒股后,韩国股市快翻倍了

大猫财经Pro 浏览 2586

真情侣就是好嗑,短剧界有多少“因戏生情”的cp?

仙女事件簿 浏览 3614

李梦系穿搭,就这么养成了

时尚COSMO 浏览 2186

记者:阿根廷19岁中卫托维亚斯-拉米雷斯没考虑去迈阿密国际

懂球帝 浏览 2418

特朗普威胁对尼日利亚动武 中方表态

极目新闻 浏览 3466

拜仁高层:希望凯恩长期为拜仁效力

体坛周报 浏览 4337

中国犀旺队|欧塞尔共研青训,法国集训圆满结束 

绿茵情报局 浏览 1066
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1