关闭广告

清华大学提出NHA:让AI语言模型既快又准的"双重记忆"新架构

科技行者3164人阅读


这项由清华大学杜举森、胡佳熹、张涛教授,上海人工智能实验室孙维高研究员,以及香港中文大学程余教授共同完成的研究发表于2025年10月的arXiv预印本平台,论文编号为arXiv:2510.07019v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

当你使用ChatGPT或其他AI语言模型时,有没有想过它是如何记住你前面说过的话的?就像人类既有短期记忆又有长期记忆一样,AI模型也需要处理眼前的信息和遥远的上下文。但现有的AI模型在这方面存在一个两难问题:要么像传统的Transformer模型一样记住所有细节但速度极慢,要么像线性模型一样速度很快但容易忘记重要信息。

研究团队提出了一种名为"原生混合注意力"(Native Hybrid Attention,简称NHA)的全新架构,巧妙地解决了这个难题。这就好比给AI配备了一套"双重记忆系统":一个像照相机一样精确记录最近发生的事情,另一个像日记本一样压缩保存长期的重要信息。更巧妙的是,这套系统能够根据当前需要自动决定更多地依赖哪种记忆,而不需要人工设定固定的规则。

传统的混合模型通常是将两种不同的注意力机制分别计算,

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

外媒:“多国空军排队购买‘枭龙’战机”

环球网资讯 浏览 2276

【原声】阿韦洛亚,最后一个穆里尼奥主义者

体坛周报 浏览 2146

整车34.98万元/租电24.18万元,蔚来新ES6 30万台纪念版上市

IT之家 浏览 2773

272马力四驱 全新一汽奥迪Q5L高功率实车曝光

网易汽车 浏览 3410

马竞新援奥贝德:我完全服从教练的战术安排;偶像是格列兹曼

懂球帝 浏览 2053

律所主任疑"借款"9亿失联 客户有上百人最年长者88岁

界面新闻 浏览 6746

跨省调查结束!被延期留置150天后,德州首富平安返岗

壹只灰鸽子 浏览 3099

丰田新款Land Cruiser FJ最新消息曝光

乐选爱车 浏览 2678

董路:中国足球是学渣!不用请高水平教练,米卢80多岁还能来捞钱

念洲 浏览 3458

伊朗称美国在伊核问题上“没有认真的谈判态度”

国际在线 浏览 2939

四名日本U17国脚在阿贾克斯试训,并与富安健洋、板仓滉合影

懂球帝 浏览 1674

20名以色列被扣押人员将分两批获释

CCTV国际时讯 浏览 3448

一年狂揽60亿融资!13大玩家厮杀无人配送,阿里京东美团都入局了

车东西 浏览 2126

码住抄作业!春节见人不翻车就靠这8样!

Yuki女人故事 浏览 2273

小红书社区公约2.0里的「UGC社区进化史」

周天财经 浏览 2226

抗日名将孙立人次子已正式向大陆申请 将父亲迁葬故里

环球时报新闻 浏览 15268

全球限量25台 Bertone Runabout量产版发布

车质网 浏览 2211

蔚来艰难求盈利

北京商报 浏览 2804

人道局势持续恶化 加沙停火能否进入第二阶段尚存变数

国际在线 浏览 2415

俄总统助理:俄方移交1003具乌军士兵遗体

新华社 浏览 2624

甘肃退伍老兵,抱紧黄仁勋,狂揽上千亿

华商韬略 浏览 2210
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1