关闭广告

DeepSeek连发两篇论文背后,原来藏着一场学术接力

机器之心Pro2362人阅读



编辑|张倩、陈陈

2026 年 1 月过半,我们依然没有等来 DeepSeek V4,但它的模样已经愈发清晰。

最近,DeepSeek 连发了两篇论文,一篇解决信息如何稳定流动,另一篇聚焦知识如何高效检索。

第一篇论文(mHC)出来的时候,打开论文的人都表示很懵,直呼看不懂,让 AI 助手用各种方式讲给自己听。我们也翻了翻网友的讨论,发现理解起来比较透彻的办法其实还是要回到研究脉络,看看这些年研究者们是怎么接力的。要理解第二篇论文(Conditional Memory)也是如此。

于是,我们就去翻各路研究者的分析。这个时候,我们发现了一个有意思的现象:DeepSeek 和字节 Seed 团队的很多工作其实是存在「接力」的 ——mHC 在字节 Seed 团队 HC(Hyper-Connections)的基础上进行了重大改进;Conditional Memory 则引用了字节 Seed 的 OverEncoding、UltraMem 等多项工作。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

900V架构打造 莲花ForMe将于3月29日上市

车质网 浏览 1458

2025年热销的十款新能源车 卖得好真不是靠吹牛?

汽车天涯 浏览 2233

“空中货拉拉”首飞背后:无人运输机争食1.5万亿元低空经济“蛋糕”

上游新闻 浏览 2395

新一代理想L9电池加码体型加大 重夺高端话语权

网易汽车 浏览 2225

年度最扎心电影,看得中年男女坐立难安

Yuki女人故事 浏览 2296

三年半亏19亿,超90%订单依赖聚合平台,享道出行IPO底气在哪儿?

尺度商业 浏览 3247

埃迪-豪联赛对前东家伯恩茅斯7场不胜,并列英超最长纪录

懂球帝 浏览 4195

媒体:34岁印度穆斯林后裔拿下纽约 令特朗普感到畏惧

南风窗 浏览 33044

不满国安糟糕战绩,工体北看台球迷连唱三首歌表达抗议

懂球帝 浏览 3227

麦肯尼:没能拿下3分很遗憾;新教练带来了新的理念和活力

懂球帝 浏览 3168

欧洲多国讨论部署军队 格陵兰岛坚称"不做美国人"

环球网资讯 浏览 2323

新版《聊斋》杀青,六个单元主演全亮相,林允、宋祖儿倾力加盟

最爱酷影视 浏览 4163

苹果CEO库克上海两日行:看LABUBU,首次“直播带货”,直言“太爱中国人和中国文化”

澎湃新闻 浏览 3535

辽宁2将打强队太吃力!王岚嵚组织与得分全垮,付豪进攻失灵了!

篮球资讯达人 浏览 2286

华语乐坛,困在怀旧里

虎嗅APP 浏览 2643

福特烈马增程版申报信息曝光: 1.5T增程+弗迪电池

网易汽车 浏览 3453

去年上海人工智能产业规模预计超5500亿元,增速超30%

澎湃新闻 浏览 2433

今年秋冬最美的搭配:毛衣+裙子,减龄又气质!

LinkFashion 浏览 3321

古二反击《繁花》!新录音曝光打脸秦雯,业内直言压榨新人是常态

萌神木木 浏览 3465

2025全球十大工程成就发布,DeepSeek、人形机器人等入选

澎湃新闻 浏览 3470

美防长称外国要在美国本土建军事基地 惹怒特朗普拥趸

新民周刊 浏览 6321
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1