关闭广告

DeepSeek连发两篇论文背后,原来藏着一场学术接力

机器之心Pro2360人阅读



编辑|张倩、陈陈

2026 年 1 月过半,我们依然没有等来 DeepSeek V4,但它的模样已经愈发清晰。

最近,DeepSeek 连发了两篇论文,一篇解决信息如何稳定流动,另一篇聚焦知识如何高效检索。

第一篇论文(mHC)出来的时候,打开论文的人都表示很懵,直呼看不懂,让 AI 助手用各种方式讲给自己听。我们也翻了翻网友的讨论,发现理解起来比较透彻的办法其实还是要回到研究脉络,看看这些年研究者们是怎么接力的。要理解第二篇论文(Conditional Memory)也是如此。

于是,我们就去翻各路研究者的分析。这个时候,我们发现了一个有意思的现象:DeepSeek 和字节 Seed 团队的很多工作其实是存在「接力」的 ——mHC 在字节 Seed 团队 HC(Hyper-Connections)的基础上进行了重大改进;Conditional Memory 则引用了字节 Seed 的 OverEncoding、UltraMem 等多项工作。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

埃泰克IPO:智能座舱业务驱动营收创新高,客户资源稳步扩展

时代周报 浏览 2252

萨高大战流产!萨巴伦卡将挑战赛变授课堂,高芙被小白菜扫成服妹

网球之家 浏览 2194

韩国称朝鲜有2吨高浓缩铀 中方回应

北京日报 浏览 3963

端侧AI赋能千行百业 2025 Ceva技术研讨会助力产业升级

爱集微 浏览 3076

德国就"夺岛"发声:国际法原则适用所有国家 包括美国

澎湃新闻 浏览 12882

理想汽车1月交付27668辆 巩固高端增程基本盘

网易汽车 浏览 2063

美国副防长将访日 或要求日本提高防卫费

上观新闻 浏览 2248

拉姆塞:我的合同被美洲狮终止了,这令我感到意外且失望

懂球帝 浏览 2592

刘嘉玲问刘晓庆:现在接戏的角色是否有限?

红星新闻 浏览 3530

英伟达GTC大会利好兑现?CPO板块大跌

财闻 浏览 1243

杜兰特:超巨不在于名号而在于表现 我想一直打球直到再也打不动

罗说NBA 浏览 2636

千亿巨头奖励员工21枚黄金键帽 空格键重35克价值近4万

每日经济新闻 浏览 9041

科学家发现世界最大蜘蛛网 面积约106平方米

极目新闻 浏览 8505

烂番茄68%,《阿凡达2》导演的套路失灵了

瓜农娟姐 浏览 2654

多地紧急叫停"刨猪宴"活动 地方政府被指陷入两难困境

中国新闻周刊 浏览 11867

稀土是啥?为啥是中国王牌?

混知财经 浏览 2869

单反绝唱:优雅技艺在职业网坛的黄昏

网球之家 浏览 3139

演员金莎和孙丞潇官宣结婚 两人相差17岁

极目新闻 浏览 60084

马卡:塞尔塔公布本赛季5名队长人选及顺位 阿斯帕斯仍是第一队长

直播吧 浏览 4207

东升西降?拆解全球车企三季报,中国车企业绩更稳

大李说车 浏览 2929

巴尔韦德:皇马有我信任的理疗师,我都听他的

懂球帝 浏览 1393
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1