关闭广告

DeepSeek连发两篇论文背后,原来藏着一场学术接力

机器之心Pro2697人阅读



编辑|张倩、陈陈

2026 年 1 月过半,我们依然没有等来 DeepSeek V4,但它的模样已经愈发清晰。

最近,DeepSeek 连发了两篇论文,一篇解决信息如何稳定流动,另一篇聚焦知识如何高效检索。

第一篇论文(mHC)出来的时候,打开论文的人都表示很懵,直呼看不懂,让 AI 助手用各种方式讲给自己听。我们也翻了翻网友的讨论,发现理解起来比较透彻的办法其实还是要回到研究脉络,看看这些年研究者们是怎么接力的。要理解第二篇论文(Conditional Memory)也是如此。

于是,我们就去翻各路研究者的分析。这个时候,我们发现了一个有意思的现象:DeepSeek 和字节 Seed 团队的很多工作其实是存在「接力」的 ——mHC 在字节 Seed 团队 HC(Hyper-Connections)的基础上进行了重大改进;Conditional Memory 则引用了字节 Seed 的 OverEncoding、UltraMem 等多项工作。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

法式纯电钢炮 2026款标致E-308 GT新车图解

车质网 浏览 4295

伊朗向美军舰发射的导弹上写了句话 特朗普再发威胁

每日经济新闻 浏览 30354

雷军辟谣:小米SU3渲染图肯定是假的 目前还没有规划

太平洋汽车 浏览 2731

武汉理工毕业生称因当保安遭学校约谈 本人否认蹭流量

封面新闻 浏览 6964

被娱乐圈催熟的林妙可王诗龄!

八星人 浏览 2656

伊朗伊斯兰革命卫队:击落一架美军搜救飞机

财联社 浏览 1027

RT-Thread熊谱翔:开源是国产操作系统构建生态的最佳路径

观察者网 浏览 2656

无人驾驶获《时代》2025最佳发明奖:萝卜快跑、谷歌、特斯拉全球竞速

上观新闻 浏览 3876

男子疑心梗住院被急诊医生误诊 转入普通病房后身亡

大风新闻 浏览 13397

穆西亚拉庆祝梦幻回归

绿茵情报局 浏览 2682

殷桃|每个表情都让人欲罢不能

农城浪子 浏览 2715

特朗普证实:已授权中情局行动

澎湃新闻 浏览 3776

农夫山泉的冰杯,比哈尔滨冰雪大世界的冰还赚钱?

BT财经 浏览 2688

超450亿元!603906,锂电大单

中国基金报 浏览 3258

网友广州偶遇汪小菲带娃逛动物园

萧鑟科普解说 浏览 2435

何超莲豪宅度中秋,阖家团圆唯独不见窦骁?

不八卦会死星人 浏览 3366

新势力比传统车企更乐观,2026年车市充斥着哪些挑战?

汽车头条APP 浏览 2466

E句话|她回应已分手,这俩原来真谈过?!

仙女事件簿 浏览 2719

smart精灵#3艺术特别版上市售18.49万

网易汽车 浏览 2513

双14.6英寸联屏 星越L长风系列上市限时价12.47万起

网易汽车 浏览 1821

专家:俄乌“和平计划”应触及冲突发生深层原因

环球网资讯 浏览 3164
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1