关闭广告

o1之后下一个范式?隐式CoT大突破,让推理不再「碎碎念」

机器之心Pro2413人阅读



魏熙林为本篇文章第一作者。魏熙林是复旦大学博士生,师从林达华教授,研究兴趣主要集中在 multi-modal LLMs 和 efficient AI。目前在上海人工智能实验室实习,指导 mentor 是臧宇航、王佳琦。

今天推荐一个 Implicit Chain-of-Thought(隐式推理) 的最新进展 ——SIM-CoT(Supervised Implicit Chain-of-Thought)。它直击隐式 CoT 一直「扶不起来」的核心痛点:隐式 token 一旦 scale 上去,训练就容易塌缩到同质化的 latent 状态,推理语义直接丢失。

SIM-CoT 的关键招式是一个 plug-and-play 的 step-level 监督模块:训练时用辅助解码器把每个 latent token「拉回」到可对齐的推理步骤上,既稳住优化、避免 collapse,又让隐式推理第一次真正可解释 —— 你甚至能把每个 latent token 解码成人类可读的中间推理步骤。

更爽的是:推理阶段零额外开销(辅助解码器训练完就丢),但效果却很猛:在 GPT-2 上相

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

美国"全面封锁"受制裁油轮 一艘油轮狂发75次求救信号

红星新闻 浏览 30121

别让丑内搭毁掉你的穿搭!这4款直接封神!

Yuki女人故事 浏览 2516

小米电竞鼠标2官宣搭载专属原相全新旗舰传感器PAW3955XM

IT之家 浏览 353

台湾省金钟奖成了“照妖镜”,小S拿奖后,破防人算是照明白了

娱乐圈笔娱君 浏览 3709

特朗普发布“致命打击”画面 委内瑞拉:美国不宣而战

上观新闻 浏览 4436

杨振宁在京逝世死因披露 与妻子翁帆最后合影流出

乌娱子酱 浏览 7177

全运会男足:上海U20 3-2新疆U20,刘诚宇、蒯纪闻破门,李新翔绝杀

懂球帝 浏览 3350

梦天家居紧急刹车

富凯财经 浏览 2585

盐湖提锂的高原神话

诗与星空 浏览 531

中国趁低价狂买石油,什么信号?

米筐投资 浏览 2897

姆巴佩已完成职业生涯400球,为最年轻达成此成就球员

懂球帝 浏览 3038

马斯克谈AI未来:五年后手机和APP将消失,人类文明在模拟世界的存亡

深蓝财经 浏览 3489

毛不易演唱会撒圆形纸钱,本人:这吉祥吗?

一家说 浏览 4277

当反向过年走红 留在北京的网约车司机"狠狠捡漏"

第一财经资讯 浏览 19052

1-10月全球新能源汽车销量排名

大象新闻 浏览 3005

香港五级大火令人揪心 一众明星发声

天启大世界 浏览 2558

以军称已有87万巴勒斯坦人从加沙城撤离

环球网资讯 浏览 3740

记者:拓王之战转播源取自现场大屏,所以直播视角混乱+回放过多

懂球帝 浏览 3753

春天的衣服没必要买太多,准备几件"卫衣",舒适减龄又大方

静儿时尚达人 浏览 1078

丝巾的10种系法,爱美的女人必看

LinkFashion 浏览 503

国际化野心不减?信达生物拿下巨额BD,总额114亿美元创纪录,股价不涨反跌

时代周报 浏览 3714
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1