关闭广告

o1之后下一个范式?隐式CoT大突破,让推理不再「碎碎念」

机器之心Pro2960人阅读



魏熙林为本篇文章第一作者。魏熙林是复旦大学博士生,师从林达华教授,研究兴趣主要集中在 multi-modal LLMs 和 efficient AI。目前在上海人工智能实验室实习,指导 mentor 是臧宇航、王佳琦。

今天推荐一个 Implicit Chain-of-Thought(隐式推理) 的最新进展 ——SIM-CoT(Supervised Implicit Chain-of-Thought)。它直击隐式 CoT 一直「扶不起来」的核心痛点:隐式 token 一旦 scale 上去,训练就容易塌缩到同质化的 latent 状态,推理语义直接丢失。

SIM-CoT 的关键招式是一个 plug-and-play 的 step-level 监督模块:训练时用辅助解码器把每个 latent token「拉回」到可对齐的推理步骤上,既稳住优化、避免 collapse,又让隐式推理第一次真正可解释 —— 你甚至能把每个 latent token 解码成人类可读的中间推理步骤。

更爽的是:推理阶段零额外开销(辅助解码器训练完就丢),但效果却很猛:在 GPT-2 上相

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

鸿蒙智行发布“性能车”预告图,对手锁定小米SU7!

汽车消费网 浏览 3173

脱口秀演员杨笠清空社交账号 她到底经历了什么?

代军哥哥谈娱乐 浏览 3985

你从托马斯·穆勒身上吸取教训了吗?

绿茵情报局 浏览 3160

思想实验成真!量子江湖百年对决见分晓,中科大勘破波粒玄机笑傲江湖|光锥读论文

未来光锥 浏览 3594

1-9月主流车企销量成绩单,比亚迪326万辆完成全年71%

分秒汽车 浏览 4298

成龙称以前对儿子太严格了 现在只希望平安开心

韩小娱 浏览 3415

徐正源:永不言弃是成都强大的DNA 韦世豪伤情要等明天才有结果

直播吧 浏览 4974

中马智库机构在吉隆坡举行交流座谈 探讨区域研究与合作

BT财经 浏览 2319

韩鹏:很高兴能战胜争冠球队,全体球员的发挥都非常出色

懂球帝 浏览 4167

王楚钦退赛:突然背部不适 一度不太能动得了

北京日报 浏览 8483

小高领,现在穿刚刚好

Yuki女人故事 浏览 3004

民调显示:相较美国,加、德、法、英四国民众更信赖中国

环球网资讯 浏览 2233

土耳其下令拘捕内塔尼亚胡 以色列外长公开回应

新京报评论 浏览 9907

没有商业模式--DeepSeek最坚固的“护城河”

华尔街见闻官方 浏览 3169

英伟达H100刚上天,谷歌Project Suncatcher也要将TPU送上天

机器之心Pro 浏览 3995

小鹏GX连续49道弯一把过挑战成功,低速最小0.6圈转向比

IT之家 浏览 979

伊朗:最高领袖穆杰塔巴全面掌控局势

国际在线 浏览 901

账面1000多亿,却隐藏20多年,整个互联网都找不到它长什么样

壹只灰鸽子 浏览 3109

特朗普或为中国制造三大机遇,中国如何利用?

浏览 27133

王牌4年3冠!威尔逊单年包揽MVP+DPOY+FMVP全满贯

体坛周报 浏览 4497

“工业机器人曾是日本的堡垒,但中国已开始在新轨道上竞争”

观察者网 浏览 3635
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1