关闭广告

o1之后下一个范式?隐式CoT大突破,让推理不再「碎碎念」

机器之心Pro2417人阅读



魏熙林为本篇文章第一作者。魏熙林是复旦大学博士生,师从林达华教授,研究兴趣主要集中在 multi-modal LLMs 和 efficient AI。目前在上海人工智能实验室实习,指导 mentor 是臧宇航、王佳琦。

今天推荐一个 Implicit Chain-of-Thought(隐式推理) 的最新进展 ——SIM-CoT(Supervised Implicit Chain-of-Thought)。它直击隐式 CoT 一直「扶不起来」的核心痛点:隐式 token 一旦 scale 上去,训练就容易塌缩到同质化的 latent 状态,推理语义直接丢失。

SIM-CoT 的关键招式是一个 plug-and-play 的 step-level 监督模块:训练时用辅助解码器把每个 latent token「拉回」到可对齐的推理步骤上,既稳住优化、避免 collapse,又让隐式推理第一次真正可解释 —— 你甚至能把每个 latent token 解码成人类可读的中间推理步骤。

更爽的是:推理阶段零额外开销(辅助解码器训练完就丢),但效果却很猛:在 GPT-2 上相

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

上半年超七成二手车经销商亏损,二手车的未来在哪里?

江瀚视野 浏览 3748

法兰克福左后卫布朗:我们依靠整体防守萨拉赫,而不是我单防

懂球帝 浏览 3640

VOGUE热捧刘亦菲被反噬,20周年众多大咖不出席,场面太尴尬!

萌神木木 浏览 2988

综合续航超1500km 加方盒子车身 智己LS9即将上市!

车品 浏览 3363

古二反击《繁花》!新录音曝光打脸秦雯,业内直言压榨新人是常态

萌神木木 浏览 3714

45岁潘玮柏好福气!34岁老婆宣云温柔又独立

体育小柚 浏览 3352

告别卡粉斑驳!保姆级遮瑕教程,手把手教你黑眼圈痘印全隐形

Yuki女人故事 浏览 2609

媒体:特朗普2.0亚洲"首秀" 重中之重还是与中国有关

上观新闻 浏览 9052

媒体:伊朗战争或成美国第一次不敢打接触战的战争

澎湃新闻 浏览 1048

卡扎菲儿子被暗杀身亡:4名蒙面人员闯入住所激烈交火

红星新闻 浏览 102787

真有品味的中年女人,穿衣打扮都有这4个共同点,你中了吗?

静儿时尚达人 浏览 3837

尼帕病毒沸水加热15分钟可灭活

第一财经资讯 浏览 2407

美媒:美国曾以为贸易战能改变中国经济 但它错了

环球时报国际 浏览 14565

给《树影迷宫》演技最好的7位演员排座次:刘琳第3,第1无法超越

娱乐圈笔娱君 浏览 3353

城区油耗2L级 长安逸动/CS75 PLUS蓝鲸超擎抢订价7.99万起

网易汽车 浏览 576

美国中央司令部透露对伊朗动武全部武器装备清单

参考消息 浏览 1918

邮报:未来几战将决定波特去留,他若下课西汉姆已在考虑比利奇

直播吧 浏览 4468

马杜罗在纽约法院首次出庭,对贩毒等指控表示"不认罪"

华尔街见闻官方 浏览 2760

制造“车贷七年之痒”,车企转向“金融战”

禾颜阅车 浏览 2526

青海女官员于媛媛被"双开":生活奢靡 大搞权钱交易

鲁中晨报 浏览 9570

李湘账号被封;蔡依林鸟巢开唱:张水华直播道歉

娱乐圈那档子事儿 浏览 2630
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1