爆点资讯

这是一个关于人工智能如何学会更好地思考的故事。想象一下，你在教一个聪明但有点"散漫"的孩子做数学题。这个孩子通常能猜对答案，但他的推理过程常常有漏洞——他会说"因为看起来对所以就对了"，而不是真正理解为什么。如今，来自香港科技大学、上海人工智能实验室、浙江大学和香港浸会大学的研究团队发现了一个巧妙的办法，让这个"散漫的孩子"学会了像数学家一样严谨地思考。这项研究发表于2026年1月，论文编号为arXiv:2601.22642。

这个故事的核心很有趣：当今最强大的语言模型，比如ChatGPT和Claude，在处理复杂推理问题时，常常会犯一个致命的错误。它们会生成看似合理但逻辑上存在严重漏洞的答案。研究人员的发现更是令人担忧——即使在最终答案是对的情况下，推理过程中有39.3%的步骤在形式化验证中被"驳回"了。而当答案错误时，这个比例甚至高达52.4%。这就像一个学生虽然最后得到了正确答案，但他的计算过程完全是错的——纯粹是靠运气或者模式识别碰巧得对了。

研究团队的创新之处在于，他们不是简单地让AI生成答案就完事，而是在推理的每一步都加入了一个"严厉的数学老师"——形式化验证系统。这个"老师"会实时检查每

香港科技大学团队发现形式化验证如何让AI推理更聪明

中航成飞：第...

一场战事三...

比亚迪第一/...

太突然，宜家...

延迟写《南京...

强奸大嫂凶手...

今日热点：电影《飞驰人生3》定档春节；大麦否认与黄牛挂钩……

陈思诚又出手了！新片请来陈道明朱一龙，要掀起谍战片新高潮了

偶像的力量！锡安：普尔最爱艾弗森他的突破有AI的影子

租电版本售15.79万乐道L60紫罗兰限定版上市

摩托罗拉Edge 70 Ultra现身Geekbench，处理器或有新情况

小鹏机器人首秀摔了此前因步态太拟真被疑＂真人套壳＂

政务大模型部署，重磅文件印发

内塔尼亚胡遭遇“全球孤立” 联大发言多国代表离席

SU7失控起火致1死小米官方和雷军始终未直接回应

伊朗外长：就伊朗核问题达成协议的唯一途径是外交

跨境网赌大佬佘智江将被引渡回中国被指曾参与KK投资

马杜罗被指遭＂发小＂出卖委＂二号人物＂疑与美接触数月

千亿豪赌，甲骨文会成“甲骨文”？

拼多多“千亿扶持”落地半年，“包邮区”持续扩大，更多地区享受便利网购服务

10月工信部新车申报：小鹏/奥迪/吉利等多款车型在列！

马德兴：张瑷晖因脚踝受伤没参加U23国足第二日的合练

跟队：纽卡vs巴萨赛前发布会上加泰记者很放松，还有人接电话

针对“美式讹诈”：中国为何率先发动反制？

日本官宣美将在日部署中导系统

晚点独家丨千问 app，阿里要怎么做中国的 “ChatGPT”

媒体：特朗普最新表态后岛内绿营慌了担心其＂卖台＂

《双轨》空降逻辑混乱，赛车泰拳伪骨科叠加，虞书欣演技难撑人设

预售11.28万起狐全新阿尔法S5标配宁德时代

特朗普涉俄乌冲突再次表态：有时候必须让他们打到底