关闭广告

上海AI实验室推出ATLAS:让AI在科学推理中"败下阵来"的超级考场

科技行者2642人阅读


这项由上海AI实验室领导的研究于2024年11月发表在arXiv预印本平台,论文编号为2511.14366。有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队包括来自复旦大学、北京大学、上海交通大学等25所知名院校的专家学者,他们共同开发了一个名为ATLAS的科学推理评测平台。

当人工智能在各种考试中频频刷新高分记录时,一个有趣的现象出现了:那些曾经被视为"金标准"的测试题目,如今对顶级AI模型来说似乎变得过于简单。就像一个天赋异禀的学生轻松通过了小学考试,但我们却不知道他是否真正具备了解决复杂现实问题的能力。

正是在这样的背景下,上海AI实验室的研究团队决定为AI模型打造一个真正的"地狱级考场"。他们开发的ATLAS平台就像是一个专门设计来让AI"败下阵来"的超级测试场,专门检验AI在科学推理方面的真实能力。这个名字本身就很有意味——ATLAS意为"AGI导向的科学逻辑应用测试平台",寓意着要像古希腊神话中扛起天空的巨人一样,承担起衡量AI真实科学推理能力的重任。

想象一下,如果把现有的AI测试比作小学数学题,那么ATLAS就像是博士入学考试。它不满足于简单的

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

张子宇加盟首次未登场:前两场正负值均最差 山东女篮加时胜江苏

醉卧浮生 浏览 2694

中国籍女网红在柬埔寨街头流浪面容憔悴 母亲最新发声

扬子晚报 浏览 10142

涉中国电动汽车,美交通部长称“加拿大会后悔”,外国网友回怼:该后悔的是美国吧!

海外网 浏览 2599

347亿市值三一重能,80后出任董事长,身家超过4.7亿

华美财经 浏览 3448

厦大EMBA,四维一体、育见未来

经理人杂志 浏览 3654

市场定位模糊!贝莱德基金本土化试水困局,主动权益产品边缘化

新经济e线 浏览 2484

凌晨!全线大涨!美联储宣布:降息!鲍威尔重磅发声!

券商中国 浏览 3023

何小鹏“扒皮”验真身 国产人形机器人“摊牌了”

汽势传媒 浏览 3437

AMD也要减少GPU供应!重点转向RX 9070 XT:价格更好调整

快科技 浏览 2571

马斯克宣布X Money四月公测

财闻 浏览 1759

今年流行“洋葱式”穿法,这样穿高级又好看!

LinkFashion 浏览 2929

许绍雄离世,她说,老豆我很想你!但我不会再哭

振华观史 浏览 3579

市价不到两百的护眼灯校园采购价却达七八百 媒体调查

澎湃新闻 浏览 22093

巴媒质问:忘恩负义的阿富汗是否正成为印度代理人

澎湃新闻 浏览 8143

凯尔特人120-112力克太阳,布朗41+7+6,塔图姆21+7,布克40分

懂球帝 浏览 1646

中国9系新旗舰 长城魏牌V9X正式亮相

网易汽车 浏览 1823

六王表演赛:辛纳2-0横扫阿卡,带走600万美金和一把纯金球拍

懂球帝 浏览 3567

李思思离开央视原因曝光,原来“野心”不止于此

卷史 浏览 3186

美报告:中国是美国自19世纪以来面对过最强大的国家

北京日报 浏览 2159

限时售9.29万起 第五代瑞虎8正式上市

网易汽车 浏览 3401

总投资52亿元:国内首个海上回收复用火箭基地顺利开工

IT之家 浏览 2735
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1