关闭广告

上海AI实验室推出ATLAS:让AI在科学推理中"败下阵来"的超级考场

科技行者3206人阅读


这项由上海AI实验室领导的研究于2024年11月发表在arXiv预印本平台,论文编号为2511.14366。有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队包括来自复旦大学、北京大学、上海交通大学等25所知名院校的专家学者,他们共同开发了一个名为ATLAS的科学推理评测平台。

当人工智能在各种考试中频频刷新高分记录时,一个有趣的现象出现了:那些曾经被视为"金标准"的测试题目,如今对顶级AI模型来说似乎变得过于简单。就像一个天赋异禀的学生轻松通过了小学考试,但我们却不知道他是否真正具备了解决复杂现实问题的能力。

正是在这样的背景下,上海AI实验室的研究团队决定为AI模型打造一个真正的"地狱级考场"。他们开发的ATLAS平台就像是一个专门设计来让AI"败下阵来"的超级测试场,专门检验AI在科学推理方面的真实能力。这个名字本身就很有意味——ATLAS意为"AGI导向的科学逻辑应用测试平台",寓意着要像古希腊神话中扛起天空的巨人一样,承担起衡量AI真实科学推理能力的重任。

想象一下,如果把现有的AI测试比作小学数学题,那么ATLAS就像是博士入学考试。它不满足于简单的

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

格陵兰岛各政党领导人:格陵兰人不想成为美国人

界面新闻 浏览 8709

女子被日料店服务员泼开水烫伤:事发后曾接到警告电话

封面新闻 浏览 9397

1499元飞天茅台上线“秒空”,茅台金融属性退潮是伪命题吗?

郭施亮 浏览 3303

原来她就是黄景瑜背后的老板,曾是央视主持

因果 浏览 3100

黎巴嫩总统谴责以军空袭贝鲁特

上观新闻 浏览 3759

国民党"内讧"郑丽文开会不邀卢秀燕 党内炸锅大佬现身

博览历史 浏览 10148

今年冬天最火的穿法:夹克+裤子,时髦又减龄!

LinkFashion 浏览 3271

港姐亚军自曝遭网暴!骚扰者竟是小区保安

TVB剧评社 浏览 4189

尹同跃宣告奇瑞AI进入2.0时代,要快速追赶特斯拉FSD

贝壳财经 浏览 3136

UC圣地亚哥学者巧用树形搜索让AI画画训练快2.4倍

科技行者 浏览 3289

刘强东朋友圈疑曝光,自嘲在老婆面前失去没自信

柠檬有娱乐 浏览 4039

迎来复兴曙光 全新奔驰S级轿跑车假想图曝光

车质网 浏览 1382

邮报:拉亚已成为世界最优秀的门将之一,扑救与脚下技术俱佳

懂球帝 浏览 4252

被问与特朗普关系是否已"破裂" 斯塔默回应

环球网资讯 浏览 60027

孙宏斌逃出生天

创业家 浏览 3955

男生最经不住女生这样撩!

Yuki女人故事 浏览 4130

这些才是适合普通人的穿搭!秋天多穿蓝色单品和风衣,好耐看

静儿时尚达人 浏览 4075

美教授说大实话:特朗普对委动手背后 石油优先于民主

澎湃新闻 浏览 10620

这不是危言耸听:最快明年,比亚迪的插混和纯电,就没有区别了

小李车评李建红 浏览 4251

全红婵夺金 新搭档身份不简单 赛后发文信息量大

白面书誏 浏览 3912

蓝色+灰色、红色+棕色,这4组配色怎么搭都好看!

LinkFashion 浏览 2597
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1