关闭广告

Claude Opus 4.5来了!单次生成打造《我的世界》,还破解高难度Agent测评

智东西3275人阅读

智东西
作者 陈骏达
编辑 李水青

智东西11月25日报道,今天,Anthropic发布了自家的旗舰编程模型Claude Opus 4.5。Anthropic称,这是全球范围内在编程、agents和计算机使用方面最强大的模型。

在真实世界软件工程测试SWE-bench Verified中,Claude Opus 4.5成为首款得分超过80%的AI模型,不仅领先于自家的Claude Sonnet 4.5,还超过了上周发布的Gemini 3 Pro和GPT-5.1 Codex-Max。


Anthropic还把该公司面试人类工程师的高难度居

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

借小贝之力,三狮欲赴迈阿密集训

体坛周报 浏览 3630

成熟企业做新品牌往往很难成功,为什么?

创业家 浏览 3643

纵贯一整年的精彩:柏林电影节佳作在中国

幕味儿 浏览 2870

比亚迪中型车适合家用!油耗仅3.8L,还能加92油,省心也好养

汽车挖一挖 浏览 236

沪媒:上海赛更达橘橙投资人朱骏将兑现400万元冲乙奖金

懂球帝 浏览 3902

40岁C罗确认:美加墨世界杯将是生涯最后1届!或2年后在沙特退役

我爱英超 浏览 3370

智能跃迁 广汽丰田威兰达新老款车型对比

车质网 浏览 3120

清华新作ControlAudio:声音何时响、说啥话?都能按剧本可控生成

机器之心Pro 浏览 766

美联储“独立性”面临挑战,华尔街想确定“是敌是友”,美联储新主席提名引发市场猜测

环球网资讯 浏览 2415

致敬 S14 第五冠队服,雷蛇推出巨甲虫 V2 Faker 款游戏鼠标垫

IT之家 浏览 3812

澎湃OS优化进展公布,小米15手机相机体验等问题已修复

IT之家 浏览 2944

直击现场!看东部战区演习高燃瞬间

环球网资讯 浏览 2799

母亲被父亲刺28刀死亡 11岁儿子因给父亲开门深深自责

都市报道 浏览 14147

连续两场地区联赛弃赛后,葡老牌球队博阿维斯塔面临解散风险

懂球帝 浏览 3650

新款阿维塔12实车首曝光 华为靳玉志评其脱胎换骨

网易汽车 浏览 2614

李雪健黄景瑜主演《斗贼》积压5年终于下证

娱乐圈笔娱君 浏览 2000

王小卤的双11:在抖音电商,把凤爪“嗦”成国民零食

一点财经 浏览 3527

钢铁业未见“金九银十” 中钢协呼吁“自律控产”

中国经营报 浏览 3568

美媒披露:美空军8天内向中东地区调派至少42架重型运输机

环球网 浏览 2430

“弯刀裤”今年秋冬爆火,怎么搭都时髦!

LinkFashion 浏览 3029

曝郑爽新账号被封,15天前起的号

有范又有料 浏览 2580
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1