关闭广告

Claude Opus 4.5来了!单次生成打造《我的世界》,还破解高难度Agent测评

智东西3784人阅读

智东西
作者 陈骏达
编辑 李水青

智东西11月25日报道,今天,Anthropic发布了自家的旗舰编程模型Claude Opus 4.5。Anthropic称,这是全球范围内在编程、agents和计算机使用方面最强大的模型。

在真实世界软件工程测试SWE-bench Verified中,Claude Opus 4.5成为首款得分超过80%的AI模型,不仅领先于自家的Claude Sonnet 4.5,还超过了上周发布的Gemini 3 Pro和GPT-5.1 Codex-Max。


Anthropic还把该公司面试人类工程师的高难度居

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

慧与上季营收暴增40%、盈利远超预期,大幅上调本财年指引,盘后一度涨近40%

华尔街见闻官方 浏览 108

德媒:训练中被约纳坦-塔踩到脚的斯塔尼希奇并未受重伤

懂球帝 浏览 2995

2025秋冬大衣流行趋势

LinkFashion 浏览 4236

18.99万起,智享大六座旗舰SUV风云T11上市,又要卖爆?

电车通 浏览 3630

重兵压境与谈判信号并行 美国“极限施压”究竟想要什么

国际在线 浏览 2915

今秋这件“瘦瘦衫”必穿!巨in巨洋气,上身瘦十斤!

Yuki女人故事 浏览 4895

谷歌间接承认 Tensor G5 芯片 GPU 问题

IT之家 浏览 4097

被指住宿环境差 广东一高校回应:没那么夸张 是误会

极目新闻 浏览 4421

2026款ICON巧克力"心动紫"上市 限时7.98万起

网易汽车 浏览 4119

美以联合袭击伊朗是否提前通报中方 外交部:没有

澎湃新闻 浏览 2496

黄景瑜将上太空,官宣成为009号太空游客,乘坐中国自制飞船升空

扒虾侃娱 浏览 3038

因家人病危,布里斯班狮吼主教练将缺席下轮联赛

懂球帝 浏览 3148

气场拉满:泰国改装厂让长城坦克300“变身”Brabus G63

IT之家 浏览 3305

宗馥莉,抛弃娃哈哈?

豹变 浏览 4732

丰田"世极"正式独立 全新概念车剑指劳斯莱斯

网易汽车 浏览 4109

卢拉称和特朗普见面像"一见钟情" 上个月刚大骂特朗普

极目新闻 浏览 95459

羽绒服+阔腿裤:今年冬天最火搭配,松弛又时髦!

LinkFashion 浏览 3150

明年起5纳米以下先进制程至少涨3%?台积电回应:定价策略不以机会导向

澎湃新闻 浏览 4010

成本上升、缺芯、亚洲销量下滑,本田汽车全年利润预期下调 21%

IT之家 浏览 4042

印媒怒了:美国人组团恶意抢机票 阻止印度人返回美国

环球时报 浏览 28065

王楚钦抵达海口参加亚洲杯,不愧是穿搭博主

可乐谈情感 浏览 3077
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1