关闭广告

Claude Opus 4.5来了!单次生成打造《我的世界》,还破解高难度Agent测评

智东西3787人阅读

智东西
作者 陈骏达
编辑 李水青

智东西11月25日报道,今天,Anthropic发布了自家的旗舰编程模型Claude Opus 4.5。Anthropic称,这是全球范围内在编程、agents和计算机使用方面最强大的模型。

在真实世界软件工程测试SWE-bench Verified中,Claude Opus 4.5成为首款得分超过80%的AI模型,不仅领先于自家的Claude Sonnet 4.5,还超过了上周发布的Gemini 3 Pro和GPT-5.1 Codex-Max。


Anthropic还把该公司面试人类工程师的高难度居

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

牛弹琴:白宫突然发了张图 伤害性不大侮辱性极强

现代快报 浏览 39095

新基金业绩大分化

国际金融报 浏览 4100

中美两军在夏威夷见面 中方当场划下两条"红线"

看看新闻Knews 浏览 13369

“聆听博物馆”上线:收录IBM Model M等36款机械键盘音频样本

IT之家 浏览 1407

地区战争风险加剧 哥伦比亚总统重批美国“侵略拉美”

环球网资讯 浏览 4348

陶虹与朋友相聚,17岁女儿五官与神态似徐峥

黔乡小姊妹 浏览 3479

中美达成共识让美豆农松口气 盼望中方订单快点来

环球网资讯 浏览 15116

本轮矿业大周期的演进逻辑,隐匿在“卖铲人”的资产负债表里

锦缎研究院 浏览 1365

美政府部分“停摆”最早将于周二结束

国际金融报 浏览 2973

太强了!单月销量近9万?压着特斯拉打的“中国新势力”诞生了

少数派报告Report 浏览 3142

春节档对决张艺谋吴京,成龙能不能救港片?

娱乐圈笔娱君 浏览 2989

倪萍没说错 结婚14年的张杰谢娜给内娱上了一课

张发林 浏览 4581

媒体:被昔日学生中国超越 欧洲落于人后的悲观正蔓延

澎湃新闻 浏览 6110

2025年净利至少增超78%!减肥药价格战凶猛,甘李药业:相关产品未上市,价格策略待定

时代周报 浏览 3047

她是半个娱乐圈的“妈”,丈夫与她相爱40年

说历史的老牢 浏览 4734

增长神话暂停,理想“尖子生”光环失效?

Tech星球 浏览 3570

东部第一!活塞双杀步行者13连胜平队史纪录 坎宁安24+11+6

醉卧浮生 浏览 3748

疯涨400%!光纤价格“狂飙”,四大龙头“躺赚”?

览富财经网 浏览 1606

比亚迪10月销售441706辆 新能源累计销售超1420万辆

网易汽车 浏览 3982

股市:更大的想象空间来了

小白读财经 浏览 2998

珍珠专场|| 无论18岁还是80岁,总是会为它再一次心动

黎贝卡的异想世界 浏览 3240
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1