关闭广告

Claude Opus 4.5来了!单次生成打造《我的世界》,还破解高难度Agent测评

智东西3004人阅读

智东西
作者 陈骏达
编辑 李水青

智东西11月25日报道,今天,Anthropic发布了自家的旗舰编程模型Claude Opus 4.5。Anthropic称,这是全球范围内在编程、agents和计算机使用方面最强大的模型。

在真实世界软件工程测试SWE-bench Verified中,Claude Opus 4.5成为首款得分超过80%的AI模型,不仅领先于自家的Claude Sonnet 4.5,还超过了上周发布的Gemini 3 Pro和GPT-5.1 Codex-Max。


Anthropic还把该公司面试人类工程师的高难度居

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

分子设计迎来AI新纪元:蒙特利尔大学让计算机成为"分子工程师"

科技行者 浏览 2304

中航大学:AI聊天机器人的"假身份证"攻击如何骗过智能助手

科技行者 浏览 3318

美ICE当街打死一人 施救医生:特工忙着数他身上的弹孔

红星新闻 浏览 6653

苏州大学突破:8B模型实现长文理解媲美GPT-4o

科技行者 浏览 3151

AMD也要减少GPU供应!重点转向RX 9070 XT:价格更好调整

快科技 浏览 2266

不去掉这一点,贾国龙就赢不了罗永浩

振华观史 浏览 3423

两中国游客穿泳衣失联 失联女生对父母说是与发小出游

红星新闻 浏览 19526

“大衣+运动鞋”才是冬天最时髦搭配,这样穿松弛又减龄!

LinkFashion 浏览 2342

A股天然气板块拉升,霍尔木兹海峡关闭引全球气价预警

览富财经网 浏览 1645

马竞球迷举行午餐聚会,托雷斯、比利亚和劳尔到场

懂球帝 浏览 54

美国11月密歇根大学消费者信心创逾三年新低,短期通胀预期上升

华尔街见闻官方 浏览 3171

集齐产业、PE/VC与央企国资!曦望披露近30亿元新融资细节

21世纪经济报道 浏览 2282

欧美媒体唱衰福建舰仅6成战力 赖岳谦:他们开心就好

看看新闻Knews 浏览 9219

出生人口跌破800万,养老金怎么办?

智本社 浏览 2311

汪小菲最重要的两个女人,一个爱,一个适合

半身Naked 浏览 3993

郑爽广电封禁通知曝光!日子久了都忘了她多恶劣

萌神木木 浏览 1882

美媒无法理解:油价这么高 进口最多的中国反而更滋润

书纪文谭 浏览 115816

郭碧婷父亲回应病危传闻,自我调侃幽默辟谣,近状曝光精神抖擞

扒虾侃娱 浏览 3461

华为乾崑遍地是朋友,但还需要一个“满血版”9系

虎嗅APP 浏览 53

《惊蛰无声》预告质感太差!杨幂没精神刘诗诗像盲人,被嘲像网大

萌神木木 浏览 2301

美伊26日谈判在即 是否对伊朗动武:白宫先内讧了

每日经济新闻 浏览 1652
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1