关闭广告

Claude Opus 4.5来了!单次生成打造《我的世界》,还破解高难度Agent测评

智东西3281人阅读

智东西
作者 陈骏达
编辑 李水青

智东西11月25日报道,今天,Anthropic发布了自家的旗舰编程模型Claude Opus 4.5。Anthropic称,这是全球范围内在编程、agents和计算机使用方面最强大的模型。

在真实世界软件工程测试SWE-bench Verified中,Claude Opus 4.5成为首款得分超过80%的AI模型,不仅领先于自家的Claude Sonnet 4.5,还超过了上周发布的Gemini 3 Pro和GPT-5.1 Codex-Max。


Anthropic还把该公司面试人类工程师的高难度居

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

王天辰十年蛰伏终获认可 双剧同播展演技高光

老王的视角 浏览 2022

大动作调仓!机构开年疯狂扫货这些板块,而火爆的芯片、半导体ETF竟被抛售

每经牛眼 浏览 2678

还是王慧文有眼光,Kimi又融了35亿

字母榜 浏览 2856

北京顶豪法拍逆袭:有亿元级毛坯别墅遭10位富豪疯抢

每日经济新闻 浏览 7613

全国第二个提前还债的省份,出现在西部

时代周报 浏览 4413

普京穿军装看俄白军演:试戴热成像战术眼镜 装填手枪

新京报 浏览 3347

英伟达H100刚上天,谷歌Project Suncatcher也要将TPU送上天

机器之心Pro 浏览 3477

复旦大学等顶尖高校联手研发:AI模型学会像侦探一样使用工具

科技行者 浏览 2473

中央定调!“十五五”目标确立,未来5年养老金还会涨吗?

数字财经智库 浏览 3655

59元钓鱼3小时,年轻人只想静静

中国企业家杂志 浏览 2995

深耕大健康战略,招商信诺获评2025金柿奖·中国保险健康管理服务样本

Daily每日财报 浏览 3002

SpaceX将于10月14日最后一次发射"星舰V2"

IT之家 浏览 3800

以色列继续袭击约旦河西岸 哈马斯谴责

每日经济新闻 浏览 3413

真心话大冒险开启,谁是你的双11购物车ONEPICK?

时尚COSMO 浏览 2993

陈思诚新片定档!五一档终于有救了

陈意小可爱 浏览 745

女子年初砸60万买黄金国庆后花20万买白银基金:真运气

潇湘晨报 浏览 17847

杨振宁获诺奖速度纪录至今未破 提出理论到获奖仅1年

澎湃新闻 浏览 7327

租电版售价5.28万元 埃安UT系列永冲锋版上市

网易汽车 浏览 2600

投资铜条1公斤280元 网友再也不敢叫"破铜烂铁"了

北京商报 浏览 7115

今年春天最流行的6件风衣!

LinkFashion 浏览 1974

从头部驱动到生态共建,初瑞雪重构直播团队新范式

时代周报 浏览 3001
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1