关闭广告

上海AI实验室推出ATLAS:让AI在科学推理中"败下阵来"的超级考场

科技行者2328人阅读


这项由上海AI实验室领导的研究于2024年11月发表在arXiv预印本平台,论文编号为2511.14366。有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队包括来自复旦大学、北京大学、上海交通大学等25所知名院校的专家学者,他们共同开发了一个名为ATLAS的科学推理评测平台。

当人工智能在各种考试中频频刷新高分记录时,一个有趣的现象出现了:那些曾经被视为"金标准"的测试题目,如今对顶级AI模型来说似乎变得过于简单。就像一个天赋异禀的学生轻松通过了小学考试,但我们却不知道他是否真正具备了解决复杂现实问题的能力。

正是在这样的背景下,上海AI实验室的研究团队决定为AI模型打造一个真正的"地狱级考场"。他们开发的ATLAS平台就像是一个专门设计来让AI"败下阵来"的超级测试场,专门检验AI在科学推理方面的真实能力。这个名字本身就很有意味——ATLAS意为"AGI导向的科学逻辑应用测试平台",寓意着要像古希腊神话中扛起天空的巨人一样,承担起衡量AI真实科学推理能力的重任。

想象一下,如果把现有的AI测试比作小学数学题,那么ATLAS就像是博士入学考试。它不满足于简单的

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

限时19.68万元起 比亚迪2026款夏上市

网易汽车 浏览 3145

小插曲,威尔士对比利时的世预赛中有老鼠入场短暂干扰了比赛

懂球帝 浏览 3453

中乌外交部政治磋商在北京举行

界面新闻 浏览 2598

38岁后单赛季为意甲升班马攻入至少4球,瓦尔迪是历史第二人

懂球帝 浏览 2823

哈维-西蒙斯:我很享受在热刺的时光;在主场拿下3分很重要

懂球帝 浏览 3182

安东尼奥3年2次突破!成05国奥主帅热门,媒体人:结果大于过程

奥拜尔 浏览 2401

兴业消费金融:筑梦美好生活 扎实推进高质量发展

财经众议院 浏览 2499

一加Ace 6T官宣:全球首发骁龙8 Gen5

快科技 浏览 3025

定位中大型5座SUV 星途ET7申报图曝光

车质网 浏览 2574

郝蕾风波升级!被扒曾参演《狂野时代》闹掰,辛芷蕾发声打脸她

萌神木木 浏览 3152

卡萨诺:有九名球员不配在尤文踢球,戴维糟糕到令人难以直视

懂球帝 浏览 3350

撕开铁幕裂缝:国产手术机器人的千亿逆袭

钛媒体APP 浏览 3510

何晴告别式现场,前夫许亚军疑似现身双眼泛红,大量群众自发悼念

萌神木木 浏览 2531

官方:勇士正式签下塞斯-库里,后者将身披31号球衣

懂球帝 浏览 2742

闪电快讯 | 享界S9T售价30.98万元起 上市24小时大定超过7500辆

电厂 浏览 4138

城镇化率突破67%,城市发展转向存量优化,自然资源部:将发布规划指南

时代周报 浏览 3966

不只具身智能和AI,2026年的热门风口有哪些?

BT财经 浏览 1679

加冕荷兰射手王+助攻王!德佩:又一破纪录时刻,而且远未结束

懂球帝 浏览 3437

空客天津第二总装线投产,高端航空制造产业集群成型

华夏时报 浏览 3215

霍家主母显气度:一代卖船供学二代稳大局三代全颜面,四代无人及

不八卦会死星人 浏览 2246

窦骁何超莲不忍了合体发文,公开回应婚变

一娱三分地 浏览 3202
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1