关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻3599人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

前三季度私募产品“超涨”十强!复胜、远信、歌汝等夺冠!

私募排排网 浏览 3514

三元锂和磷酸铁锂二合一?揭开零跑D19超混电池黑科技

吴佩频道 浏览 3417

置换抢购价9.99万元起 捷途X70L正式上市

网易汽车 浏览 3943

大衣哥越来越吃香!经纪人称他商演邀约增多

可乐谈情感 浏览 337

全球首个飞行汽车量产工厂试产,何小鹏官宣:期望在2026年量产机器人

商用车头条 浏览 3167

泽连斯基被疑"诅咒特朗普":政客嘛 早晚会死

澎湃新闻 浏览 13691

巴基斯坦俾路支省反恐行动打死145名恐怖分子

上观新闻 浏览 2131

储朝晖:应对“入学潮”,推动教育提质增效

环球网资讯 浏览 2716

带领泰州队夺冠 苏超唯一"女教头"不到半年里瘦了17斤

新民周刊 浏览 8978

“锂王”炒股,赚了111万,赔掉2000亿

大猫财经Pro 浏览 1907

美国人羡慕哭了!花一辆美国新车的钱 在中国能买五辆电车

快科技 浏览 63

李迅雷:黄金暴涨、股市波动,普通人机会在哪?

首席经济学家论坛 浏览 3351

四名日本U17国脚在阿贾克斯试训,并与富安健洋、板仓滉合影

懂球帝 浏览 1675

特朗普:已开始从委石油资源中赚钱

环球时报国际 浏览 2383

邱毅:两岸统一的脚步越来越近

环球网资讯 浏览 2983

凌晨3点45 德国复仇战!赢球=晋级世界杯+种子队 首发曝光

叶青足球世界 浏览 2991

最高法公开征求意见!“开门杀”保险赔偿不明确或成过去时

北京商报 浏览 3115

复出高效,波尔津吉斯砍30分5板4助2断3帽&得分勇士生涯新高

懂球帝 浏览 1289

高德重走商业化老路,腾讯、百度迎来反超机会?

蓝鲸新闻 浏览 3943

提升冬日幸福感的8件小事,放松又治愈

LinkFashion 浏览 2994

委代总统称遭美威胁:马杜罗已死

每日经济新闻 浏览 2153
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1