关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻3597人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

72岁赵雅芝1588生日会门票秒没,网友:人傻钱多

港剧叔 浏览 3493

37岁高叶演“恶女”,连面相都变了?

娱乐圈笔娱君 浏览 3248

日均不到1000元机器人带回家?智元为机器人租赁市场带来“令人心动的offer”

时代财经 浏览 3320

英超积分榜:热刺伯恩茅斯分列二、三 狼队全败 维拉西汉姆5轮3分

直播吧 浏览 3568

钢铁业未见“金九银十” 中钢协呼吁“自律控产”

中国经营报 浏览 3259

普京:俄方已无兴趣等待乌从其占领区撤出

每日经济新闻 浏览 2530

佩德里:我们没参与抗议,开场也静默15秒是出于对同行的尊重

懂球帝 浏览 3507

弗里克:很不满意拉菲尼亚受伤;还没和特尔施特根聊过

懂球帝 浏览 2114

毛茸茸的冬天,毛孩子们都在想什么?

时尚COSMO 浏览 2838

足球报:国安并非没考虑过土帅,针对今年问题已做长远规划

懂球帝 浏览 3399

现场调查!拥有“黄金”招牌的金雅福爆雷后人去楼空,“买卖+委托”模式是否涉嫌非法吸存

华夏时报 浏览 2483

亨通光电财运亨通

富凯财经 浏览 2661

乐道汽车全年累计交付破10万台 成交均价升至25万+

网易汽车 浏览 2600

斯塔默:允许美使用英方有关军事基地打击伊朗导弹设施

环球网资讯 浏览 41667

《秋雪漫过的冬天》首播,不如原版韩剧好看

马庆云的影音娱 浏览 2418

60岁温碧霞和同龄人聚会,活成了“小公主”

听风听你 浏览 1996

470场,格列兹曼追平科利亚尔并列马竞队史出场榜第5名

懂球帝 浏览 2662

全球数百美军高级将领突然被召回 特朗普发声

环球网资讯 浏览 3976

推荐两款顶配车型 长安启源A06购车指南

车质网 浏览 2697

拉什福德渴望永久转会愿大幅降薪!暗讽曼联,称巴萨让他重获新生

罗米的曼联博客 浏览 3429

特朗普要求日本停止进口俄罗斯能源 高市早苗当面拒绝

鲁中晨报 浏览 9270
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1