关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻3898人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

吊打内娱的阴湿女王,回来了

独立鱼 浏览 3606

曹德旺退休其子接棒 老了……

道哥说车 浏览 3671

Krystal,终于等到你!

时尚COSMO 浏览 2504

买10件退9件?到底怎么买红衣服才能不踩雷

黎贝卡的异想世界 浏览 2464

向太曝张艺谋巩俐分手内幕,女方逼婚不成移情,老谋子彻夜痛哭

不八卦会死星人 浏览 3173

邮报:纽卡中卫丹-伯恩遭遇肺穿孔和肋骨骨折,将缺阵六周

懂球帝 浏览 2964

科技感爆棚 大众ID. ERA 9X内饰官图发布

车质网 浏览 1938

埃迪-豪7次面对伯恩茅斯场均积分0.7分,仅比对阵曼城、红军更多

直播吧 浏览 4448

2025年利润在4%徘徊,车圈是从从容容还是连滚带爬‌?

禾颜阅车 浏览 2963

美日通电话后欧洲集体变脸 日本对华提出一个新要求

博览历史 浏览 31655

四冠王!南外毕业生所在战队问鼎RoboMaster2025全国总冠军

现代快报 浏览 4583

将于春季正式上市 智界V9内饰谍照曝光

车质网 浏览 2367

看完《逐玉》我承认我还是喜欢长剧

时尚COSMO 浏览 1657

《水龙吟》《天地剑心》一弃一追

古木之草记 浏览 3482

估值3.5亿的廊坊银行股权被拍卖偿债,持股人刚被法院悬赏

湘财Plus 浏览 2536

茶里回应欠薪:大部分在职员工欠薪兑付已完成,离职员工欠薪问题正分批解决

红星资本局 浏览 2624

比亚迪成为全球首家达成1400万辆里程碑的新能源车企

财闻 浏览 3734

俄美领导人会晤为何被“推迟” 俄外长披露原因

每日经济新闻 浏览 3532

美军重兵集结蓄力作战之际 新一轮美伊谈判时间“敲定”

环球网资讯 浏览 2003

张雨绮,不能「装死」了

独立鱼 浏览 2446

牛弹琴:战机又被照射后日本急了 有人第一个想到中国

现代快报 浏览 13075
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1