关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻3909人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

深蓝汽车邓承浩否认“没钱了所以融资”:现金流非常好

IT之家 浏览 2644

哥伦比亚总统:反对对古巴进行任何形式的军事干预

国际在线 浏览 301

聚辰半导体冲刺港股:9个月营收9.3亿利润3.1亿陈作涛控制24%股权

雷递 浏览 2600

真有品味的中年女人,穿衣打扮都有这4个共同点,你中了吗?

静儿时尚达人 浏览 3842

伊朗:不再发射弹头不足一吨重导弹 增加发射频率和范围

财联社 浏览 1762

靠创新药结束连续8年亏损局面,百济神州烧百亿研发终迎转机

览富财经网 浏览 4300

司晓迪隐藏聊天记录牵扯背后产业链!上不了热搜,一深扒就删帖

萌神木木 浏览 2798

券商密集实施中期分红 近90亿元红利在路上

证券时报 浏览 3007

全国第一,太空光伏寡头,野心勃勃!

飞鲸投研 浏览 2379

官方:阿根廷U20主力中卫皮耶拉尼左膝扭伤;据悉无法出战半决赛

懂球帝 浏览 3767

打服了!记者:当时觉得凯恩太贵不值当,现在我愿为他铺毛巾

直播吧 浏览 4405

伊姐周日热推:电视剧《凤凰台上》;电视剧《亲爱的X》......

伊周潮流 浏览 2730

西贝的新考题:如何券后留客

北京商报 浏览 3174

美国正式退出世卫组织 还欠费2.6亿美元

都市快报橙柿互动 浏览 20070

豪华装饰,卢卡斯为家中置办一座4米高举起世界杯的金刚雕像

懂球帝 浏览 2039

华为智慧屏新品MateTV Max今日预售,110英寸64999元

IT之家 浏览 3257

TA:热刺想要加拉格尔已近三年,如今才终于签下他

懂球帝 浏览 2580

U16国足4-1复仇朝鲜!终结热身2连败 15岁红星大四喜+一条龙爆射

我爱英超 浏览 3776

山东99-75宁波3喜1忧!高诗岩陈林坚太关键,王证神射,2外出隐患

篮球资讯达人 浏览 2554

一加Ace 6T宣布12月3日发布!全球首发第五代骁龙8、超8000mAh大电池

快科技 浏览 3219

男子犯病救命药滞留酒店前台5个小时后死亡 酒店回应

封面新闻 浏览 15991
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1