关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻4423人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

换装丰田混动系统!马力提升至219匹!美版2026款CX-50售21万

念寒车评 浏览 4650

福建舰、山东舰、辽宁舰 作战能力不止“1+1+1”

上观新闻 浏览 3867

这几件衣服太火了,谁穿谁好看

LinkFashion 浏览 3781

净利腰斩 “非洲之王”传音失速

北京商报 浏览 2983

有品味的中年女人,穿衣都有4个共同点,看看你掌握了几个

静儿时尚达人 浏览 4001

产检时一切正常小孩出生后却畸形 母亲时隔一年多投诉

潇湘晨报 浏览 9133

不计成本的超跑梦想:Ascari Ecosse的传奇往事

老爷车 浏览 3595

评论丨网购衣服上的“密码锁”,是商业诚信的刺眼“疤痕”

红星新闻 浏览 4129

沃什问鼎美联储主席前路如何?

21金融圈 浏览 2979

全球首个海上千方 PEM 槽及制氢系统的全功率测试启动

IT之家 浏览 4060

日方对中俄联合空中战略巡航表示担忧 外交部回应

央视新闻 浏览 21204

ABB与英伟达共同推进吉瓦级数据中心建设,800VDC供电架构引关注

环球网资讯 浏览 4334

42岁暴瘦脱相崩溃大哭的蒋欣,给所有人提了个醒

阿会情感 浏览 3938

再一次分别,刘军帅告别李霄鹏:感谢这一生遇到最好的教练

懂球帝 浏览 3442

每天干十几个小时,月赚五六千元,有人6万元盘下,几个月后2万多才脱手!曾经爆火的创业项目遭嫌弃

都市快报橙柿互动 浏览 3130

英法空袭叙利亚中部地区 宣称打击极端组织"伊斯兰国"

环球网资讯 浏览 3129

伊姐周日热推:电视剧《声渊》;电视剧《绝境通缉令》......

伊周潮流 浏览 3199

被央媒怒批!目不识丁、脑子空空

东方不败然多多 浏览 4245

特朗普开价10亿美元招募 被指试图用新机构替代联合国

极目新闻 浏览 7604

官方:瑞典裁判尼贝里将执法欧冠热刺vs多特

懂球帝 浏览 3101

马力破千匹 宝马纯电M3官方谍照发布

车质网 浏览 3108
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1