关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻4426人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

软银清仓英伟达,孙正义套现415亿

YOUNG财经 浏览 3960

从样品到产品,重庆高校科研“宝贝”何以出圈?

上游新闻 浏览 3889

理想汽车1月销量跌破3万辆,同比、环比均下滑!

车秀小咖 浏览 2954

首艘美国船被罚之际 特朗普调2艘航母部署中国周边

现代小青青慕慕 浏览 7757

赵建:货币苏醒

首席经济学家论坛 浏览 4179

音乐人袁惟仁去世享年57岁 此前曾摔倒成植物人数年

极目新闻 浏览 9130

闪电快讯|2026款比亚迪宋Pro DM-i上市,纯电续航提升至220km

电厂 浏览 3308

“比特币富婆”钱志敏在英国认罪,6.1万枚比特币市价已达493亿元,赃款归谁?

红星新闻 浏览 4064

伦纳德:我对保罗一事毫不知情,我们之间的沟通没有问题

懂球帝 浏览 3536

首负日本!巴西遭36年之耻 安帅气炸直接离场+判头号罪人“死刑”

风过乡 浏览 4346

德媒:动用俄资产来筹集对乌援助 是欧盟最后一颗子弹

中国青年报 浏览 12792

没上映票房就破2400万,邓超加陈凯歌都压不住,国庆档冠军定了?

靠谱电影君 浏览 4779

泽连斯基:会谈富有成效 但美乌在领土问题上立场不同

国际在线 浏览 18775

《狙击蝴蝶》开播!看完4集,我想说:都市爱情剧就该这么拍!

娱乐圈笔娱君 浏览 3720

俄称已接近解决乌克兰危机 但不会在两个问题上让步

上观新闻 浏览 2812

江淮受累于大众安徽亏损,受惠于尊界S800热销

道哥说车 浏览 3107

“肉测”成都自动驾驶公交:提前免费预约,一人一座,一趟车有14个名额

红星新闻 浏览 3272

委内瑞拉外长:感谢中方支持

环球网资讯 浏览 14298

台媒:英美等技术顾问不敢坐台自制潜艇出海

环球网资讯 浏览 3524

承德露露,温水煮青蛙

斑马消费 浏览 4116

特朗普正在替中国做想做而做不到的事,称赞!

浏览 27407
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1