关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻961人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

北京传媒大学和微软团队破解云端智能压缩难题

科技行者 浏览 873

科技巨头AI竞赛转向表外融资,万亿债务定时炸弹成危机前兆?

华尔街见闻官方 浏览 805

"美国炸毁北溪"爆料者:美希望乌获胜是"自杀"行为

环球时报新闻 浏览 19488

光伏赛道步入分水岭 行业翘楚如何化危机为机遇

投资者网 浏览 12803

涉及中国 日本高官公开道歉并撤回错误言论

环球时报国际 浏览 32823

哈马斯证实达成加沙停火协议

CCTV国际时讯 浏览 1023

卖7.98万元?!比亚迪两款车或推出“荣耀版”!

汽车之家 浏览 12271

韩国宣布由韩企众筹为日本罪行埋单后 日本得寸进尺

新民晚报 浏览 102658

马斯克称xAI本周将开源Grok大模型

第一财经资讯 浏览 10882

十字路口的YY直播:从"欢聚"3年,到百度"退货"

Tech星球 浏览 12783

培根:人追财,累死人!看透这4条法则,让钱自己“送上门”

60秒商业解读 浏览 12269

美总统威胁对尼日利亚动武 尼方回应

环球网资讯 浏览 743

熊园:“十五五”GDP目标——怎么定、定多少?

首席经济学家论坛 浏览 930

贾玲自曝瘦了100斤!被爆料试过用药减肥但病了,路透图不是很瘦

文艺圈娱乐号 浏览 12925

传Blackwell架构GB20x的GPC配置基本不变,英伟达仍在开发GB205/6/7

超能网 浏览 11282

曹操墓被盗过几次?现在还剩下些什么?

趣看热点 浏览 26419

手机动辄2亿像素,照片会撑爆内存吗?

中新经纬 浏览 992

倪妮周雨彤回应撞衫:今天我俩有点默契

新金牌娱乐观察家 浏览 13508

一车三动力:五菱星光730电/油/插混动力配置公布,10月15日预售

IT之家 浏览 1079

再看万茜的采访,觉得易立竞太残忍

江湖人称艾掌门 浏览 10754

福建舰电磁弹射技术处世界先进水平

北京日报客户端 浏览 651
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1