关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻4458人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

自动驾驶真的来了 两款车型分别在北京/重庆获准上路

网易汽车 浏览 3627

特朗普正在替中国做想做而做不到的事,称赞!

浏览 27446

安徽小伙辍学卖馒头,今年已赚13亿

创业家 浏览 3386

拜登为何卸任前如此“恶毒”?

浏览 27354

游戏规则变了,Stellantis或用中国技术再造Jeep

禾颜阅车 浏览 4162

希门尼斯:我们踢了一场好比赛;希望勒诺尔芒能尽快回归

懂球帝 浏览 4073

高芙输球后更衣室摔拍遭外界批评,萨巴一句女人比男人耐热惹争议

网球之家 浏览 3050

又爆了一部新片,他今年太火了

独立鱼 浏览 4736

阿尔特塔:英超是欧冠决赛的预演?我不认为球员会这么想

懂球帝 浏览 925

年底大牌返场 || 每次都“秒空”,这次100+真的好值!

黎贝卡的异想世界 浏览 3191

新年烫头不想显老10岁?看这篇就够了

黎贝卡的异想世界 浏览 3311

舒淇,东亚女孩的恨海情天

时尚COSMO 浏览 3226

世界杯仅剩15天!内马尔警报:一瘸一拐离开医院 足协担忧

叶青足球世界 浏览 285

秋季穿衣别太复杂,提前准备好这几件单品,百搭经典又不挑人

静儿时尚达人 浏览 4338

张雪峰还是不服?

老斯基财经 浏览 4150

大S墓碑没自己名字,且一个中文都没有,具俊晔立深情人设引热议

扒虾侃娱 浏览 3029

杜兰特:超巨不在于名号而在于表现 我想一直打球直到再也打不动

罗说NBA 浏览 3296

美记@湖人盼尽快换凯斯勒!艾顿难堪大任 湖媒愿提高报价出2首轮

颜小白的篮球梦 浏览 4170

金标大众:在智能电动时代,守护那份“看不见”的安心

时代周报 浏览 3246

站在2025年底,小红书商业正跨过一个新门槛

36氪 浏览 3497

皮尔斯:如果我和詹姆斯年纪相同,他绝对不可能拿到4座冠军

懂球帝 浏览 4199
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1