关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻4811人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

黄子韬徐艺洋“尼克朱迪”模仿秀

今古深日报 浏览 4098

腾讯首次系统披露研发进展:AI生成50%新增代码,研发自动化水平同比提升67%

华尔街见闻官方 浏览 4622

美联储112年来最富的主席,要改规矩了!

米筐投资 浏览 1489

2025年热销的十款新能源车 卖得好真不是靠吹牛?

汽车天涯 浏览 3487

腾势D9将迎来第30万辆交付

大象新闻 浏览 4032

塔帅:赢球能带来能量和信心,我觉得这是足球最重要的两件事

懂球帝 浏览 3526

郭碧婷父亲回应病危传闻,自我调侃幽默辟谣,近状曝光精神抖擞

扒虾侃娱 浏览 4676

北约秘书长吕特:理解特朗普对许多北约盟友感到失望

参考消息 浏览 60120

大盘五连涨!今年3次五连涨后发生了什么?

每日经济新闻 浏览 3793

不再有任何限制措施!微软:所有受支持设备都能升Win11 25H2了

快科技 浏览 4714

奇瑞汽车宣布三大升级计划,2026年超35款车型将搭载猎鹰智驾

IT之家 浏览 3591

江苏88-84逆转天津获赛季首胜,庞峥麟34分,贾尔斯25+13

懂球帝 浏览 3745

利物浦官方:库伊特、斯科特尔等人参加对多特传奇的慈善赛

懂球帝 浏览 3374

朝鲜晚上举行盛大阅兵式 现场画面披露

央视新闻客户端 浏览 3554

公开喊话 贾跃亭称FF愿与特斯拉展开合作

车质网 浏览 4198

国常会重磅部署!

数据宝 浏览 4458

过时的拍照姿势,毁了多少普通女孩?

Yuki女人故事 浏览 6625

50+姐姐冬季穿搭别“作妖”,4个法则穿得简约高级,时髦极了

静儿时尚达人 浏览 3902

王诗龄放假回北京了,照片曝光很漂亮

瞻史 浏览 4488

男子疑心梗住院被急诊医生误诊 转入普通病房后身亡

大风新闻 浏览 14298

美国防部被曝暂停部分对欧洲军售 以保自身库存

环球网资讯 浏览 5240
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1