当前信息:DeepSeek 再开源:3B OCR 模型,用视觉方式压缩文本
2025-10-20 20:28:26 来源:网易科技报道
(资料图)
北京时间10月20日,DeepSeek 在 GitHub 上开源其最新研究成果 —— DeepSeek-OCR 模型。
据介绍,DeepSeek-OCR 参数量约3B ,是对“光学二维映射压缩”技术在长文本上下文处理中的可行性的一次初步探索。
模型核心由 DeepEncoder 与 DeepSeek3B-MoE-A570M 解码器构成:DeepEncoder 负责在高分辨率输入下保持低激活状态,实现高压缩比并生成适量视觉 token,解码器则负责将这些 token 转化为精确文本信息。
实验数据显示,当文本 token 数量控制在视觉 token 的10倍以内(压缩率 <10×)时,OCR 精度可达97%;即便压缩率达到20×,准确率仍保持在 约60%。研究团队称,这一结果为长上下文压缩和 LLM 记忆遗忘机制研究提供了新的思路。(袁宁)
[责任编辑:xwzkw]
相关阅读
- (2025-10-20)当前信息:DeepSeek 再开源:3B OCR 模型,用视觉方式压缩文本
- (2025-10-20)全国最低工资标准公布,月标准上海第一,时标准北京最高|微头条
- (2025-10-20)凯撒旅业:公司参股子公司易生金服暂未介入香港稳定币牌照申请以及美国稳定币合作
- (2025-10-20)视频丨环广西车手们两侧列队、波动前轮,为昔日赛场英雄举办退役仪式
- (2025-10-20)今日热门!海目星:深圳市海目芯微电子装备科技有限公司是公司的参股公司
- (2025-10-20)新消息丨潮玩平台退款 部分商家要求狂扇孩子耳光5分钟
- (2025-10-20)东京股市显著反弹
- (2025-10-20)焦点关注:英镑走低:投资者静待英国本周通胀数据 11 月秋季预算前财政担忧升温
- (2025-10-20)纳睿雷达:前三季度净利润同比预增181%左右
- (2025-10-20)微创攻坚!多学科联手为高龄危重老人破局
- (2025-10-20)银杏黄了,该出发了!艾瑞泽8 PRO开启最美秋日攻略
- (2025-10-20)胆囊结石恶变并非虚言 敲响健康警钟刻不容缓
- (2025-10-20)九旬老人勇闯“生死关” 高龄手术创生命奇迹
- (2025-10-20)生死逆转!41岁心梗多器官衰竭患者成功获救
- (2025-10-20)【AI看延安】绿水青山何以就是金山银山 最新消息
- (2025-10-20)官方:波特出任瑞典国家队主帅-速看
- (2025-10-20)秀我中国 | 四川木里记录到金钱豹超高清画面
- (2025-10-20)今日快看!全城迎接!无锡的英雄们!
- (2025-10-20)星空相册|启明星伴月现身天宇
- (2025-10-20)即时看!合理的基金资产配置方案有模板吗?
- (2025-10-20)小米智造基金入股航宇智造
- (2025-10-20)全球最快动车组CR450正在开展运用考核|看热讯
- (2025-10-20)每日播报!复牌一字涨停!亿道信息“双并购”,两标的均曾冲IPO
- (2025-10-20)即时看!郑州、洛阳等多地今日下雪了
- (2025-10-20)最新:国家统计局:9月份社会消费品零售总额增长3.0%
- (2025-10-20)16天辗转求医无门 这家医院给出“希望答案”
- (2025-10-20)一夜3笔签约达成!杜兰特降薪3000万,杨瀚森2大队友提前续约
- (2025-10-20)7-0,踢疯了!日本国脚轰3球+射手榜第1,帮助欧战队稳居第1
- (2025-10-20)10月20日3D玻璃板块涨幅达2% 观天下
- (2025-10-20)今日看点:国家统计局:9月份70个大中城市中各线城市商品住宅销售价格环比下降