(原标题:【券商聚焦】海通国际:DeepSeek-OCR 2技术突破重塑文档理解行业)
金吾财讯|海通国际发布研报指,DeepSeek团队发布的DeepSeek-OCR 2模型通过突破性视觉编码器技术,显著提升复杂文档处理能力。该模型采用"因果阅读顺序"技术路径,在OmniDocBench v1.5基准测试中获得91.09%综合得分,较上代提升3.73个百分点,编辑距离指标优化至0.057。
研报指出,该模型以256-1120个视觉token的高效压缩处理复杂文档,较Gemini 3 Pro的0.115编辑距离表现更优(0.100)。其开源Apache-2.0协议及30亿参数规模,适合PDF转Markdown、表格公式抽取等企业应用场景,实测线上日志图像处理的文本重复率从6.25%降至4.17%。
技术架构上,模型通过Qwen2-500M轻量语言模型和因果注意力机制,实现视觉信息流的逻辑重组,为视觉-语言模型提供新设计路径。研发团队已明确后续迭代方向,包括优化报纸类文本密集文档的处理能力。
风险方面需关注行业竞争加剧、供应链风险及算力成本控制问题。