找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 51|回复: 2

[辅助教学] 超强OCR识别,速度快(支持图片,PDF数学公式以及化学符号)MinerU-0.13.1

[复制链接]
发表于 6 小时前 | 显示全部楼层 |阅读模式
MinerU:OCR 领域的扛把子
先说说 MinerU 这个项目在 OCR 圈子的地位
MinerU 由上海人工智能实验室的 OpenDataLab 团队开发,最初诞生于 InternLM 大模型的预训练数据处理过程中
做过 RAG 的朋友应该都知道,文档解析是 RAG 流水线上最关键的一环——你的知识库质量上限,就取决于你的文档解析能力
而 MinerU 几乎是开源文档解析工具的事实标准:
全格式覆盖:支持 PDF、图片、DOCX 输入,输出 Markdown 和 JSON
109 种语言的 OCR 支持
全平台兼容:Windows、Linux、Mac,CPU/GPU/NPU/MPS 都能跑
功能全面:自动去除页眉页脚页码、保留文档结构、提取表格公式、处理复杂多栏布局
PixPin_2026-05-09_12-22-14.png
PixPin_2026-05-09_12-22-36.png
PixPin_2026-05-09_12-23-01.png
PixPin_2026-05-09_12-23-29.png


ocr.rar

327 Bytes, 下载次数: 7

售价: 100 RMB金钱  [记录]

回复

使用道具 举报

发表于 6 小时前 | 显示全部楼层
回复

使用道具 举报

发表于 5 小时前 | 显示全部楼层
好东西必需支持
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|腾飞在线 ( 冀ICP备05002530号 )

GMT+8, 2026-5-9 19:19 , Processed in 0.101217 second(s), 20 queries .

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表