超强OCR识别,速度快(支持图片,PDF数学公式以及化学符号)MinerU-0.13.1
MinerU:OCR 领域的扛把子先说说 MinerU 这个项目在 OCR 圈子的地位
MinerU 由上海人工智能实验室的 OpenDataLab 团队开发,最初诞生于 InternLM 大模型的预训练数据处理过程中
做过 RAG 的朋友应该都知道,文档解析是 RAG 流水线上最关键的一环——你的知识库质量上限,就取决于你的文档解析能力
而 MinerU 几乎是开源文档解析工具的事实标准:
全格式覆盖:支持 PDF、图片、DOCX 输入,输出 Markdown 和 JSON
109 种语言的 OCR 支持
全平台兼容:Windows、Linux、Mac,CPU/GPU/NPU/MPS 都能跑
功能全面:自动去除页眉页脚页码、保留文档结构、提取表格公式、处理复杂多栏布局
https://mineru.net/client 好东西必需支持 xxxman007 发表于 2026-5-9 13:03
https://mineru.net/client
感谢 估计用不了多久就要收费了 试试。谢谢分享。 就是说通过复制粘贴可以直接转换?
页:
[1]