海豚 发表于 2024-7-26 21:11:57

离线开源OCR图片转文字识别软件 | Umi OCR(2.1.3 正式版)

软件简介:

OCR图片转文字识别软件,完全离线。截屏/批量导入图片,支持多国语言、合并段落、竖排文字。可排除水印区域,提取干净的文本。基于 PaddleOCR 。


软件特点:

免费:本项目所有代码开源,完全免费。
方便:解压即用,离线运行,无需网络。
批量:可批量导入处理图片,结果保存到本地 txt / md / jsonl 多种格式文件。也可以即时截屏识别。
高效:采用 PaddleOCR-json C++ 识别引擎。只要电脑性能足够,通常比在线OCR服务更快。
精准:默认使用PPOCR-v3模型库。除了能准确辨认常规文字,对手写、方向不正、杂乱背景等情景也有不错的识别率。可设置忽略区域排除水印、设置文块后处理合并排版段落,得到规整的文本。


更新日志:

v2.1.3 主要更新
新推出 Linux (Debian) 平台版本。
新增:HTTP 文档识别接口。👉 文档
修复:文档中宽高为0的异常图片会导致任务卡住。
修复:HTTP文档识别接口上传的文件名含非ascii字符时,该字符可被保留。
优化:HTTP文档识别接口的 Python示例 和 Html示例 代码。
优化:排版解析的 单栏-单行 方案,对于间隔较大的两个相邻文本块,会添加空格作为间隔符。
开源地址:
https://github.com/hiroi-sora/Umi-OCR_v2/releases


下载地址:

城通盘:https://url61.ctfile.com/d/12483661-58663609-6aefc7?p=3333 访问码: 3333
迅雷盘:https://pan.xunlei.com/s/VNjvjMzK15IO-1ZJmZdau08OA1?pwd=62is#
夸克盘:https://pan.quark.cn/s/33f583d0e1ff
123 盘:https://www.123pan.com/s/QdiA-IZfmh.html
天翼云:https://cloud.189.cn/t/F7bqIjvquiMz 访问码:6eab


软件截图:

https://cdn-us.imgs.moe/2023/11/05/2023-11-05_143137_bqCBWO8laq.png
https://cdn-us.imgs.moe/2023/11/05/2023-11-05_142906_CeDwhPtRhh.png

ty_stone 发表于 2024-7-27 11:13:29

谢谢分享好工具
页: [1]
查看完整版本: 离线开源OCR图片转文字识别软件 | Umi OCR(2.1.3 正式版)