论坛风格切换切换到宽版
  • 1229阅读
  • 1回复

[应用软件]离线开源OCR图片转文字识别软件 | Umi OCR(2.1.3 正式版) [复制链接]

上一主题 下一主题
离线海豚
 

发帖
15393
金钱
463876
威望
0
贡献值
1
只看楼主 倒序阅读 使用道具 0 发表于: 2024-07-26


软件简介:

OCR图片转文字识别软件,完全离线。截屏/批量导入图片,支持多国语言、合并段落、竖排文字。可排除水印区域,提取干净的文本。基于 PaddleOCR 。


软件特点:

免费:本项目所有代码开源,完全免费。
方便:解压即用,离线运行,无需网络。
批量:可批量导入处理图片,结果保存到本地 txt / md / jsonl 多种格式文件。也可以即时截屏识别。
高效:采用 PaddleOCR-json C++ 识别引擎。只要电脑性能足够,通常比在线OCR服务更快。
精准:默认使用PPOCR-v3模型库。除了能准确辨认常规文字,对手写、方向不正、杂乱背景等情景也有不错的识别率。可设置忽略区域排除水印、设置文块后处理合并排版段落,得到规整的文本。



更新日志:

v2.1.3 主要更新
新推出 Linux (Debian) 平台版本。
新增:HTTP 文档识别接口。👉 文档
修复:文档中宽高为0的异常图片会导致任务卡住。
修复:HTTP文档识别接口上传的文件名含非ascii字符时,该字符可被保留。
优化:HTTP文档识别接口的 Python示例 和 Html示例 代码。
优化:排版解析的 单栏-单行 方案,对于间隔较大的两个相邻文本块,会添加空格作为间隔符。
开源地址:
https://github.com/hiroi-sora/Umi-OCR_v2/releases



下载地址:

城通盘:https://url61.ctfile.com/d/12483661-58663609-6aefc7?p=3333 访问码: 3333
迅雷盘:https://pan.xunlei.com/s/VNjvjMzK15IO-1ZJmZdau08OA1?pwd=62is#
夸克盘:https://pan.quark.cn/s/33f583d0e1ff
123 盘:https://www.123pan.com/s/QdiA-IZfmh.html
天翼云:https://cloud.189.cn/t/F7bqIjvquiMz 访问码:6eab



软件截图:



评价一下你浏览此帖子的感受

精彩

感动

搞笑

开心

愤怒

无聊

灌水
我爱潜水!
离线ty_stone

发帖
221
金钱
992
威望
0
贡献值
0
只看该作者 1 发表于: 2024-07-27
谢谢分享好工具
快速回复
限100 字节
 
上一个 下一个