OSSSR.COM
软件资源下载平台

Umi-OCR 2.1.4 绿色版 - ORC软件

Umi-OCR图片转文字识别软件,也是完全离线的ORC软件。Umi-OCR支持截屏/批量导入图片,支持多国语言、合并段落、竖排文字。可排除水印区域,提取干净的文本,基于 PaddleOCR 进行开发。

项目地址:

截屏

Umi-OCR 截屏

功能摘要

  1. 方便:解压即用,离线运行,无需网络。
  2. 批量:可批量导入处理图片,结果保存到本地 txt / md / jsonl 多种格式文件。也可以即时截屏识别。
  3. 高效:采用 PaddleOCR-json C++ 识别引擎。只要电脑性能足够,通常比在线OCR服务更快。
  4. 精准:默认使用PPOCR-v3模型库。除了能准确辨认常规文字,对手写、方向不正、杂乱背景等情景也有不错的识别率。可设置忽略区域排除水印、设置文块后处理合并排版段落,得到规整的文本。

更新日志

https://github.com/hiroi-sora/Umi-OCR/releases/

Version 2.1.4

2024-08-31
修复:引擎原始输出项的"text"为空时,导致文本分析越界的错误。
新增UI语言:葡萄牙语 Português 。
PaddleOCR 插件相关:
修复:布尔类型选项不生效的问题。
修复: 繁体中文 配置文件错误的问题。
优化:调整默认线程/内存限制,默认内存占用不超过系统总内存的一半。
优化:调整识别语言库结构,精简不必要的文件。
Linux 版本相关:
优化:glibc 依赖降级至 2.31 ,兼容 Debian-11 等发行版。
修复:Docker 部署 在部分旧系统中报错 'code': 803 的问题。

Version 2.1.3

2024-07-24
新推出 Linux (Debian) 平台版本。
新增:HTTP 文档识别接口。👉 文档
修复:文档中宽高为0的异常图片会导致任务卡住。

bate.1 版本之后的更新:
修复:HTTP文档识别接口上传的文件名含非ascii字符时,该字符可被保留。
优化:HTTP文档识别接口的 Python示例 和 Html示例 代码。
优化:排版解析的 单栏-单行 方案,对于间隔较大的两个相邻文本块,会添加空格作为间隔符。

Version 2.1.2

新增:批量任务(图片、文档)支持 暂停任务 。只要不退出软件,在待机/休眠后可以恢复任务。
新增:文档任务支持保存为 单层纯文本PDF 。
新增:HTTP OCR接口 允许设置 忽略区域 参数。
新增:HTTP 二维码接口 允许设置 图像预处理 参数。
新增:命令行--screenshot允许 指定屏幕范围 ,自动进行截图。
修复:文档内容提取和写入时的坐标旋转、比例适配问题。
修复:截图预览 & 记录面板中,跨区块复制文本时,尾块的复制字数不正确。
优化:批量文档标签页,拖入大量文件、提交大批任务时的性能和流畅度。
优化:文档任务保存的文件名规则。
UI:优化一些布局,调整一些文本,美化一些视觉效果。

版本区别

  • Paddle 引擎插件版:性能好,速度快,占用率高,适合高配机器。不兼容奔腾、赛扬、凌动CPU
  • Rapid 引擎插件版:速度稍慢,内存占用低,适合低配机器,兼容性好

下载地址

Umi-OCR 2.1.4 绿色版
https://url20.ctfile.com/d/12493720-59653474-c546f4【osssr】
https://www.123pan.com/s/uhN9-WHXD.html
https://osssr.lanzoux.com/b01xsso3i

2
转载请注明出处:OSSSR.COM » Umi-OCR 2.1.4 绿色版 - ORC软件

评论 3

  1. #2

    非常好用,非常感谢大佬分享。

    豫园9个月前 (03-31)回复
  2. #1

    两个版本有什么区别?

    yst0881年前 (2023-11-20)回复
    • Paddle 引擎插件版
      (性能好,速度快,占用率高,适合高配机器。不兼容奔腾、赛扬、凌动CPU)

      Rapid 引擎插件版
      (速度稍慢,内存占用低,适合低配机器,兼容性好)

      Zero1年前 (2023-11-20)回复

捐助就是我最大的动力

非常感谢你的打赏,我们将继续给力更多优质内容,让我们一起创建更加美好的网络世界!

支付宝扫一扫

微信扫一扫

登录

找回密码

注册

获取邀请码