离线环境一步部署OCR文字识别程序

news/2025/1/5 6:52:14/文章来源:https://www.cnblogs.com/cy2011/p/18648323

前言

百度、阿里等的OCR接口需要联网环境,并且超过免费/试用次数后需要付费。一般政务项目因为信息安全要求都部署在独立内网,有没有离线免费的OCR实现方案?下文基于EasyOCR实现一步部署,可下载直接使用。

EasyOCR

EasyOCR支持离线部署,可免费使用(支持Apache-2.0 license协议),并且在配置不高的机器中也可以使用(可以使用CPU计算)。EasyOCR支持80多种流行语言,如拉丁文、中文、阿拉伯文、英文等。EasyOCR部署和使用都非常简单,可以命令行启动,也可以python代码运行,只有几行简单代码就可以实现文字识别功能。

安装

  1. python或conda环境搭建,参考python环境搭建
  2. conda create -n ocr 创建conda虚拟环境
  3. conda activate ocr 进入虚拟环境
  4. conda install python=3.10 安装python3.9以上版本
  5. pip install easyocr 安装EasyOCR
  6. pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu124 按照官方文档重新安装torch机器学习库,如果不重新安装程序运行中可能调用不到GPU,如果没有GPU或不使用GPU默认使用CPU计算
    • torch官方文档地址https://pytorch.org/get-started/locally/
    • 使用代理网络安装,加--proxy=http://host:port参数

使用

  1. Python程序方式识别
  • easyocr.Reader会自动下载模型, 默认存放在~/.EasyOCR/model目录,如C:\Users\Administrator\.EasyOCR\model
  • 如果手动下载模型,可以用model_storage_directory参数,指定模型目录,easyocr.Reader(['ch_sim', 'en'], model_storage_directory="models")
  • reader.readtext如果不指定detail参数,还会输出边界框(bounding box)、可信度(confident level)等数据。
import easyocrreader = easyocr.Reader(['ch_sim', 'en'])while True:file_name = input("请输入图片文件名(输入q退出程序):")if file_name.lower() == 'q':print("程序退出...")breaktry:result = reader.readtext(file_name, detail=0)if result:print("识别结果:")for text in result:print(text)else:print("未识别到文本...")except Exception as e:print(f"识别错误:{e}。")
  1. 命令行方式识别
  • 命令行方式启动一次识别一次,python代码更灵活启动一次可循环识别多次,以后还可升级为web api方式调用。
  • 识别命令,easyocr -l ch_sim en -f C:\Users\Administrator\Desktop\test.png --detail=0 --gpu=True --model_storage_directory=d:\models
    • -f 指定要识别的图片
    • --model_storage_directory 指定模型路径,这个参数可忽略

与百度OCR对比效果

百度OCR识别结果

EasyOCR识别结果

原图

程序和模型文件已打包,可下载解压后打开run.bat一键运行(python环境已集成到压缩包中),关注下面公众号回复ocr下载

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/863092.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

昆明理工大学25届MBA复试资料

昆明理工大学25届MBA复试资料介绍 昆明理工大学MBA工商管理考研复试群:679724235 作者:唐维康 QQ1352517362 包含内容 全部内容如下:01、往年面试真题分为了专业知识问答、英语口语、社会类问题、综合面试问题四类,为去年上岸的面试题。02、专业英语词汇05、MBA复试1V1辅导课…

Alexander ——2024年报

Alexander ——2024年报Alexander ——2024年报 小总结 知己知彼,百战不殆。2024下半年找到了自己学习的方向,也认识很多的师傅,深入领域学习,无时不刻不在CTF的路上,逐渐建立一个完整的知识库体系。 今年的成长变化与进步 所学习的知识 Misc大部分编码体制皮亚诺夫曲线,希伯…

2025 多校冲刺省选模拟赛 1

第一次!输输输!2025 多校冲刺省选模拟赛 1 切割蛋糕(cake) 签到题 本质上是求 \(a\) 序列最小满足所有前缀平均值均大于全局平均值的循环位移,考虑 Raney 引理,找到斜率 \(\dfrac{s}{n}\) 所经过截距最小的点,易知没有无解情况。 时间复杂度 \(O(n)\)。 游乐园(park) …

IntelliJ IDEA 2024 安装激活详细使用教程(激活至2026,实测是永久,亲测!)

开发工具推荐:IntelliJ IDEA 2024 安装激活详细使用教程(激活至2026,实际上永久,亲测!)申明:本教程 IntelliJ IDEA补丁、激活码均收集于网络,请勿商用,仅供个人学习使用,如有侵权,请联系作者删除。若条件允许,希望大家购买正版 !卸载老版本 IDEA 首先,如果小伙伴的…

文件及文件夹的对比工具:Beyond Compare v5.0修改版(无需手动激活)

前言 Beyond Compare是一款文件及文件夹(目录)的对比工具。Beyond Compare不仅可以快速比较出两个目录的不同,还可以比较每个文件的内容,而且可以任意显示比较结果。Beyond Compare程序内建了文件浏览器,方便您对文件、文件夹、压缩包、FTP网站之间的差异比对以及资料同步…

LGV 引理

无。LGV 引理 概述 参考 OI Wiki Lindstrm–Gessel–Viennot lemma,即 LGV 引理,可以用来处理有向无环图上不相交路径计数等问题。 引理定义方阵 \(M\)。结论是: \[\det(M) = \sum_{S:A\to B} (-1)^{sgn(\sigma(S))} \prod_{i=1}^n \omega(S_i) \]其中 \(S:A\to B\) 表示不相…

【python复习随记】

缩进要对多行语句:使用反斜杠\ total = item_one + \item_two + \item_three在 [], {}, 或 () 中的多行语句,不需要使用反斜杠 \ total = [item_one, item_two, item_three,item_four, item_five]复数complex a+bj : a实部 b虚部 j虚数单位 字符串 (1)多行字符串:三引号( …

windows11连接蓝牙耳机声音差的解决方案

前期在使用Windows 10时,我的XM3通常是有Hands Free和正常输出两个通道的,走Hands Free通道则会触发通话模式,可以自己调整以适应不同的需求。 但是升级到Windows 11后,发现只剩下了一个耳机输出通道,但是音质直接降为通话音质,多次升降级无果,调整音质选项也没有作用。…

【政策解读】《电力监控系统安全防护规定》今日施行!

《电力监控系统安全防护规定》旨在提升电力监控系统的安全性和可靠性,确保电力系统的安全稳定运行。今日起施行,主要内容: 1、总则:《电力监控系统安全防护规定》旨在强化电力监控系统安全防护,保障电力系统安全稳定运行。规定适用于中国境内的电力监控系统运营者及相关单…

同硕计算机专业考研必备:统考+课程学习资料大放送!

同硕计算机,统考,课程学习,源码资料考研之路,道阻且长。对于计算机专业的学子来说,备考之路更是充满挑战。为了帮助广大考生高效备战,我在此精心整理了一套同硕计算机专业统考及课程学习资料,并免费分享给大家! 一、资料亮点:1. 同硕-计算机专业-统考历年真题,全部免…

【有源码】医院挂号系统+SpringBoot+VUE+前后端分离

学弟,学妹好,我是爱学习的学姐,今天带来一款优秀的项目:医院挂号系统。 本文介绍了系统功能与部署安装步骤,如果您有任何问题,也请联系学姐,偶现在是经验丰富的程序员! 一. 系统演示 管理后台-截图 前端-截图视频演示 https://githubs.xyz/show/329.mp4二. 系统概述 【…

基于图像形态学处理和凸包分析法的指尖检测matlab仿真

1.算法运行效果图预览 (完整程序运行后无水印)测试样本1: 测试样本2: 测试样本3: 2.算法运行软件版本 matlab2022a3.部分核心程序 (完整版代码包含详细中文注释和操作步骤视频)%提取手部轮廓坐标 handxy=func_find_hand_pxy(Im0_bw,Im0,Im0edge);figure; imshow(Im0); t…