Anacoda3中成功配置Tesseract-OCR超详细教程!!(win7、win10)

Anacoda3中成功配置Tesseract-OCR

  • Tesseract-OCR简介
  • 安装及配置环境步骤
    • 1、在Anaconda虚拟环境中安装pytesseract第三方库
    • 2、下载tesseract-ocr安装包并安装
    • 3、环境配置
    • 检验是否安装成功
    • 修改pytesseract.py文件(很重要!)

Tesseract-OCR简介

Tesseract-OCR 最初是由惠普(HP) 实验室于 1985 年开始研发的一款 OCR 引擎, 到1995 年成为最准确的 3 款 OCR 识别引擎之一,但不久后,惠普放弃了 Tesseract 的研发与维护,将其贡献给开源软件业。在 2005 年,由美国内华达州信息技术研究所获得并与 Google(谷歌)合作对 Tesseract 进行改进和优化,直至目前, Tesseract-OCR 仍是识别精度较高的识别引擎之一。源生的 Tesseract-OCR 是采用 C 语言编写的, Pytesseract 库是 Tesseract-OCR 的 PythonAPI 封装。通过下载安装 Pytesseract 库并调用相关函数,可以实现在 Python 环境中使用
Tesseract-OCR 进行 OCR 文字识别。
以下是关于Tesseract的常用网址
下载地址:https://digi.bib.uni-mannheim.de/tesseract/
官方网站:https://github.com/tesseract-ocr/tesseract
官方文档:https://github.com/tesseract-ocr/tessdoc
语言包地址:https://github.com/tesseract-ocr/tessdata

注意事项:
1.尽量不要下载dev(开发中的版本),alpha(内部测试版,一般不向外部发布,会有很多Bug),beta(公测版本,即针对所有用户公开的测试版本)等版本。
2.建议下载最新稳定版本(目前最新版本tesseract-ocr-w64-setup-5.3.1.20230401.exe,经过测试如果安装的是旧版本,安装时若勾选了Additional Language中的Chinese可能会报错)

安装及配置环境步骤

1、在Anaconda虚拟环境中安装pytesseract第三方库

Pytesseract 库的安装与 OpenCV 库的安装基本一致,可
直接在 Anaconda Prompt 中输入“pip install pytesseract”命令进行安装。

pip install pytesseract

安装好后,如果直接运行程序会提示错误
在这里插入图片描述
接下来我们要配置环境

2、下载tesseract-ocr安装包并安装

(1) Tesseract-OCR 的安装包可在官网或其他开源项目中获取,选择与自己电脑位数相同的版本进行下载。
在这里插入图片描述
(2) 将下载好的 Tesseract-OCR 安装包双击打开,进入到安装界面,单击“Next”按钮进行下一步操作。
在这里插入图片描述
最新版多了一个语言选择界面。

在这里插入图片描述
(3) 在“License Agreement”许可协议窗口中,单击“I Agree”按钮同意安装协议进行下一步操作。
在这里插入图片描述
(4) 选择安装类型单击“Next”按钮进行下一步操作。
在这里插入图片描述

(5) 在 Tesseract-OCR 中默认的识别语言是英文,如果需要识别中文或其他文字,可在“Choose Components”选择组件窗口中,找到“Additional language data(download)”附加语言数据下载,在下面的选项中找到“Chinese(Simplified)”简体中文和“Chinese(Simplified Vertical)”竖排简体中文进行勾选,单击“Next”进行下一步操作。
在这里插入图片描述
(6) Tesseract-OCR 的安装位置可选择保持默认,也可单击“Browse”自定义安装位置,在后续的环境配置操作中会需要用到该路径,需记住 Tesseract-OCR 的安装位置,单击“Next”按钮进行下一步操作。
在这里插入图片描述
( 7) 在“Choose Start Menu Folder”选择开始菜单文件夹的窗口中,选择保持默认,单击“Install”进行安装。
在这里插入图片描述
( 8) 等待 Tesseract-OCR 安装完成后单击“Next”按钮进行下一步,最后单击“Finish”按钮结束安装。
在这里插入图片描述
在这里插入图片描述

3、环境配置

打开计算机的高级系统设置。
在这里插入图片描述
点击环境变量,找到系统变量中的Path,将Tesseract-OCR的安装路径添加进去。
在这里插入图片描述
然后新建一个系统变量TESSDATA_PREFIX,变量值为tessdata路径:
C:\Program Files\Tesseract-OCR\tessdata
在这里插入图片描述

检验是否安装成功

打开Anaconda Prompt,激活使用的虚拟环境(输入activate 环境名),默认是在base环境下。
切换到Tesseract-OCR安装路径下
cd C:\Program Files\Tesseract-OCR
在这里插入图片描述
不然会提示“不是内部或外部命令”
在这里插入图片描述
输入tesseract --version
在这里插入图片描述
输入tesseract --list-langs
在这里插入图片描述

修改pytesseract.py文件(很重要!)

在Anaconda对应虚拟环境下的pytesseract库下的pytesseract.py文件中找到tesseract_cmd = ‘tesseract’,修改成
tesseract_cmd =r’C:\Program Files\Tesseract-OCR\tesseract.exe’
(将加粗部分替换成自己的安装路径)
在这里插入图片描述
最后运行程序,成功!!!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/5872.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

H5学习(二)-- 常用标签

标签内容 一、标题标签二、表单标签啊三、段落标签四、插入图片标签五、换行标签六、列表标签七、超链接标签八、容器标签九、结构性标签十、级块性标签十一、行内语义性标签 HTML中的常用的标签 一、标题标签 <body><!--标题标签--><h1>h1标签</h1>&…

使用matplotlib制作动态图

使用matplotlib制作动态图 一、简介二、模块简介1. **FuncAnimation**类介绍2. 定义动画更新函数 三、使用matplotlib制作动画1.一步法制作动态图片2. 两步法制作动态图片 一、简介 matplotlib(https://matplotlib.org/)是一个著名的python绘图库&#xff0c;由于其灵活强大的…

NOSQL——redis的安装,配置与简单操作

目录 一、缓存的相关知识 1&#xff09;缓存的概念 2&#xff09;系统缓存 buffer与cache&#xff1a; 3&#xff09;缓存保存位置及分层结构 DNS缓存 应用层缓存 数据层缓存 分布式缓存服务&#xff1a; 数据库&#xff1a; 硬件缓存 二、关系型数据与非关系型数据…

day1-若依项目前后端分离的初步使用

响应式布局: 做好的产品能在pc端,手机,平板都能正常浏览 开发项目两种方式 1.自己从0开始写代码 2.在若依中下载拥有基础功能的源码 若依使用的mysql版本 mysql5.7 导入别人的项目如何操作 若依项目下载地址**:https://gitee.com/y_project/RuoYi-Vue.git** 可以使用揉…

【elementplus】body设置zoom后,el-table开启show-overflow-tooltip后,表格的tooltip显示会错位的解决方案

由于我的项目是无法避免使用zoom&#xff0c;所以只记录zoom后的解决方案 示例&#xff1a;明明划过的是第一行&#xff0c;tooltip却显示到了第四行的位置&#xff1b; 正确显示&#xff1a;划过第一行&#xff0c;tooltip显示在第一行的位置 代码&#xff1a;使用transfor…

Linux--用户身份切换: su

①普通用户切换成超级用户且更改路径&#xff1a;su - ②普通用户切换成超级用户且不更改路径&#xff1a;su root 或者 su ③(由普通用户切换来的)超级用户切换回普通用户&#xff1a;Ctrld ④超级用户切换成普通用户&#xff1a;su 普通用户名 ⑤普通用户a切换成普通用户b…

Java框架学习(二)SSM体系:Spring、SpringMVC、MybatisPlus

文章目录 SpringIoC控制反转DI 依赖注入BeanBean基础配置namescope Bean实例化方式Bean的生命周期 依赖注入方式依赖自动装配 Mybatis-Plus配置BaseMapper通用Service常用注解TableNameTableId雪花算法 TableFieldTableLogic 条件构造器和常用接口QueryWrapperUpdateWrapper 插…

第五节 利用Ogre 2.3实现雨,雪,爆炸,飞机喷气尾焰等粒子效果

本节主要学习如何使用Ogre2.3加载粒子效果。为了学习方便&#xff0c;直接将官方粒子模块Sample_ParticleFX单独拿出来编译&#xff0c;学习如何实现粒子效果。 一. 前提须知 如果参考官方示例建议用最新版的Ogre 2.3.1。否则找不到有粒子效果的示例。不要用官网Ogre2.3 scri…

《项目实战》 Jenkins 与 CICD、发布脚本

文章目录 在这里插入图片描述 前言1、CI/CD是什么&#xff1f;1.1、CI1.2、CD 2、jenkins的下载与安装2.1、下载2.2、安装 3、创建Java Springboot项目3.1、创建项目shell3.2、配置Maven3.3、查看项目shell结构3.4、在启动类增加日志3.4.1、创建ShellController&#xff0c;方便…

如何校验 MySQLOracle 时间字段合规性?

背景信息 在数据迁移或者数据库低版本升级到高版本过程中&#xff0c;经常会遇到一些由于低版本数据库参数设置过于宽松&#xff0c;导致插入的时间数据不符合规范的情况而触发报错&#xff0c;每次报错再发现处理起来较为麻烦&#xff0c;是否有提前发现这类不规范数据的方法&…

【机器学习】基于t-SNE数据可视化工程

一、说明 t-SNE (t-Distributed Stochastic Neighbor Embedding)是一种常用的非线性降维技术。它可以将高维数据映射到一个低维空间(通常是2D或3D)来便于可视化。Scikit-learn API提供TSNE类,以使用T-SNE方法可视化数据。在本教程中,我们将简要学习如何在 Python 中使用 TS…

element 日期选择器下拉框被覆盖

解决&#xff1a;在对应下拉框el-select 标签 添加calss属性即可。此方法不仅适用于日期下拉框&#xff0c;适用于所有下拉框 class"dropdownbox" .dropdownbox{ z-index: 10001 !important; } 图片来自&#xff1a;element ui 时间筛选样式遮盖问题修复_代码搬运媛…