python实现截图识别文字v2.0[脱离开发环境]

目录

1、简介

2、如何使用

3、完整代码

4、免费下载

5、说明文档


🍃作者介绍:双非本科大三网络工程专业在读,阿里云专家博主,专注于Java领域学习,擅长web应用开发、数据结构和算法,初步涉猎Python人工智能开发和前端开发。
🦅主页:@逐梦苍穹

📕所属专栏:项目
🍔您的一键三连,是我创作的最大动力🌹

1、简介

这个程序创建了一个屏幕截图工具的GUI应用程序,允许用户选择区域截图并进行文字识别。

它解决了以下问题:

  1. 提供了一个GUI界面,让用户选择屏幕上的区域进行截图。
  2. 使用Tesseract OCR进行文字识别,将截取的文本复制到剪贴板。
  3. 根据配置文件中的设置,可以自动删除截图。
  4. 它比微信提取文字更精确

下面是对比情况:

204ce6881de94796b0853f7d4d2d02f0.png

2、如何使用

首先会得到一个初始的文件夹,各个文件的作用如下所示(未提及的文件均不可动):

ee816aa0b15146db845574865cc3f9e0.png

切记:仔细查看说明文档!

执行初始化脚本的过程,当看见successfully则表示成功!

de839117443b7c66f5666cc44c117f2d.png

1aeb5f5a7c0dc48740545af6f3cc419a.png

执行了初始化准备环境之后,得到的文件夹结果是:

1822bc1248e3437abe12cb504a805a99.png

运行了extraction.exe之后会得到一个窗口(这个用处不大):

ce17dcad850c4796880b3dcc73d92de5.png

看到这个就证明运行成功了。接下来就可以双击设置好的快捷键,开始截图:

9b47c614c58e48ad983982c0d4296433.png

0c0b8b95560946a79520657f332d1c7a.png

这个就是截图的应用程序。

如果双击快捷键之后截图界面没有出来,则在自己电脑的状态栏点击一下打开即可(右边那个就是截图窗口):

49d9862ce96b470fa97e4224f3117004.png

3、完整代码

完整代码如下,代码即注释:

# 导入必要的模块
from datetime import datetime  # 用于获取当前日期和时间
from tkinter import *  # 用于创建 GUI 界面
import pyautogui  # 用于屏幕截图
from PIL import ImageGrab  # 用于处理图像数据
import os  # 用于文件和目录操作
import pytesseract  # 用于文字识别
import pyperclip  # 用于剪贴板操作# 设置 Tesseract OCR 的路径和配置
tesseract_exe = r'.\Tesseract-OCR\tesseract.exe'
tessdata_dir = r'.\Tesseract-OCR\tessdata'
pytesseract.pytesseract.tesseract_cmd = tesseract_exe
tessdata_dir_config = '--tessdata-dir "{}"'.format(tessdata_dir)# 创建一个名为 ScreenCaptureApp 的类
class ScreenCaptureApp:def __init__(self, root):# 初始化应用程序的根窗口self.root = rootself.root.attributes('-fullscreen', True)  # 设置窗口全屏self.root.attributes('-alpha', 0.1)  # 设置窗口透明度self.root.title("Area capture")  # 设置窗口标题# 获取屏幕的宽度和高度self.screen_width, self.screen_height = pyautogui.size()# 创建一个 Canvas 控件用于显示截图区域self.canvas = Canvas(self.root, cursor="cross")self.canvas.pack(fill=BOTH, expand=YES)# 绑定鼠标事件处理函数self.canvas.bind("<ButtonPress-1>", self.on_press)self.canvas.bind("<B1-Motion>", self.on_drag)self.canvas.bind("<ButtonRelease-1>", self.on_release)# 初始化一些坐标和变量self.start_x = Noneself.start_y = Noneself.end_x = Noneself.end_y = Noneself.rect = Noneself.mask_rect = Noneself.image_path = None# 更新窗口大小self.update_window_size()# 更新窗口大小def update_window_size(self):screen_width = self.root.winfo_screenwidth()screen_height = self.root.winfo_screenheight()self.root.geometry("%dx%d" % (screen_width, screen_height))# 鼠标按下事件处理函数def on_press(self, event):self.start_x = self.canvas.canvasx(event.x)self.start_y = self.canvas.canvasy(event.y)if self.rect:self.canvas.delete(self.rect)if self.mask_rect:self.canvas.delete(self.mask_rect)self.rect = self.canvas.create_rectangle(self.start_x, self.start_y, self.start_x, self.start_y, outline="blue", fill="blue",stipple='gray25', width=3)# 鼠标拖动事件处理函数def on_drag(self, event):cur_x = self.canvas.canvasx(event.x)cur_y = self.canvas.canvasy(event.y)self.canvas.coords(self.rect, self.start_x, self.start_y, cur_x, cur_y)self.update_mask(cur_x, cur_y)# 鼠标释放事件处理函数def on_release(self, event):self.end_x = self.canvas.canvasx(event.x)self.end_y = self.canvas.canvasy(event.y)# 计算截图区域的坐标if self.start_x < self.end_x and self.start_y < self.end_y:left = self.start_xtop = self.start_yright = self.end_xbottom = self.end_y# ... (其他情况的计算省略)# 使用 ImageGrab.grab 截取屏幕图像screenshot = ImageGrab.grab(bbox=(left, top, right, bottom))# 获取当前脚本的目录和当前日期时间script_directory = os.path.dirname(os.path.abspath(__file__))current_datetime = datetime.now().strftime("%Y-%m-%d-%H%M%S")# 构建图像文件名file_name = f"xzlScreenshot-{current_datetime}.png"self.image_path = os.path.join(script_directory, "image/" + file_name)# 保存截图到文件screenshot.save(self.image_path)# 配置 Tesseract OCR 参数custom_config = r'--oem 3 --psm 6 -c preserve_interword_spaces=1'# 使用 pytesseract 进行文字识别text = pytesseract.image_to_string(screenshot, lang='+'.join(['eng', 'chi_sim']), config=f'--tessdata-dir "{tessdata_dir}" {custom_config}')# 将识别结果复制到剪贴板pyperclip.copy(text)# 读取配置文件并检查是否需要自动删除截图with open('config.txt', 'r', encoding="utf-8") as file:content = file.read()key_value_pairs = content.strip().split('\n')for i in range(0, len(key_value_pairs)):key = key_value_pairs[i].split('=')value = key[1]if str(key[0]) == "autoDeleteImg":auto_delete_img_value = valuebreakif int(auto_delete_img_value) == int(1):if self.image_path:os.remove(self.image_path)# 关闭应用程序窗口self.root.destroy()# 更新遮罩效果def update_mask(self, cur_x, cur_y):if self.mask_rect:self.canvas.delete(self.mask_rect)self.mask_rect = self.canvas.create_rectangle(0, 0, self.root.winfo_screenwidth(), self.root.winfo_screenheight(), fill="black", )self.canvas.tag_lower(self.mask_rect)self.canvas.coords(self.mask_rect, self.start_x, self.start_y, cur_x, cur_y)# 主函数,创建应用程序对象并运行
def main():root = Tk()app = ScreenCaptureApp(root)root.mainloop()# 检查脚本是否作为主程序运行
if __name__ == "__main__":main()

4、免费下载

下载的安装包是不需要独立安装第三方模块以及环境的,都已经集成好了。

链接如下:

链接:https://pan.baidu.com/s/1X60c6Egl-CogSPOL2WTnbg?pwd=1234 
提取码:1234

5、说明文档

说明文档内容如下:

@Author: CSDN@逐梦苍穹
这是程序的说明文档。
条款和条件:
①这个应用程序是完全免费的,没有商业用途。
②本程序由"CSDN@逐梦苍穹"编写,CSDN博客账号:“https://blog.csdn.net/qq_60735796”注意事项:
①程序存放的路径必须全是英文的
②所有级别的文件夹和目录名称之间不能有空格。
③各级文件夹和目录的字符中不允许使用汉字。
④最好不要在各级文件夹和目录中使用特殊字符。使用说明:
①使用说明中未提及的文件夹,不得以任何方式删除或修改。
如果有任何更改,将影响程序的运行。②如果您准备第一次运行这个程序,请先配置好config.txt文件的内容。
config.txt文件是这个应用程序的配置文件。存储为键值对。
(请记住,“=”左侧的内容不能修改)
原始参数信息如下:autoDeleteImg=0shortcutKeys=f2LetterOfTheDriveWhereTheCurrentFileResides=DCurrentFileAbsolutePath=D:\Python\package_exe\extractionByXzl
如果你在使用该程序识别文本并将其放入剪贴板之后,希望能够自动删除图像,请设置"autoDeleteImg = 1",否则将其设置为0。
如果您想修改使用的快捷键,需要设置"shortcutKeys"的值。
(如果您不知道如何设置快捷键"shortcutKeys"的值,请运行"Check-Shortcut-Keys.exe"程序。按下相应的键,控制台将向您展示如何编写快捷键的值!)
重要的是,你需要把"LetterOfTheDriveWhereTheCurrentFileResides"设置为当前文件夹存放的驱动器字母,并将"CurrentFileAbsolutePath"的值设置为当前文件夹的绝对路径!③设置完以上参数后,双击"environmentConfiguration.bat"文件启动程序,执行程序环境的初始化操作。(该操作只需要第一次执行,以后不需要再次执行)④初始化执行环境后,可以开始执行启动文件"extract.exe"
(这是应用程序的核心启动文件,相关功能由它启动)。
(出现“Active code page: 65001”表示成功)。
此时,双击您设置的快捷键,就可以开始截图和自动识别文本到剪切板。⑤如果要识别的字符比较多,操作可能会比较慢。

如果本地有python环境的,也可以看我之前这篇:

python实现截图识别文字(已打包成exe程序)_pytesseract 自动识别截图-CSDN博客icon-default.png?t=N7T8https://blog.csdn.net/qq_60735796/article/details/133916453

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/418576.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

单体架构、微服务和无服务器架构

前言 在这篇文章中&#xff0c;我将演示在决定使用单体架构、微服务架构和无服务器架构时的权衡的简化心智模型。目标是突显每种风格的固有优势和缺陷&#xff0c;并提供关于何时选择哪种架构风格的指导。 单体架构 对于小团队或项目来说是理想的入门架构。它简单易上手&…

C++---string类

一.string类&#x1f357; C支持C风格的字符串&#xff0c;另外还提供了一种 字符串数据类型&#xff1a; string是定义在头文件string中的类&#xff0c;使用前需要包含头文件string。 #include<string> C语言中的字符串需要引用头文件#include<string.h> #includ…

Helm Dashboard — Kubernetes 中管理 Helm 版本的 GUI

Helm Dashboard 通过提供图形用户界面&#xff0c;使在 Kubernetes 中管理 Helm 版本变得更加容易&#xff0c;这是许多开发人员所期望的。它可用于在 Kubernetes 中创建、部署和更新应用程序的版本&#xff0c;并跟踪其状态。 本文将探讨 Helm Dashboard 提供的特性和优势&am…

基于Spring+mybatis+vue的饮食分享系统(Java毕业设计)

大家好&#xff0c;我是DeBug&#xff0c;很高兴你能来阅读&#xff01;作为一名热爱编程的程序员&#xff0c;我希望通过这些教学笔记与大家分享我的编程经验和知识。在这里&#xff0c;我将会结合实际项目经验&#xff0c;分享编程技巧、最佳实践以及解决问题的方法。无论你是…

Flutter首页框架搭建

1.下载flutter 2. 安装android 3.配置环境变量 关于环境搭建部分&#xff0c;哪天写一下&#xff0c;日志杂乱无章。 打开android studio 新建项目&#xff0c;选择flutter 新建文件夹创建 navigator和pages 文件夹下分别创建文件&#xff0c;tab_navigator.dart&#xff…

《PCI Express体系结构导读》随记 —— 第I篇 第2章 PCI总线的桥与配置(19)

接前一篇文章&#xff1a;《PCI Express体系结构导读》随记 —— 第I篇 第2章 PCI总线的桥与配置&#xff08;18&#xff09; 2.4 PCI总线的配置 PCI总线定义了两类配置请求&#xff0c;一个是Type 00h配置请求&#xff0c;另一个是Type 01h配置请求。PCI总线使用这些配置请求…

c# 视频播放之Vlc.DotNet.Forms

先说下优缺点 优点&#xff1a;与电脑无关&#xff0c;能播放主流编码格式视频。 缺点&#xff1a;只能播放本地视频&#xff0c;网络视频播放不了。 下面是具体操作和代码 1. 安装Vlc.DotNet.Forms 和 VideoLAN.LibVLC.Windows Vlc.DotNet.Forms 是播放库&#xff0c;Vid…

找不到mfc100.dll的解决方法,怎么修复mfc100.dll文件

当我们在使用电脑时&#xff0c;时常可能会遇到各类系统提示的错误信息。"找不到mfc100.dll" 就是这些错误之一&#xff0c;该错误提示会妨碍我们执行一些应用程序或特定代码。为了帮助读者克服这个技术障碍&#xff0c;本篇文章将详尽阐明导致该问题的根本原因&…

Flink(十三)【Flink SQL(上)SqlClient、DDL、查询】

前言 最近在假期实训&#xff0c;但是实在水的不行&#xff0c;三天要学完SSM&#xff0c;实在一言难尽&#xff0c;浪费那时间干什么呢。SSM 之前学了一半&#xff0c;等后面忙完了&#xff0c;再去好好重学一遍&#xff0c;毕竟这玩意真是面试必会的东西。 今天开始学习 Flin…

Pandas.Series.count() 非空单元格计数 详解 含代码 含测试数据集 随Pandas版本持续更新

关于Pandas版本&#xff1a; 本文基于 pandas2.1.2 编写。 关于本文内容更新&#xff1a; 随着pandas的stable版本更迭&#xff0c;本文持续更新&#xff0c;不断完善补充。 Pandas稳定版更新及变动内容整合专题&#xff1a; Pandas稳定版更新及变动迭持续更新。 Pandas API参…

对象数组变成一维数组,导出txt文件

假设对象数组格式为此 arr1: [{id: 1,title: 我是1目录,children: [{id: 11,title: 我是1-1目录,children: [{id: 111,title: 我是1-1-1目录,children: [],},],},],},{id: 2,title: 我是2目录,children: [{id: 21,title: 我是2-1目录,children: [],},],},], 页面如下 先在页面…

WEB接口测试之Jmeter接口测试自动化 (三)(数据驱动测试)

接口测试与数据驱动 1简介 数据驱动测试&#xff0c;即是分离测试逻辑与测试数据&#xff0c;通过如excel表格的形式来保存测试数据&#xff0c;用测试脚本读取并执行测试的过程。 2 数据驱动与jmeter接口测试 我们已经简单介绍了接口测试参数录入及测试执行的过程&#xff0…