Python 和 Tesseract OCR 识别复杂验证码-编程知识

Python 和 Tesseract OCR 识别复杂验证码

news/2025/2/28 10:01:01/文章来源:https://www.cnblogs.com/ocr12/p/18669560

安装依赖
首先，确保已安装所需的工具和库。

安装 Tesseract
在 Windows 上，下载安装包并进行安装：Tesseract GitHub。
在 Linux 上，你可以通过以下命令安装：

bash

更多内容访问ttocr.com或联系1436423940

sudo apt-get install tesseract-ocr

安装 Python 库
使用 pip 安装 Python 库：

bash

pip install pytesseract Pillow opencv-python numpy

编写 Python 代码

python

import pytesseract from PIL import Image import cv2 import numpy as np # 设置 Tesseract 路径（如果在 Windows 上安装） # pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract.exe' def preprocess_image(image_path): # 读取图像 img = cv2.imread(image_path) # 转换为灰度图像 gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) # 高斯模糊去噪 blurred = cv2.GaussianBlur(gray, (5, 5), 0) # 自适应阈值处理：把图像转换成黑白 binary_image = cv2.adaptiveThreshold(blurred, 255, cv2.ADAPTIVE_THRESH_MEAN_C, cv2.THRESH_BINARY, 11, 2) # 使用形态学操作去除噪点：膨胀和腐蚀 kernel = np.ones((3, 3), np.uint8) dilated_image = cv2.dilate(binary_image, kernel, iterations=1) # 对图像进行轮廓检测，去除背景噪声 contours, _ = cv2.findContours(dilated_image, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE) # 在图像上绘制轮廓，去除可能的干扰 clean_image = np.zeros_like(gray) for contour in contours: if cv2.contourArea(contour) > 500: # 过滤掉小面积的轮廓 cv2.drawContours(clean_image, [contour], -1, (255, 255, 255), -1) return clean_image def recognize_captcha(image_path): # 预处理图像 processed_image = preprocess_image(image_path) # 将处理后的图像保存为临时文件 temp_image_path = "processed_captcha.png" cv2.imwrite(temp_image_path, processed_image) # 使用 Tesseract 进行 OCR 识别 text = pytesseract.image_to_string(Image.open(temp_image_path)) return text.strip() if name == 'main': # 输入验证码图像路径 captcha_image_path = 'captcha_image.png' # 识别验证码 captcha_text = recognize_captcha(captcha_image_path) print("识别的验证码是:", captcha_text)

代码解释
Tesseract 设置
如果你没有将 Tesseract 路径添加到环境变量中，可以通过以下方式设置其路径：

python

pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract.exe'

图像预处理步骤
灰度化：首先将图像转为灰度图，减少颜色信息，专注于字符形状。
高斯模糊：使用高斯模糊平滑图像，去除一些细小的噪点。
自适应阈值：使用自适应阈值将图像转为黑白二值图，这有助于增强字符的对比度，去除背景干扰。
膨胀操作：通过膨胀操作增强字符的轮廓，使其更加清晰。
轮廓检测：通过轮廓检测来排除一些干扰元素，仅保留字符区域。通过过滤小面积的轮廓，去除不必要的干扰。
OCR 识别
图像处理后，我们将图像传给 Tesseract OCR 进行文字识别。pytesseract.image_to_string() 会返回识别的文本内容。
运行程序
准备好验证码图像（例如 captcha_image.png），然后运行代码。输出将显示识别出的验证码文本：

makefile

识别的验证码是: ab2c1

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.hqwc.cn/news/868744.html

如若内容造成侵权/违法违规/事实不符，请联系编程知识网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！