解析验证码:结合 Tesseract OCR 进行文本识别

news/2025/3/16 23:02:21/文章来源:https://www.cnblogs.com/ocr12/p/18775905
  1. 环境准备
    1.1 安装 Rust
    Rust 可通过官方的 rustup 进行安装:

bash

curl --proto '=https' --tlsv1.2 -sSf https://sh.rustup.rs | sh
安装完成后,检查 Rust 是否可用:

bash

rustc --version
1.2 安装 Tesseract OCR
Linux(Ubuntu)
bash

sudo apt update
sudo apt install tesseract-ocr libtesseract-dev
macOS(Homebrew)
bash

brew install tesseract
Windows
从 Tesseract GitHub 下载并安装。

检查 Tesseract 是否安装成功:

bash

tesseract --version
2. 创建 Rust 项目
使用 Cargo 创建新项目:

bash

cargo new captcha_reader
cd captcha_reader
在 Cargo.toml 中添加 Tesseract 相关依赖:

toml

[dependencies]
tesseract = "0.14"
image = "0.24" # 用于处理验证码图片
3. 代码实现
修改 src/main.rs,写入以下代码:

rust
use std::process::Command;
use image::{DynamicImage, GenericImageView, GrayImage, Luma};
use tesseract::Tesseract;

fn preprocess_image(input_path: &str, output_path: &str) {
let img = image::open(input_path).expect("无法打开图片");
let gray_img = img.to_luma8(); // 转换为灰度图像

// 二值化处理
let binary_img = GrayImage::from_fn(gray_img.width(), gray_img.height(), |x, y| {if gray_img.get_pixel(x, y)[0] > 128 {Luma([255]) // 白色} else {Luma([0]) // 黑色}
});binary_img.save(output_path).expect("无法保存处理后的图片");

}

fn main() {
let input_image = "captcha.png"; // 替换为你的验证码图片
let processed_image = "processed_captcha.png";

// 预处理图片
preprocess_image(input_image, processed_image);// 使用 Tesseract OCR 解析验证码
let text = Tesseract::new(None, "eng").expect("无法初始化 Tesseract").set_image(processed_image).recognize().expect("OCR 失败");println!("识别出的验证码: {}", text.trim());

}
4. 代码解析
4.1 图像预处理
rust

fn preprocess_image(input_path: &str, output_path: &str)
读取验证码图像,转换为灰度图像,并进行二值化处理,以提高 OCR 识别率。
4.2 OCR 识别
rust

let text = Tesseract::new(None, "eng")
.expect("无法初始化 Tesseract")
.set_image(processed_image)
.recognize()
.expect("OCR 失败");
调用 Tesseract 进行验证码解析。
4.3 输出识别结果
rust

println!("识别出的验证码: {}", text.trim());
去除空格,输出 OCR 识别结果。
5. 运行程序
将 captcha.png 图片放入项目目录,然后运行:

bash

cargo run
示例输出:

makefile

识别出的验证码: X7G9H
6. 提高 OCR 识别率
6.1 选择不同的 Tesseract PSM 模式
rust

let text = Tesseract::new(None, "eng")
.expect("无法初始化 Tesseract")
.set_variable("tessedit_pageseg_mode", "6") // 单行文本模式
.set_image(processed_image)
.recognize()
.expect("OCR 失败");
6.2 限制识别字符集
rust

let text = Tesseract::new(None, "eng")
.expect("无法初始化 Tesseract")
.set_variable("tessedit_char_whitelist", "0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZ")
.set_image(processed_image)
.recognize()
.expect("OCR 失败");

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/900037.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

拉格朗日插值算法

首先介绍下作用 在平面上给定 n 个点,求一条多项式图像穿过所有的点 (每个点横坐标不同)由浅入深,首先想一个悬浮点 1 ,它在除 1 以外给定的点的横坐标上函数值都是 0 。已知它的横坐标 \(x_1\) , 怎么用函数图像表示 我们一拍脑袋发现,可以这么表示 \[f1(x) = \prod_{i =…

本地部署Gemma3模型

本地部署Gemma3模型 1. 拉取并运行 Ollama 容器 # 拉取 Ollama 镜像 docker pull ollama/ollama# 运行 Ollama 容器 docker run -d --gpus all -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama2. 进入容器并部署 Gemma3 模型(默认4B版 ) # 进入 Ollama 容…

Anaconda中启动Jupyter lab的方法

Anaconda中启动Jupyter lab的方法: 1、在Anaconda Prompt中,使用命令来启动:jupyter lab 2、在Anaconda界面中点击Jupyter lab下方的launch按钮启动,如下图所示:

React+Next.js+MaterialUI+Toolpad技术栈学习——安装

今天跟大家分享一个React+Next.js+MaterialUI技术栈的前端框架Toolpad。相关资源MaterialUI Toolpad框架效果安装运行安装命令npx create-toolpad-app@latest your-app cd your-app npm run dev文件结构 无身份认证 ├── app │ ├── (dashboard) │ │ ├── layou…

测试驱动开发(TDD)浅析

测试驱动开发(TDD:Test Driven Development)是敏捷开发中的一项核心实践,推崇通过测试来驱动整个开发的进行。TDD有别于传统“先编码,后测试”的开发过程,而是要求在编写业务代码之前,先编写测试用例。TDD的概念大致在上世纪90年代随着极限编程(XP:Extreme Programmin…

(18).命令模式

命令模式 命令模式的核心思想是将请求封装为个对象,将其作为命令发起者和接收者的中介,而抽象出来的命令对象又使得能够对一系列请求进行操作,如对请求进行排队,记录请求日志以及支持可撤销的操作等。命令模式参与者:◇命令的执行者(接收者Receiver):它单纯的只具体实现了功…

学嵌入式C语言,看这一篇就够了(5)

C语言的运算符 学习编程语言,应该遵循“字-->词-->句-->段--->章”,对于一条有意义的语句而言,是离不开标点符号的运算符指明要进行的运算和操作,操作数是指运算符的操作对象,根据运算符操作数的数目不同,C语言标准把运算符分为三种:单目运算符(一元运算符…

20242313 2024-2025-2 《Python程序设计》实验一报告

20242313 2024-2025-2 《Python程序设计》实验一报告 课程:《Python程序设计》 班级:2423 姓名:曾海鹏 学号:20242313 实验教师:王志强 实验日期:2025年3月16日 必修/选修:公选课 1.实验内容 1.熟悉Python开发环境; 2.练习Python运行、调试技能;(编写书中的程序,并…

nn.Embedding()函数详解

nn.Embedding()函数详解 nn.Embedding()函数:随机初始化词向量,词向量在正态分布N(0,1)中随机取值 输入: torch.nn.Embedding(num_embeddings, embedding_dim, padding_idx=None, max_norm=None, norm_type=2.0, scale_grad_by_freq=False, sparse=False, _weight=None) num…

htb Authority

端口扫描 nmap -sC -sV -p- -Pn -T4 10.10.11.222 Starting Nmap 7.92 ( https://nmap.org ) at 2024-10-04 19:42 CST Nmap scan report for 10.10.11.222 (10.10.11.222) Host is up (0.40s latency). Not shown: 65506 closed tcp ports (reset) PORT STATE SERVICE …

蓝桥杯14届省B

蓝桥杯14届省赛B组A:int a[105]; int day[]={0,31,28,31,30,31,30,31,31,30,31,30,31};//记录每个月有多少天 set<int> st;//记录不重复的日期void check(int mm,int dd){if (mm>12||mm<1||dd<1||dd>day[mm]) return;else st.insert(mm*100+dd);//st存日期 …