在 Swift 中使用 Tesseract OCR 解析验证码

news/2025/3/22 21:00:00/文章来源:https://www.cnblogs.com/ocr12/p/18787119
  1. 环境准备
    1.1 安装 Xcode
    在 macOS 上开发 Swift 代码,建议安装最新版 Xcode,可以通过 App Store 下载。

1.2 安装 Tesseract OCR
在 macOS 上,我们可以使用 Homebrew 安装 Tesseract:

brew install tesseract
然后检查安装是否成功:

tesseract --version
1.3 添加 Tesseract OCR Swift 库
我们使用 TesseractOCRiOS 作为 Swift 绑定库,在 Xcode 项目的 Podfile 中添加:

pod 'TesseractOCRiOS'
然后运行:

pod install
确保你的 Xcode 项目使用 CocoaPods 进行依赖管理。

  1. 代码实现
    在 Swift 项目中,创建一个新的 Swift 文件 OCRProcessor.swift,并添加以下代码:

import UIKit
import TesseractOCR

class OCRProcessor {

/// 预处理图像:灰度化 + 二值化
func preprocessImage(_ image: UIImage) -> UIImage? {guard let cgImage = image.cgImage else { return nil }let ciImage = CIImage(cgImage: cgImage)// 应用灰度滤镜let grayscaleFilter = CIFilter(name: "CIColorControls")grayscaleFilter?.setValue(ciImage, forKey: kCIInputImageKey)grayscaleFilter?.setValue(0.0, forKey: kCIInputSaturationKey)// 应用二值化处理let thresholdFilter = CIFilter(name: "CIThresholdToAlpha")thresholdFilter?.setValue(grayscaleFilter?.outputImage, forKey: kCIInputImageKey)if let outputImage = thresholdFilter?.outputImage {let context = CIContext()if let cgImageResult = context.createCGImage(outputImage, from: outputImage.extent) {return UIImage(cgImage: cgImageResult)}}return nil
}/// OCR 识别验证码
func recognizeText(from image: UIImage) -> String? {guard let tesseract = G8Tesseract(language: "eng") else { return nil }tesseract.engineMode = .tesseractOnlytesseract.pageSegmentationMode = .singleLinetesseract.image = imagetesseract.recognize()return tesseract.recognizedText
}

}
3. 代码解析
3.1 预处理图像
灰度化处理 通过 CIColorControls 去除颜色干扰:

grayscaleFilter?.setValue(0.0, forKey: kCIInputSaturationKey)
二值化(Thresholding) 提高字符对比度:

let thresholdFilter = CIFilter(name: "CIThresholdToAlpha")
3.2 OCR 解析
加载 Tesseract OCR:

guard let tesseract = G8Tesseract(language: "eng") else { return nil }
设定 Tesseract 识别模式:

tesseract.engineMode = .tesseractOnly
tesseract.pageSegmentationMode = .singleLine
执行 OCR 识别:

tesseract.image = image
tesseract.recognize()
4. 运行 OCR 识别
在 ViewController 中调用 OCR 处理类:

import UIKit

class ViewController: UIViewController {
let ocrProcessor = OCRProcessor()

override func viewDidLoad() {super.viewDidLoad()if let image = UIImage(named: "captcha.png") {if let processedImage = ocrProcessor.preprocessImage(image) {if let recognizedText = ocrProcessor.recognizeText(from: processedImage) {print("识别出的验证码: \(recognizedText)")} else {print("OCR 识别失败")}}}
}

}
5. 提高 OCR 识别率
5.1 选择更合适的 PSM
更多内容访问ttocr.com或联系1436423940
tesseract.pageSegmentationMode = .singleChar
适用于单字符验证码,提高精准度。

5.2 进一步优化图像
去噪

字符分割

使用更好的 Tesseract 训练数据

  1. 运行项目
    确保 captcha.png 存在于 Assets 目录中,然后运行 Xcode 项目,你将会在控制台看到验证码识别结果。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/903592.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

数据结构2

概率论与数理统计1-基本概念 概率论与数理统计2-基本数据结构 概率论与数理统计3-基本数据处理技术 基本的数据结构 - 数据结构- 数据的逻辑结构- 线性结构- 线性表- 栈(特殊的线性表)- 队列(特殊的线性表)- 字符串- 数组- 广义表- 非线性结构- 树型结构- 图型结构- 数据的存储…

day7 刷牛客华为机试题+学java

https://www.nowcoder.com/exam/oj/ta?page=1&tpId=37&type=37 字符串 第一题:第二题: 省行版:逻辑版:java网课学习: 多态调用成员变量,编译看左边,运行也看左边。调用成员方法时,编译看左边,运行看右边。if(a instanceof Dog d) 导包final 修饰引用类型地址…

【Docker】MySQL、Reids、Mongodb、Nacos、RabitMQ安装指南

1 docker的下载 建议通过 火绒应用商店 或者 联想应用商店 下载 2 配置Docker 配置镜像站 https://docker.1panel.live {"builder": {"gc": {"defaultKeepStorage": "20GB","enabled": true}},"experimental": fa…

Web前端入门第 22 问:CSS 选择器一览

HTML 在语法上并无大小限制,所以其结构可以浩瀚无边,CSS 选择器的作用则是在这些复杂的 HTML 结构中进行元素定位。 示例代码 记住此代码,后面所有的 css 选择器都是基于此代码。 注意:代码中存在两个一样的 id="p1" 元素,仅为了演示效果,正常编码中请保证 id …

曼哈顿距离和切比雪夫距离

曼哈顿距离(Manhattan Distance) 解释:只能横着或竖着走,坐标上两点的距离 假设存在两点 \(A(x_1, y_1)\) \(B(x_2, y_2)\) \(dis(A, B) = |x_1 - x_2| + |y_1 - y_2|\)对于上方求曼哈顿距离的式子,有四种情况 \( \begin{cases} x_1 > x_2 & y_1 > y_2 & {…

如何设置家用威联通 NAS UPS 断电后自动关机并通知其他设备?

场景📝备注: 求轻喷, 求放过. 😅 我真的是个理线方面的白痴. 这已经是我的极限了. 😂我的家庭实验室 Homelab 服务器集群配置如下.上半部分之前已经介绍过了, 这里就不再赘述了. 今天重点介绍介绍 UPS 和 NAS 部分.1台 UPS, 型号为 APC Back-UPS 650. 插座插着: NAS 和 插…

[扫描线] 数据结构测试(2025.3.22)

暴力大赛,赛时暴力打满喜提80pts,可惜T1没想到暴力。 难度:T2<T1<T3.T1 第1题 团队 查看测评数据信息有n个工人,第i个工人的能力是v[i], 他只与能力在L[i]到R[i]之间的人在一起工作,问最多能选出多少人在一起工作。输入格式第一行,一个整数n, 1 <= n <…

centOS 上部署hadoop+mysql+hive 服务之hadoop安装

以下安装的hadoop版本是3.3.6 ,由于hadoop是运行于java环境,因此,需要提前安装java jdk并配置环境变量。 jdk的安装及配置: jdk8 国内下载路径:https://repo.huaweicloud.com/java/jdk/8u202-b08/ 可根据实际需要选择对应的jdk版本 1、下载jdkwget https://repo.huaweicl…

创建django视图和路由

第一个视图 from django.shortcuts import render from django.http import HttpResponse# Create your views here. def hello(request):msg = Hello World!!!return HttpResponse(msg)第一个路由 from django.urls import path from .views import hellourlpatterns = [path(…

8.4.3 基于循环神经网络的字符级语言模型

字符级语言模型的优缺点见下 好处:不用担心\(\left<\text{UNK}\right>\)的出现 坏处:最终的序列要长的多;训练也要复杂得多(对内存和速度的要求都要高得多) 现如今,人们一般使用单词级RNN,但是也有特殊情况会使用字符级RNN 在训练了一个RNN后,我们可以利用这个RN…

【rflysim】文档笔记:3.三维场景建模与仿真

仅为笔记,较为随意,欢迎交流⚠该博客只是个人笔记,可能包含大量未经考证的理解内容,故不建议有获取准确知识需求的朋友来阅读。 欢迎讨论指出错误:D 由于目前暂时不需要进行建模方面的内容,故仅对本文档进行一个简单的阅读了解,方便后面其他的文档阅读。 一、 三维场景建…

关于 LCA (最近公共祖先)

最近公共祖先!对于一棵树上的两个点,他们的所有公共祖先中深度最大的那一个被称为它们的最近公共祖先(LCA)。求 LCA 有很多不同的方法。倍增 倍增求 LCA,首先需要对树进行 dfs(废话),标记每个节点的直接父亲(\(2^0\) 级祖先)。然后我们就可以利用倍增的思想预处理它的…