Swift 解析验证码（结合 Tesseract OCR）-编程知识

Swift 解析验证码（结合 Tesseract OCR）

news/2025/3/19 19:17:17/文章来源:https://www.cnblogs.com/ocr12/p/18781620

环境准备
1.1 安装 Xcode 和 Swift
如果尚未安装 Xcode，可以在 Mac App Store 下载 Xcode，并确保 Swift 可用：

bash

swift --version
1.2 安装 Tesseract OCR
使用 Homebrew 安装：

brew install tesseract
安装完成后，检查 Tesseract 是否安装成功：

bash

tesseract --version
1.3 添加 Tesseract OCR 依赖
在 Swift 项目中使用 Tesseract OCR for iOS，可以通过 CocoaPods 或 Swift Package Manager (SPM) 进行集成。

使用 CocoaPods
如果尚未安装 CocoaPods：

bash

sudo gem install cocoapods
创建 Podfile 并添加 Tesseract 依赖：

ruby

platform :ios, '13.0'
use_frameworks!

target 'CaptchaOCR' do
pod 'TesseractOCRiOS'
end
然后运行：

bash

pod install
使用 Xcode 打开 CaptchaOCR.xcworkspace。

使用 Swift Package Manager (SPM)
在 Xcode 中：

进入 File > Swift Packages > Add Package Dependency
输入 https://github.com/gali8/Tesseract-OCR-iOS.git
选择最新版本，然后添加到项目中
2. 代码实现
创建 CaptchaOCR.swift 并添加以下代码：

swift

import UIKit
import TesseractOCR

class CaptchaOCR {

// 预处理验证码图像
func preprocessImage(image: UIImage) -> UIImage? {guard let cgImage = image.cgImage else { return nil }let ciImage = CIImage(cgImage: cgImage)// 转换为灰度图像let grayscaleFilter = CIFilter(name: "CIColorControls")!grayscaleFilter.setValue(ciImage, forKey: kCIInputImageKey)grayscaleFilter.setValue(0.0, forKey: kCIInputSaturationKey) // 设为灰度grayscaleFilter.setValue(1.2, forKey: kCIInputContrastKey) // 增强对比度guard let outputImage = grayscaleFilter.outputImage else { return nil }let context = CIContext()guard let cgResult = context.createCGImage(outputImage, from: outputImage.extent) else { return nil }return UIImage(cgImage: cgResult)
}// 使用 Tesseract OCR 进行识别
func recognizeCaptcha(image: UIImage, completion: @escaping (String?) -> Void) {DispatchQueue.global(qos: .userInitiated).async {if let tesseract = G8Tesseract(language: "eng") {tesseract.engineMode = .tesseractOnlytesseract.pageSegmentationMode = .singleLinetesseract.image = imagetesseract.recognize()DispatchQueue.main.async {completion(tesseract.recognizedText?.trimmingCharacters(in: .whitespacesAndNewlines))}} else {DispatchQueue.main.async {completion(nil)}}}
}

}

// 示例调用
let captchaOCR = CaptchaOCR()
if let image = UIImage(named: "captcha.png") {
if let processedImage = captchaOCR.preprocessImage(image: image) {
captchaOCR.recognizeCaptcha(image: processedImage) { result in
print("识别出的验证码: (result ?? "失败")")
}
}
}
3. 代码解析
3.1 图像预处理
为了提高 OCR 识别率，我们对验证码进行优化：

转换为灰度图像：
swift

grayscaleFilter.setValue(0.0, forKey: kCIInputSaturationKey)
增强对比度：
swift

grayscaleFilter.setValue(1.2, forKey: kCIInputContrastKey)
3.2 OCR 解析
初始化 Tesseract OCR：
swift

if let tesseract = G8Tesseract(language: "eng") {
设置识别模式：
swift

tesseract.pageSegmentationMode = .singleLine
执行 OCR 识别：
swift

tesseract.recognize()
获取识别结果：
swift

completion(tesseract.recognizedText?.trimmingCharacters(in: .whitespacesAndNewlines))
4. 运行程序
如果是 iOS 项目，可以在 ViewController.swift 中调用：

swift

override func viewDidLoad() {
super.viewDidLoad()

let captchaOCR = CaptchaOCR()
if let image = UIImage(named: "captcha.png") {if let processedImage = captchaOCR.preprocessImage(image: image) {captchaOCR.recognizeCaptcha(image: processedImage) { result inprint("识别出的验证码: \(result ?? "失败")")}}
}

}
5. 提高 OCR 识别率
5.1 选择合适的 PSM 模式
Tesseract 提供了不同的页面分割模式：

swift

tesseract.pageSegmentationMode = .singleChar // 适用于单字符验证码
PSM 6：适用于单行文本（推荐）
PSM 7：处理单个文本行
PSM 10：单字符模式（适用于单字符验证码）
5.2 只识别特定字符
如果验证码仅包含字母和数字：

swift

tesseract.charWhitelist = "0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZ"
5.3 进一步优化
降噪处理：可以使用 OpenCV for Swift 进行去噪优化
字符分割：如果验证码字符粘连，可尝试 OpenCV 进行字符分割
使用 CoreML 深度学习：如果 Tesseract 不能满足需求，可以结合 CoreML 训练自定义 OCR 识别模型

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.hqwc.cn/news/901659.html

如若内容造成侵权/违法违规/事实不符，请联系编程知识网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！