用 Swift 和 Tesseract OCR 解析验证码

news/2025/3/23 6:41:30/文章来源:https://www.cnblogs.com/ocr12/p/18786096
  1. 环境准备
    1.1 安装 Xcode 和 Swift
    首先,确保你已经安装了 Xcode,并且 Swift 可用。你可以在终端中运行以下命令检查 Swift 版本:

bash

swift --version
1.2 安装 Tesseract OCR
在 macOS 上,你可以使用 Homebrew 来安装 Tesseract:

bash

brew install tesseract
安装完成后,检查 Tesseract 是否可用:

bash

tesseract --version
1.3 创建 Swift 项目
你可以使用 Xcode 创建一个 macOS 命令行工具项目,或者直接在 Swift 脚本中运行代码。

  1. 代码实现
    在 ocr.swift 文件中添加以下代码:

swift

import Foundation
import Vision
import AppKit

/// 读取验证码图片
func loadCaptchaImage(imagePath: String) -> NSImage? {
return NSImage(contentsOfFile: imagePath)
}

/// 预处理图像(灰度化 + 二值化)
func preprocessImage(image: NSImage) -> NSImage? {
guard let tiffData = image.tiffRepresentation,
let bitmap = NSBitmapImageRep(data: tiffData) else { return nil }

let width = bitmap.pixelsWide
let height = bitmap.pixelsHighlet processedBitmap = NSBitmapImageRep(bitmapDataPlanes: nil,pixelsWide: width,pixelsHigh: height,bitsPerSample: 8,samplesPerPixel: 1,hasAlpha: false,isPlanar: false,colorSpaceName: .deviceGray,bytesPerRow: 0,bitsPerPixel: 0)for x in 0..<width {for y in 0..<height {let color = bitmap.colorAt(x: x, y: y)let grayscale = color?.whiteComponent ?? 0let newColor = grayscale > 0.5 ? NSColor.white : NSColor.blackprocessedBitmap?.setColor(newColor, atX: x, y: y)}
}return processedBitmap?.nsImage

}

/// OCR 识别
func recognizeText(imagePath: String) -> String {
let process = Process()
process.executableURL = URL(fileURLWithPath: "/usr/local/bin/tesseract") // Tesseract 路径
process.arguments = [imagePath, "stdout"]

let pipe = Pipe()
process.standardOutput = pipedo {try process.run()
} catch {print("无法运行 Tesseract: \(error)")return ""
}let outputData = pipe.fileHandleForReading.readDataToEndOfFile()
let outputText = String(data: outputData, encoding: .utf8) ?? ""return outputText.trimmingCharacters(in: .whitespacesAndNewlines)

}

let imagePath = "captcha.png" // 请替换为你的验证码图片路径

print("加载验证码图片...")
if let img = loadCaptchaImage(imagePath: imagePath) {
print("预处理图像...")
if let processedImg = preprocessImage(image: img) {
print("执行 OCR 识别...")
let text = recognizeText(imagePath: imagePath)
print("识别出的验证码: (text)")
} else {
print("图像处理失败")
}
} else {
print("无法加载图像")
}
3. 代码解析
3.1 读取和预处理图像
swift

let img = loadCaptchaImage(imagePath: imagePath)
NSImage 读取图片
转换为灰度
二值化处理,增强字符对比度
3.2 运行 Tesseract OCR
swift

let process = Process()
process.executableURL = URL(fileURLWithPath: "/usr/local/bin/tesseract")
process.arguments = [imagePath, "stdout"]
通过 Process() 在 macOS 终端运行 Tesseract
解析图片文本
4. 运行程序
执行:

bash

swift ocr.swift
程序会处理验证码图片并输出识别结果。

  1. 提高识别准确率
    5.1 调整 Tesseract PSM 模式
    使用 PSM 7 以适应验证码:

swift

process.arguments = [imagePath, "stdout", "--psm", "7"]
5.2 进一步图像优化
降噪处理
字符分割

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/902712.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

小白与Android Studio的初遇

新手小白在Android Studio上运行程序的时候遇到俩问题,通过在网上各种找解决方法,最终解决了(然后就想起来继续写博客这件事儿了)。 【第一个问题】关于“Error runningapp:No target device found”。就是它找不到设备(虚拟机或者真机),所以配置虚拟机就行了。 (当我以…

20234220 实验一《Python程序设计》实验报告

20234220 2024-2025-2 《Python程序设计》实验一报告 课程:《Python程序设计》 班级: 2342 姓名: 马燕秋 学号:20234220 实验教师:王志强 实验日期:2025年3月18日 必修/选修: 公选课 1.实验内容 1.熟悉Python开发环境; 2.练习Python运行、调试技能; 3.编写程序,练…

Echarts-普通地图和3D地图实现

效果图实现代码 <template><div class="app"><h1>普通地图----------------</h1><div class="map-container" ref="map_ref"></div><h1>3D地图----------------</h1><div class="map-c…

Navicat Premium 16 For Mac 激活,无限试用,非破解,官网安装程序,Mac版Navicat无限试用

Navicat Premium 16 For Mac 激活,无限试用,非破解,官网安装程序,Mac版Navicat无限试用Navicat Premium是一个可多重连线资料库的管理工具,它可以让你以单一程式同时连线到 MySQL、SQLite、Oracle、MariaDB、Mssql、及 PostgreSQL 资料库,让管理不同类型的资料库更加的方…

Vue3 slot

6.9. 【slot】 1. 默认插槽父组件中:<Category title="今日热门游戏"><ul><li v-for="g in games" :key="g.id">{{ g.name }}</li></ul></Category> 子组件中:<template><div class="item&…

英语四级计划第三天

第三天 单词阅读 Smaller Museums From Niche to Mainstream “小而精”的小众博物馆,正在出圈出彩 Chinas museum boom has continued to rise, leading to increased attention and visibility for smaller but more specialized museums. 中国的博物馆热潮持续升温,导致规…

今日总结(app链接数据库的简单实现以及AI训练学习)

所花时间:145min 代码量(行):120 博客量:14 了解到的知识点: 今天又到了周五了,如同往常一样下午进行自学测试,今天是实现一个app数据库连接 在手机上进行查询显示的任务。 因为对于AS开发我并没有进行系统的学习,只是知道大体的框架和对AI进行训练,但是 我发现了一个…

学嵌入式C语言,看这一篇就够了(6)

C语言的语句和块 C语言标准中一共提供6种语句 注意:C语言中的语句要指明执行的操作,并且没有特殊情况,语句是按照顺序执行的一般把实现某些功能的语句整合在一起,构成一个语法单元,C语言标准的语法单元也被称为块,也被称为块语句 复合语句 复合语句可以限制语句的作用范围…

P3375 【模板】KMP

P3375 【模板】KMP 题目描述 给出两个字符串 \(s_1\) 和 \(s_2\),若 \(s_1\) 的区间 \([l, r]\) 子串与 \(s_2\) 完全相同,则称 \(s_2\) 在 \(s_1\) 中出现了,其出现位置为 \(l\)。 现在请你求出 \(s_2\) 在 \(s_1\) 中所有出现的位置。 定义一个字符串 \(s\) 的 border 为 …

Cursor 使用教程

目录核心功能TabAICHATCOMPOSER@DocsWebGitNotepadCodebase技巧和思路如果Cursor乱改代码怎么办? 核心功能 Tab 这个是Cursor最为强大的功能,使用也很简单,在编写代码的时候,如果出现了灰色的提示词,直接按Tab就可以自动补全了最后的灰色的就是提示词 Cursor的光标预测也很…

C语言学习打卡第二天(2025.3.21)

时间有点少,今天也没学多少,只把指针基础概念学了一下(例如指针变量,下标法等),题也只做了三道。