c++ poencv Project2 - Document Scanner

惯例先上结果图:

本文提供一种文本提取思路:

1、首先图像预处理:灰度转换、高斯模糊、边缘提取,膨胀。

Mat preProcessing(Mat img) 
{cvtColor(img, imgGray, COLOR_BGR2GRAY);GaussianBlur(imgGray, imgBlur, Size(3, 3), 3, 0);Canny(imgBlur, imgCanny, 25, 75);Mat kernel = getStructuringElement(MORPH_RECT, Size(3, 3));dilate(imgCanny, imgDil, kernel);//erode(imgDil, imgErode, kernel);return imgDil;
}

2、预处理之后,获得轮廓特征、从而找到最大矩形,获取最大矩形的坐标。

vector<Point> getContours(Mat Dil) {vector<vector<Point>> contours;vector<Vec4i> hierarchy;//contours定义为“vector<vector<Point>> contours”,是一个双重向量(向量内每个元素保存了一组由连续的Point构成的点的集合的向量),每一组点集就是一个轮廓,有多少轮廓,contours就有多少元素;/*  hierarchy包含4个值的数组:[Next, Previous, First Child, Parent]Next:与当前轮廓处于同一层级的下一条轮廓举例来说,前面图中跟0处于同一层级的下一条轮廓是1,所以Next = 1;同理,对轮廓1来说,Next = 2;那么对于轮廓2呢?没有与它同一层级的下一条轮廓了,此时Next = -1。Previous:与当前轮廓处于同一层级的上一条轮廓跟前面一样,对于轮廓1来说,Previous = 0;对于轮廓2,Previous = 1;对于轮廓2a,没有上一条轮廓了,所以Previous = -1。First Child:当前轮廓的第一条子轮廓比如对于轮廓2,第一条子轮廓就是轮廓2a,所以First Child = 2a;对轮廓3,First Child = 3a。Parent:当前轮廓的父轮廓比如2a的父轮廓是2,Parent = 2;轮廓2没有父轮廓,所以Parent = -1。*///RETR_EXTERNAL//这种方式只寻找最高层级的轮廓,也就是只寻找最外层轮廓://CV_CHAIN_APPROX_SIMPLE:仅保存轮廓的拐点信息,把所有轮廓拐点处的点保存入contours向量内,拐点与拐点之间直线段上的信息点不予保留;findContours(Dil, contours, hierarchy, RETR_EXTERNAL, CHAIN_APPROX_SIMPLE);//drawContours(img, contours, -1, Scalar(255, 0, 255),2);vector<vector<Point>>conPoly(contours.size());vector<Rect>boundRect(contours.size());vector<Point> biggest;int maxArea = 0;//排除干扰for (int i = 0; i < contours.size(); i++) {//计算轮廓面积 int area = contourArea(contours[i]);string objectType;//cout << area <<"  ";if (area > 1000 ) {//arcLength(contours[i], true);计算轮廓周长  //InputArray类型的curve,输入的向量,二维点(轮廓顶点),可以为std::vector或Mat类型。//bool类型的closed,用于指示曲线是否封闭的标识符,一般设置为true。float peri = arcLength(contours[i], true);对图像轮廓点进行多边形拟合approxPolyDP(contours[i], conPoly[i], 0.02 * peri, true);//cout << area << endl;if (area > maxArea && conPoly[i].size()==4 ) {//绘制轮廓//drawContours(imgOriginal, conPoly, i, Scalar(255, 0, 255), 2);biggest = {conPoly[i][0],conPoly[i][1], conPoly[i][2], conPoly[i][3]};maxArea = area;//cout << maxArea << endl;}//绘制矩形框//rectangle(imgOriginal, boundRect[i].tl(), boundRect[i].br(), Scalar(0, 255, 0), 5);}}return biggest;
}

获取坐标之后,要进行仿射提取出文本,不过坐标提取出来的是0312(矩形从左到右从上到下标记),要变成0123。之后才能仿射,参考另一篇文章:轮廓提取、矩形标记时,点的位置需要重标-CSDN博客

全部代码实现:对于绘制函数可以视情况显示。

#include <opencv2/imgcodecs.hpp>
#include <opencv2/highgui.hpp>
#include <opencv2/imgproc.hpp>
#include <opencv2/objdetect.hpp>
#include <iostream>
using namespace std;
using namespace cv;Document Scanner     ///Mat imgOriginal, imgGray, imgCanny, imgDil, imgThre, imgBlur, imgWarp, imgCrop;
vector<Point>initialPoints, docPoints;float w = 420, h = 596;Mat preProcessing(Mat img) 
{cvtColor(img, imgGray, COLOR_BGR2GRAY);GaussianBlur(imgGray, imgBlur, Size(3, 3), 3, 0);Canny(imgBlur, imgCanny, 25, 75);Mat kernel = getStructuringElement(MORPH_RECT, Size(3, 3));dilate(imgCanny, imgDil, kernel);//erode(imgDil, imgErode, kernel);return imgDil;
}vector<Point> getContours(Mat Dil) {vector<vector<Point>> contours;vector<Vec4i> hierarchy;//contours定义为“vector<vector<Point>> contours”,是一个双重向量(向量内每个元素保存了一组由连续的Point构成的点的集合的向量),每一组点集就是一个轮廓,有多少轮廓,contours就有多少元素;/*  hierarchy包含4个值的数组:[Next, Previous, First Child, Parent]Next:与当前轮廓处于同一层级的下一条轮廓举例来说,前面图中跟0处于同一层级的下一条轮廓是1,所以Next = 1;同理,对轮廓1来说,Next = 2;那么对于轮廓2呢?没有与它同一层级的下一条轮廓了,此时Next = -1。Previous:与当前轮廓处于同一层级的上一条轮廓跟前面一样,对于轮廓1来说,Previous = 0;对于轮廓2,Previous = 1;对于轮廓2a,没有上一条轮廓了,所以Previous = -1。First Child:当前轮廓的第一条子轮廓比如对于轮廓2,第一条子轮廓就是轮廓2a,所以First Child = 2a;对轮廓3,First Child = 3a。Parent:当前轮廓的父轮廓比如2a的父轮廓是2,Parent = 2;轮廓2没有父轮廓,所以Parent = -1。*///RETR_EXTERNAL//这种方式只寻找最高层级的轮廓,也就是只寻找最外层轮廓://CV_CHAIN_APPROX_SIMPLE:仅保存轮廓的拐点信息,把所有轮廓拐点处的点保存入contours向量内,拐点与拐点之间直线段上的信息点不予保留;findContours(Dil, contours, hierarchy, RETR_EXTERNAL, CHAIN_APPROX_SIMPLE);//drawContours(img, contours, -1, Scalar(255, 0, 255),2);vector<vector<Point>>conPoly(contours.size());vector<Rect>boundRect(contours.size());vector<Point> biggest;int maxArea = 0;//排除干扰for (int i = 0; i < contours.size(); i++) {//计算轮廓面积 int area = contourArea(contours[i]);string objectType;//cout << area <<"  ";if (area > 1000 ) {//arcLength(contours[i], true);计算轮廓周长  //InputArray类型的curve,输入的向量,二维点(轮廓顶点),可以为std::vector或Mat类型。//bool类型的closed,用于指示曲线是否封闭的标识符,一般设置为true。float peri = arcLength(contours[i], true);对图像轮廓点进行多边形拟合approxPolyDP(contours[i], conPoly[i], 0.02 * peri, true);//cout << area << endl;if (area > maxArea && conPoly[i].size()==4 ) {//绘制轮廓//drawContours(imgOriginal, conPoly, i, Scalar(255, 0, 255), 2);biggest = {conPoly[i][0],conPoly[i][1], conPoly[i][2], conPoly[i][3]};maxArea = area;//cout << maxArea << endl;}//绘制矩形框//rectangle(imgOriginal, boundRect[i].tl(), boundRect[i].br(), Scalar(0, 255, 0), 5);}}return biggest;
}void drawPoints(vector<Point>points, Scalar color)
{for (int i = 0; i < points.size(); i++){circle(imgOriginal, points[i], 10, color, FILLED);putText(imgOriginal, to_string(i), points[i], FONT_HERSHEY_PLAIN, 4, color,4);}}vector<Point> reorder(vector<Point> points)
{vector<Point> newPoints;vector<int>  sumPoints, subPoints;for (int i = 0; i < points.size(); i++) {cout << points[i].x << ", " << points[i].y << endl;sumPoints.push_back(points[i].x + points[i].y);cout << sumPoints[i] << endl;}for (int i = 0; i < points.size(); i++) {subPoints.push_back(points[i].x - points[i].y);cout << subPoints[i] << endl;}///  冒泡实现  ////*for (int j = 0; j < sumPoints.size(); j++) {//	for (int i = 1; i < sumPoints.size(); i++) {//		if (sumPoints[j] > sumPoints[i]) {//			newPoints = points[i];//			points[i] = points[j];//			points[j] = newPoints;//		}//	}//}//if (points[1].x - points[0].x < points[2].x - points[0].x) {//	Point p;//	p = points[1];//	points[1] = points[2];//	points[2] = p;//}*/newPoints.push_back(points[min_element(sumPoints.begin(),sumPoints.end()) - sumPoints.begin()]);newPoints.push_back(points[max_element(subPoints.begin(), subPoints.end()) - subPoints.begin()]);newPoints.push_back(points[min_element(subPoints.begin(), subPoints.end()) - subPoints.begin()]);newPoints.push_back(points[max_element(sumPoints.begin(), sumPoints.end()) - sumPoints.begin()]);return newPoints;
}Mat getWarp(Mat img, vector<Point> points, float w, float h) {Point2f src[4] = { points[0], points[1], points[2], points[3]};Point2f dst[4] = { {0.0f,0.0f},{w,0.0f},{0.0f,h},{w,h} };// 透视变换,将图片投影到一个新的视平面,也称投影映射// src 输入图像四个点坐标 //dst 输出图像四个点坐标Mat matrix = getPerspectiveTransform(src, dst);//透视变换,img:原图像 imgWarp:输出图像 matrix:变换矩阵,Point(w,h):宽高 warpPerspective(img, imgWarp, matrix, Point(w, h));return imgWarp;
}void main() {string path = "Learn-OpenCV-cpp-in-4-Hours-main\\Resources\\paper.jpg";imgOriginal = imread(path);resize(imgOriginal, imgOriginal, Size(), 0.5, 0.5);// PrepropcessingimgThre = preProcessing(imgOriginal);// Get Contours - BiggestinitialPoints = getContours(imgThre);//drawPoints(initialPoints, Scalar(255, 0, 0));docPoints = reorder(initialPoints);//drawPoints(docPoints, Scalar(0, 255, 0));// warpimgWarp = getWarp(imgOriginal, docPoints, w, h);//CrapRect roi(5, 5, w - (2 * 5), h - (2 * 5));imgCrop = imgWarp(roi);namedWindow("Image",WINDOW_FREERATIO);namedWindow("imgdilation", WINDOW_FREERATIO);imshow("Image", imgOriginal);imshow("imgdilation", imgThre);//imshow("imgWarp", imgWarp);imshow("imgCrop", imgCrop);waitKey(0);destroyAllWindows(); }

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/700030.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

HR人才测评:自控能力与岗位胜任力素质测评

自控能力是什么&#xff1f; 自控能力可以解释为自我控制的能力&#xff0c;指一个人在应对人事物突发事件时&#xff0c;及时调整进行的自我控制的表现&#xff0c;它是实行自我支配的一种能力&#xff0c;在能进行自主支配时&#xff0c;一个人就成熟不少了&#xff0c;也可以…

微信加粉计数器

1.采用非注入式开发&#xff0c;支持无限多开 2.每个账号都有独立的分组&#xff0c;实时远程网页数据分享 3.后台功能强大&#xff0c;操作简单&#xff0c;自动去重复&#xff0c;准确计数分秒不差

python turtle 升国旗

​一、导语 大家好,前段时间,我们画出了五星红旗,今天我们要用Python的Turtle库来绘制一个五星红旗,并让国旗上升,让我们一起来感受编程与艺术的完美结合吧!领略国家的强大!爱祖国,做一个遵纪守法的好公民。 二、效果展示 升国旗 三、开发过程 一、准备工作 首先我们…

旧衣服回收小程序:探索旧衣回收市场的创新发展

每年我国就有将近800万吨旧衣服&#xff0c;在生活水平的日益提高下&#xff0c;这个数字也在逐渐增加。目前&#xff0c;我国旧衣回收的产业链也在完善中&#xff0c;旧衣服出口贸易逐年增加&#xff0c;市场发展空间不断扩大。此外&#xff0c;旧衣回收市场投入低、风险小、利…

Python 机器学习 基础 之 监督学习 [朴素贝叶斯分类器] / [决策树] 算法 的简单说明 / [graphviz] 绘制决策树

Python 机器学习 基础 之 监督学习 [朴素贝叶斯分类器] / [决策树] 算法 的简单说明 / [graphviz] 绘制决策树 目录 Python 机器学习 基础 之 监督学习 [朴素贝叶斯分类器] / [决策树] 算法 的简单说明 / [graphviz] 绘制决策树 一、简单介绍 二、监督学习 算法 说明前的 数…

【工作篇】软件工程师的知识基础(持续更新)

目录 1. linux 知识篇 1. linux 知识篇 1. Linux API 是什么 Linux API 是指 Linux 操作系统 提供的应用程序接口&#xff0c;用于与操作系统进行交互。它包含了一系列的函数、系统调用、库函数和数据结构&#xff0c;用于实现各种系统级的操作&#xff0c;如文件操作、进程…

用Python的pynput库成为按键记录高手

哈喽&#xff0c;大家好&#xff0c;我是木头左&#xff01; 揭秘键盘输入&#xff1a;pynput库的基本介绍 无论是为了安全审计、数据分析还是创建热键操作&#xff0c;能够记录和处理键盘事件都显得尤为关键。这就是pynput库发挥作用的地方。pynput是一个Python库&#xff0c…

FinnConverter格式转换工具

FinnConverter简介 1. 简洁的操作界面 2. 支持多种格式相互转换 支持word转pdf&#xff1b;ppt转pdf&#xff1b;raw格式转png/jpng…&#xff1b;其他格式相互转换 2.1 输入格式支持 bmp、cr2、cr3、crw、cur、dcr、dng、doc、docx、gif、ico、jpeg、jpg、kdc、mos、nef、…

找到字符串中所有字母异位词 ---- 滑动窗口

题目链接 题目: 分析: 要找的是在s中和p是异位词的子串, 也就是说子串大小和p相同, 那么就是窗口大小固定的滑动窗口问题可以使用哈希数组来记录每个元素出现的个数, 定义hash1存放p中的各元素个数定义left 0; right 0;进窗口 让right指向的元素进窗口, 即更新hash2中的元素…

牛客网Java实战项目--仿牛客网社区的学习笔记

仿牛客网社区的学习笔记 1. 项目环境搭建1.1 开发社区首页 2.开发社区登录模块2.1 发送邮件2.2 开发注册功能2.3 会话管理2.4 生成验证码2.5 开发登录、退出功能2.6 显示登录信息 4 Redis实现点赞关注4.1 Spring整合Redis访问Redis的方法&#xff1a; 4.2 Redis实现点赞4.2.1 点…

【爬虫之scrapy框架——尚硅谷(学习笔记two)--爬取电影天堂(基本步骤)】

爬虫之scrapy框架--爬取电影天堂——解释多页爬取函数编写逻辑 &#xff08;1&#xff09;爬虫文件创建&#xff08;2&#xff09;检查网址是否正确&#xff08;3&#xff09;检查反爬&#xff08;3.1&#xff09; 简写输出语句&#xff0c;检查是否反爬&#xff08;3.2&#x…

TCP的滑动窗口机制和流量控制

目录 滑动窗口 流量控制 拥塞控制 滑动窗口 TCP除了保证可靠性之外&#xff0c;也希望能够尽可能高效的完成数据传输。滑动窗口就是一种提高效率的机制。以下是不引入滑动窗口的数据传输过程&#xff1a; 可以看到&#xff0c;主机A这边每次收到一个ACK才发送下一个数据。这…