// 包含OpenCV项目所需的objdetect模块头文件
#include <opencv2/objdetect.hpp>
// 包含OpenCV项目所需的highgui模块头文件,用于图像的显示和简单操作
#include <opencv2/highgui.hpp>
// 包含OpenCV项目所需的imgproc模块头文件,用于图像处理
#include <opencv2/imgproc.hpp>
// 包含OpenCV项目所需的videoio模块头文件,用于视频的读写
#include <opencv2/videoio.hpp>
#include <iostream> // 包含输入输出流的标准头文件
#include <iomanip> // 包含输入输出流格式化的标准头文件// 使用OpenCV和标准命名空间下的所有实体
using namespace cv;
using namespace std;// 定义一个Detector类,用于行人检测
class Detector
{enum Mode { Default, Daimler } m; // 定义两种模式的枚举类型HOGDescriptor hog, hog_d; // 定义两个HOG描述子对象
public:// 构造函数,初始化模式为Default和两个描述子hog与hog_dDetector() : m(Default), hog(), hog_d(Size(48, 96), Size(16, 16), Size(8, 8), Size(8, 8), 9){// 设置HOG描述子的SVM检测器为默认的行人检测器hog.setSVMDetector(HOGDescriptor::getDefaultPeopleDetector());// 设置hog_d描述子的SVM检测器为Daimler行人检测器hog_d.setSVMDetector(HOGDescriptor::getDaimlerPeopleDetector());}// 切换检测模式的方法void toggleMode() { m = (m == Default ? Daimler : Default); }// 获取当前模式名称的方法string modeName() const { return (m == Default ? "Default" : "Daimler"); }// 执行检测的方法vector<Rect> detect(InputArray img){// 创建一个向量来存储检测到的矩形vector<Rect> found;if (m == Default)// 默认模式下使用hog描述子进行多尺度检测hog.detectMultiScale(img, found, 0, Size(8,8), Size(), 1.05, 2, false);else if (m == Daimler)// Daimler模式下使用hog_d描述子进行多尺度检测hog_d.detectMultiScale(img, found, 0, Size(8,8), Size(), 1.05, 2, true);return found; // 返回检测结果}// 调整检测矩形的方法void adjustRect(Rect & r) const
{// HOG检测器返回的矩形稍大于真实的物体,故稍微缩小矩形以获得更好的效果r.x += cvRound(r.width*0.1);r.width = cvRound(r.width*0.8);r.y += cvRound(r.height*0.07);r.height = cvRound(r.height*0.8);}
};// 定义命令行参数的keys字符串
static const string keys = "{ help h | | print help message }""{ camera c | 0 | capture video from camera (device index starting from 0) }""{ video v | | use video as input }";// main函数,程序的入口
int main(int argc, char** argv)
{// 创建CommandLineParser对象来解析命令行参数CommandLineParser parser(argc, argv, keys);parser.about("This sample demonstrates the use of the HoG descriptor.");if (parser.has("help")){// 如果存在help参数,则打印帮助信息并退出parser.printMessage();return 0;}// 获取camera和video参数int camera = parser.get<int>("camera");string file = parser.get<string>("video");if (!parser.check()){// 检查参数解析是否有误,如果有则打印错误并退出parser.printErrors();return 1;}VideoCapture cap; // 创建一个VideoCapture对象来捕获视频if (file.empty())// 如果video参数为空则从相机捕获视频cap.open(camera);else{// 否则打开指定的视频文件file = samples::findFileOrKeep(file);cap.open(file);}if (!cap.isOpened()){// 如果视频流打不开则打印错误信息并退出cout << "Can not open video stream: '" << (file.empty() ? "<camera>" : file) << "'" << endl;return 2;}cout << "Press 'q' or <ESC> to quit." << endl;cout << "Press <space> to toggle between Default and Daimler detector" << endl;Detector detector; // 创建一个Detector对象Mat frame; // 创建一个Mat对象来存储帧for (;;) // 无限循环{cap >> frame; // 从视频流中读取一帧到frame中if (frame.empty()){// 如果帧为空则打印信息并退出循环cout << "Finished reading: empty frame" << endl;break;}int64 t = getTickCount(); // 获取当前的tick计数vector<Rect> found = detector.detect(frame); // 使用detector检测行人t = getTickCount() - t; // 计算检测所用的时间// 显示窗口{ostringstream buf;// 将模式名称和FPS信息打印到视频帧上buf << "Mode: " << detector.modeName() << " ||| "<< "FPS: " << fixed << setprecision(1) << (getTickFrequency() / (double)t);putText(frame, buf.str(), Point(10, 30), FONT_HERSHEY_PLAIN, 2.0, Scalar(0, 0, 255), 2, LINE_AA);}for (vector<Rect>::iterator i = found.begin(); i != found.end(); ++i){// 迭代找到的矩形,并在视频帧上画出矩形框Rect &r = *i;detector.adjustRect(r);rectangle(frame, r.tl(), r.br(), cv::Scalar(0, 255, 0), 2);}imshow("People detector", frame); // 显示带有检测框的视频帧// 与用户交互const char key = (char)waitKey(1);// 如果用户按下ESC或'q'键,则退出循环if (key == 27 || key == 'q') // ESC{cout << "Exit requested" << endl;break;}// 如果用户按下空格键,则切换检测模式else if (key == ' '){detector.toggleMode();}}return 0; // 程序正常退出
}
本段代码是一个使用OpenCV库的HOG(Histogram of Oriented Gradients,方向梯度直方图)描述子和SVM(Support Vector Machines,支持向量机)进行行人检测的程序。程序定义了Detector类来执行行人检测,可以在两种模式(默认模式和戴姆勒模式)之间切换。通过命令行参数,用户可以选择是从相机实时捕获视频还是读取视频文件进行检测。本程序还支持与用户的简单交互,比如按键切换模式和退出程序。最后在视频中实时标记检测到的行人,并显示当前的模式和帧率(FPS)。
hog.detectMultiScale(img, found, 0, Size(8,8), Size(), 1.05, 2, false);