闭眼检测实现

引言

        这段代码是一个实时眼睛状态监测程序,可以用于监测摄像头捕获的人脸图像中的眼睛状态,判断眼睛是否闭合。具体应用实现作用说明如下:

1. 实时监测眼睛状态
   通过摄像头捕获的实时视频流,检测人脸关键点并计算眼睛的 EAR,实时判断眼睛是否闭合。

2. 闭眼警报
   当程序检测到用户闭眼时,通过在图像上显示 "Eyes Closed" 的文本和相应的标志,发出闭眼警报。

3. 可视化眼睛区域:
   通过在图像上绘制眼睛区域的多边形线段,直观地展示程序检测到的眼睛的位置。

4. 实时图像显示:
   将处理后的图像实时显示在窗口中,使用户能够实时观察眼睛状态的监测结果。

5. 交互式退出:
   用户可以通过按下键盘上的 Esc 键来退出程序,实现交互式控制。

啊啊啊啊啊啊那有那些应用场景呢?^_^

具体应用场景:

- 驾驶员状态监测:
          在汽车驾驶过程中,监测驾驶员的眼睛状态,及时发现驾驶员是否疲劳或注意力不集中。

- 睡眠监测:
          用于睡眠监测系统,检测用户在睡眠时的眼睛状态,可能用于分析睡眠质量。

- 用户注意力监测:
          在用户界面交互系统中,监测用户的眼睛状态,判断用户是否在关注屏幕。

- 医疗应用:
          在医疗领域中,监测患者的眼睛状态,特别是在眼科医疗中可能会有一些应用。

注意:
        这段代码的精度和稳定性可能受多方面因素影响,如光照条件、摄像头质量等。在实际应用中,可能需要进一步优化和调整参数,以适应不同场景和需求。

1.依赖组件:

        这段代码使用了以下几个主要的组件和库:

1. OpenCV (cv2): OpenCV 是一个计算机视觉库,用于图像和视频处理。在这里,它被用于打开摄像头、转换图像格式、进行图像处理以及显示图像。

2. Dlib: Dlib 是一个包含用于机器学习、计算机视觉和图像处理的工具的 C++ 库。在这里,它的 Python 接口被用于进行人脸检测和关键点检测。

3. NumPy: NumPy 是一个用于科学计算的 Python 库,提供了对多维数组的支持。在这里,NumPy 用于处理数组和数学计算。

4. SciPy: SciPy 是一个用于科学计算的 Python 库,提供了在 NumPy 基础上构建的更多高级功能。在这里,SciPy 的 `distance` 模块被用于计算欧氏距离。

        这些库的组合使得这段代码能够实现从摄像头中检测人脸,提取关键点,并通过计算眼睛的纵横比 (EAR) 判断眼睛是否闭上。如果您有关于这些库的具体问题,或者希望了解它们的更多细节,请随时提问。


2.欧氏距离

        因为涉及到了欧氏距离这个数学知识,所以我还是介绍一下,以免大家懵了

        欧式距离(Euclidean Distance)是欧几里德空间中两点之间的直线距离。对于二维空间中的两个点(x1,y1)(x2,y2),它们之间的欧式距离 d 可以通过以下公式计算:

d = \sqrt{(x1 - x2)^{2} + (y1 - y2)^{2}}

        这个公式基于勾股定理,即直角三角形的斜边长度等于两条直角边长度的平方和的平方根。

        在计算机视觉和图像处理中,欧式距离常用于测量两个点之间的空间距离,或者两个向量之间的相似度。在这里,代码中可能使用了欧式距离来计算眼睛的宽度和高度,从而进行进一步的眼睛状态判断。


3.计算眼睛的横纵比

# 计算眼睛的纵横比 (EAR)
def calculate_ear(eye):# 计算垂直方向的欧氏距离vertical_1 = distance.euclidean(eye[1], eye[5])vertical_2 = distance.euclidean(eye[2], eye[4])# 计算水平方向的欧氏距离horizontal = distance.euclidean(eye[0], eye[3])# 计算纵横比ear = (vertical_1 + vertical_2) / (2.0 * horizontal)return ear

        在眼睛特征点的标记中,通常使用一个包含多个关键点的列表或数组表示眼睛的形状。这些关键点的索引通常按照特定的顺序排列,以表示眼睛的不同部位。

        在计算眼睛的 EAR 时,eye[x] 中的 x 是眼睛特征点列表中的索引值,代表了不同的关键点。具体的含义取决于你使用的眼睛特征点标记方案,但一般而言,这些关键点通常按照眼睛的周围轮廓从左上角开始,按逆时针方向标记。

常见的眼睛特征点标记包括:

- eye[0]:眼睛的左侧,水平中心
- eye[1]:眼睛的上边缘,左侧
- eye[2]:眼睛的上边缘,右侧
- eye[3]:眼睛的右侧,水平中心
- eye[4]:眼睛的下边缘,右侧
- eye[5]:眼睛的下边缘,左侧

请注意,具体的标记方案可能会因使用的数据集或库而有所不同。


4.加载 Dlib 的人脸检测器和关键点检测器

# 加载 Dlib 的人脸检测器和关键点检测器
detector = dlib.get_frontal_face_detector()
predictor = dlib.shape_predictor("D:\\Study\\PythonStudy\\people_68_face\\shape_predictor_68_face_landmarks.dat")

        1. dlib.get_frontal_face_detector(): 这是 Dlib 库提供的一个人脸检测器,用于检测图像中的人脸。get_frontal_face_detector() 返回一个人脸检测器对象,可以用于在图像中找到人脸的位置。

        2.dlib.shape_predictor("D:people_68_face\\shape_predictor_68_face_landmarks.dat文件路径"): 这是 Dlib 提供的关键点检测器,用于检测人脸的关键点,通常是面部的特定位置,如眼睛、鼻子、嘴巴等。shape_predictor 对象需要一个训练好的模型文件,该文件包含了在训练过程中学到的关键点位置的信息。在这里,模型文件的路径是指定的 shape_predictor_68_face_landmarks.dat 文件。

        这两个检测器的结合通常用于在图像中检测人脸并找到人脸的关键点位置,为后续的任务(如眼睛状态检测)提供基础。

        这个文件我已经上传


5.获取左右眼的索引

# 获取左右眼的索引
(left_eye_start, left_eye_end) = (42, 48)
(right_eye_start, right_eye_end) = (36, 42)

        这部分代码定义了左眼和右眼在检测到的人脸关键点中的索引范围。

- left_eye_start 和 left_eye_end 分别表示左眼的起始索引和结束索引。在人脸的 68 个关键点中,左眼的关键点通常是从索引 42 开始,到索引 48 结束

- right_eye_start 和 right_eye_end 分别表示右眼的起始索引和结束索引。在人脸的 68 个关键点中,右眼的关键点通常是从索引 36 开始,到索引 42 结束

        这些索引范围用于从检测到的人脸关键点中提取左眼和右眼的具体位置信息,以便后续进行眼睛状态的检测。


6.获取两只眼睛的关键点索引
 

# 获取两只眼睛的关键点索引
(left_eye_indices, right_eye_indices) = (
list(range(left_eye_start, left_eye_end)), list(range(right_eye_start, right_eye_end)))

        这部分代码用于创建包含左眼和右眼关键点索引的列表。

- left_eye_indices 是一个包含左眼关键点索引的列表,使用 list(range(left_eye_start, left_eye_end)) 来生成一个范围从 left_eye_start 到 left_eye_end - 1 的索引列表。

- right_eye_indices 是一个包含右眼关键点索引的列表,使用 list(range(right_eye_start, right_eye_end)) 来生成一个范围从 right_eye_start 到 right_eye_end - 1 的索引列表。

这两个列表将用于提取左眼和右眼的具体关键点位置信息。


7. 打开摄像头

老演员了,不介绍了

# 打开摄像头
cap = cv2.VideoCapture(0)


8.读取一帧图像用于处理

    ret, frame = cap.read()if not ret:break

        这部分代码是从摄像头读取一帧图像的常见做法。在视频处理中,cap.read() 会读取视频的下一帧,ret 表示读取是否成功,如果成功,则 ret 为 True同时 frame 包含了读取到的图像帧。如果 ret 为 False,说明视频已经读取到结尾,此时应该退出循环。

        这种检查 ret 的方式是一种常见的确保视频读取不会超出结尾的方法。


9.转换为灰度图

    # 转换为灰度图gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)

        这一部分代码将读取到的彩色图像转换为灰度图像。在图像处理中,有时候我们会选择在灰度图像上进行操作,因为它只有一个通道,处理起来相对简单,而且对于一些任务如人脸检测来说,灰度图像已经足够cv2.cvtColor() 函数用于颜色空间的转换,cv2.COLOR_BGR2GRAY 表示将图像从BGR(彩色)转换为灰度。

        但是在这里主要是为了减轻处理的难度,提升性能,毕竟我的电脑是轻薄本,真的太难受了。没办法使用GPU处理


10.人脸检测

    # 人脸检测faces = detector(gray)

        这一部分代码使用 detector 对灰度图像进行人脸检测。detector(gray) 返回检测到的人脸的矩形区域的列表。这里使用的是 Dlib 的人脸检测器


11.获取脸部关键点

# 获取关键点
landmarks = predictor(gray, face)
landmarks_points = [(landmarks.part(point).x, landmarks.part(point).y) for point in range(68)]


- predictor(gray, face): 使用Dlib的关键点检测器 predictor 检测人脸上的关键点。
- landmarks: 包含检测到的人脸关键点的对象。
- landmarks_points: 将关键点的 x 和 y 坐标存储为元组的列表。

        这部分代码使用 Dlib 的关键点检测器 (predictor) 获取人脸上的 68 个关键点的坐标。 landmarks_points 变量包含了这些坐标。


12.获取眼部关键点坐标

        # 获取左右眼的关键点坐标left_eye = landmarks_points[left_eye_indices[0]:left_eye_indices[-1] + 1]right_eye = landmarks_points[right_eye_indices[0]:right_eye_indices[-1] + 1]

这段代码用于从检测到的面部关键点中提取左眼和右眼的关键点坐标。

- left_eye_indices 和 right_eye_indices 是左右眼的关键点索引范围,分别包含了人脸关键点中左眼和右眼的索引。

- landmarks_points 包含了检测到的面部的所有68个关键点的坐标。

- left_eye 存储了左眼的关键点坐标,通过使用左眼的索引范围从 landmarks_points 中进行切片操作得到。

- right_eye 存储了右眼的关键点坐标,同样是通过切片操作得到。

        这样,通过 left_eye 和 right_eye,你可以获得左眼和右眼的关键点坐标,从而进行后续的处理,比如计算眼睛的形状、检测眨眼等。


13.计算左右眼的横纵比

# 计算左右眼的EAR
left_ear = calculate_ear(left_eye)
right_ear = calculate_ear(right_eye)

这段代码用于计算左眼和右眼的EAR(Eye Aspect Ratio,眼睛纵横比)。

- calculate_ear 是一个函数,接收一个眼睛的关键点坐标列表作为参数,并返回计算得到的眼睛的EAR值。

- left_ear 存储了左眼的EAR值,通过调用 calculate_ear 函数传入左眼的关键点坐标得到。

- right_ear 存储了右眼的EAR值,通过调用 calculate_ear 函数传入右眼的关键点坐标得到。

通过计算眼睛的EAR值,可以用来判断眼睛的状态,例如是否闭眼。


14.判断是否闭眼

# 判断是否闭眼
if left_ear < 0.2 and right_ear < 0.2:cv2.putText(frame, "Eyes Closed", (50, 50), cv2.FONT_HERSHEY_SIMPLEX, 1, (0, 0, 255), 2)

这段代码用于根据左眼和右眼的 EAR 值来判断是否闭眼。具体来说:

- 如果左眼和右眼的 EAR 值都小于 0.2,那么被认为是闭眼状态

        通过 cv2.putText 函数,在视频帧上添加文字信息,显示 "Eyes Closed",文字的位置是 (50, 50),字体大小为 1,颜色为红色 (0, 0, 255),厚度为 2。这是一种简单的闭眼状态的可视化提示。


15.绘制眼部线条

# 可视化眼睛区域
left_eye_int = np.array(left_eye, dtype=np.int32)
right_eye_int = np.array(right_eye, dtype=np.int32)
cv2.polylines(frame, [left_eye_int], isClosed=True, color=(255, 255, 0), thickness=1)
cv2.polylines(frame, [right_eye_int], isClosed=True, color=(255, 255, 0), thickness=1)

这段代码的目的是在视频帧上可视化左右眼的区域,具体来说:

- left_eye_int 和 right_eye_int 分别将左眼右眼的关键点坐标转换为整数型数组。

- cv2.polylines 函数用于绘制多条线段,这里用于绘制眼睛区域的轮廓线。

        [left_eye_int] 和 [right_eye_int] 是轮廓线的坐标isClosed=True 表示将轮廓线闭合(连接起点和终点),color=(255, 255, 0) 设置线的颜色为蓝色thickness=1 设置线的厚度。这样就在视频帧上画出了左右眼的轮廓线,以便于可视化。


16.显示画面

# 显示图像cv2.imshow('Eye Status', frame)

        这部分代码用于在窗口中显示处理后的图像。cv2.imshow('Eye Status', frame) 将处理后的图像(带有眼睛状态信息和可视化的眼睛区域)显示在名为 "Eye Status" 的窗口中。在这个窗口中,你可以看到实时的视频流,并且通过绘制的眼睛区域和相应的文字(例如 "Eyes Closed")来表示眼睛的状态。


17.监听键盘退出

    # 退出循环if cv2.waitKey(1) & 0xFF == 27:break

        这段代码是为了检测键盘输入,如果检测到按键为 "Esc" 键(其ASCII码为27),就退出循环,从而结束程序的执行。通常,在实时视频处理中,这样的退出机制可以帮助你方便地停止程序的执行。

        cv2.waitKey(1) 会等待键盘输入,其参数表示等待的时间(单位为毫秒)。如果在这段时间内检测到键盘输入,那么它会返回按键的 ASCII 码值。因为我们通常是检测是否按下了某个特定的按键,所以要与某个 ASCII 码值进行比较。

        在这里,0xFF 是一个十六进制常数,对应于二进制的 11111111。这是一个掩码,通过与 cv2.waitKey(1) 的结果进行按位与(bitwise AND)操作,可以获取按键的 ASCII 码值

        所以,cv2.waitKey(1) & 0xFF == 27 这个条件表达式的意思是:如果检测到的按键的 ASCII 码值为 27(对应于 Esc 键),则条件成立。在这种情况下,通常会退出循环,结束程序的执行。


 18.释放资源

# 释放资源
cap.release()
cv2.destroyAllWindows()

19.整体参考代码

import cv2
import dlib
from scipy.spatial import distance
import numpy as np# WenJGo
# 计算眼睛的纵横比 (EAR)
def calculate_ear(eye):# 计算垂直方向的欧氏距离vertical_1 = distance.euclidean(eye[1], eye[5])vertical_2 = distance.euclidean(eye[2], eye[4])# 计算水平方向的欧氏距离horizontal = distance.euclidean(eye[0], eye[3])# 计算纵横比ear = (vertical_1 + vertical_2) / (2.0 * horizontal)return ear# 加载 Dlib 的人脸检测器和关键点检测器
detector = dlib.get_frontal_face_detector()
predictor = dlib.shape_predictor("D:\\Study\\PythonStudy\\people_68_face\\shape_predictor_68_face_landmarks.dat")# 获取左右眼的索引
(left_eye_start, left_eye_end) = (42, 48)
(right_eye_start, right_eye_end) = (36, 42)# 获取两只眼睛的关键点索引
(left_eye_indices, right_eye_indices) = (
list(range(left_eye_start, left_eye_end)), list(range(right_eye_start, right_eye_end)))# 打开摄像头
cap = cv2.VideoCapture(0)while True:ret, frame = cap.read()if not ret:break# 转换为灰度图gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)# 人脸检测faces = detector(gray)for face in faces:# 获取关键点landmarks = predictor(gray, face)landmarks_points = [(landmarks.part(point).x, landmarks.part(point).y) for point in range(68)]# 获取左右眼的关键点坐标left_eye = landmarks_points[left_eye_indices[0]:left_eye_indices[-1] + 1]right_eye = landmarks_points[right_eye_indices[0]:right_eye_indices[-1] + 1]# 计算左右眼的EARleft_ear = calculate_ear(left_eye)right_ear = calculate_ear(right_eye)# 判断是否闭眼if left_ear < 0.2 and right_ear < 0.2:cv2.putText(frame, "Eyes Closed", (50, 50), cv2.FONT_HERSHEY_SIMPLEX, 1, (0, 0, 255), 2)# 可视化眼睛区域left_eye_int = np.array(left_eye, dtype=np.int32)right_eye_int = np.array(right_eye, dtype=np.int32)cv2.polylines(frame, [left_eye_int], isClosed=True, color=(255, 255, 0), thickness=1)cv2.polylines(frame, [right_eye_int], isClosed=True, color=(255, 255, 0), thickness=1)# 显示图像cv2.imshow('Eye Status', frame)# 退出循环if cv2.waitKey(1) & 0xFF == 27:break# 释放资源
cap.release()
cv2.destroyAllWindows()

结语

呃,如果我会自己训练模型然后使用就好了。我只能说,加油吧加油吧!!!

期待有一天

春风得意马蹄疾,一日看尽长安花

ヾ( ̄▽ ̄)Bye~Bye~

拜拜

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/195118.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

基于灰狼算法(GWO)优化的VMD参数(GWO-VMD)

代码的使用说明 基于灰狼算法优化的VMD参数 代码的原理 基于灰狼算法&#xff08;Grey Wolf Optimizer, GWO&#xff09;优化的VMD参数&#xff08;GWO-VMD&#xff09;是一种结合了GWO和VMD算法的优化方法&#xff0c;用于信号分解和特征提取。 GWO是一种基于群体智能的优化…

辅助解决小白遇到的电脑各种问题

写这个纯属是为了让电脑小白知道一些电脑上的简单操作&#xff0c;勿喷&#xff01;&#xff01;&#xff01; 一&#xff1a;当小白遇到电脑程序不完全退出怎么办&#xff1f; 使用软件默认的退出方式 此处拿百度网盘举例&#xff1a; 用户登录网盘后&#xff1a; 如果直接点…

多线程编程

1 线程的使用 1.1 为什么要使用多线程 在编写代码时&#xff0c;是否会遇到以下的场景会感觉到难以下手&#xff1f; 要做 2 件事&#xff0c;一件需要阻塞等待&#xff0c;另一件需要实时进行。例如播放器&#xff1a;一边在屏幕上播放视频&#xff0c;一边在等待用户的按…

Hive 定义变量 变量赋值 引用变量

Hive 定义变量 变量赋值 引用变量 变量 hive 中变量和属性命名空间 命名空间权限描述hivevar读写用户自定义变量hiveconf读写hive相关配置属性system读写java定义额配置属性env只读shell环境定义的环境变量 语法 Java对这个除env命名空间内容具有可读可写权利&#xff1b; …

2020年09月 Scratch(二级)真题解析#中国电子学会#全国青少年软件编程等级考试

Scratch等级考试(1~4级)全部真题・点这里 一、单选题(共25题,每题2分,共50分) 第1题 下面哪个按钮可以实现音乐结束时音量慢慢变小? A: B: C: D:

RE2文本匹配实战

引言 今天我们来实现RE2进行文本匹配&#xff0c;模型实现参考了官方代码https://github.com/alibaba-edu/simple-effective-text-matching-pytorch。 模型实现 RE2模型架构如上图所示。它的输入是两个文本片段&#xff0c;所有组件参数除了预测层和对齐层外都是共享的。上图…

从零开始:Rust环境搭建指南

大家好&#xff01;我是lincyang。 今天&#xff0c;我们将一起探讨如何从零开始搭建Rust开发环境。 Rust环境搭建概览 Rust是一种系统编程语言&#xff0c;以其安全性、并发性和性能闻名。搭建Rust环境是学习和使用这一语言的第一步。 第一步&#xff1a;安装Rust Rust的…

nginx后端服务器在负载均衡调度中的状态

状态说明 down 状态说明当前的sever暂时不参与负载均衡

ACWSpring1.3

首先,前端写ajax写上我们的访问路径(就在我们前端的源代码里面),我们建了两个包pkController用于前端页面url映射过来一层一层找到我们的RestController返回bot1里面有键值,返回的这就是一个session对象bot1这个map.前端拿到我们bot1里的两个值给到我们前端显示出来 1准备页面:…

Java概述

接触Java后会发现它的体系有一个特点&#xff0c;就是非常喜欢用“J”字母开头的缩写&#xff0c;比如JCP, JSR, JMS, JPA, JSP, JAX-RS......它们有些是规范&#xff0c;有些是组织的名称&#xff0c;表意多样&#xff0c;对第一次接触的人来说很可能会觉得混乱&#xff0c;本…

吾爱破解置顶的“太极”,太好用了吧!

日常工作和娱乐&#xff0c;都需要用到不同类型的软件&#xff0c;哪怕软件体积不大&#xff0c;也必须安装&#xff0c;否则到用时找不到就非常麻烦了。 其实&#xff0c;很多软件不一定一样不剩地全部安装一遍&#xff0c;一方面原因是用的不多&#xff0c;另一方面多少有点…

spring常见面试题总结

1、spring是什么 Spring&#xff1a;是一个轻量级的IOC和AOP的java开发框架&#xff0c;为了简化企业级开发而生。核心就是控制反转和面向切面编程。 IOC&#xff1a;控制反转&#xff08;Inverse of Control&#xff09;&#xff0c;以前项目都是在哪儿用到对象 在哪儿new&a…