一步一步学OAK之三:实现RGB相机场景切换

目录

  • Setup 1: 创建文件
  • Setup 2: 安装依赖
  • Setup 3: 导入需要的包
  • Setup 4: 遍历所有场景模式和特效模式
  • Setup 5: 创建pipeline
  • Setup 6: 创建节点
  • Setup 7: 连接设备并启动管道
  • Setup 8: 创建与DepthAI设备通信的输入队列和输出队列
  • Setup 9: 定义putText函数
  • Setup 10: 主循环
    • 获取视频帧
    • 等待用户按键输入
  • Setup 11:运行程序

Setup 1: 创建文件

  • 创建新建3-rgb-scene文件夹
  • 用vscode打开该文件夹
  • 新建一个main.py 文件

Setup 2: 安装依赖

安装依赖前需要先创建和激活虚拟环境,我这里已经创建了虚拟环境OAKenv,在终端中输入cd…退回到OAKenv的根目录,输入 OAKenv\Scripts\activate激活虚拟环境

安装pip依赖项:

pip install numpy opencv-python depthai blobconverter --user

Setup 3: 导入需要的包

在main.py中导入项目需要的包

import cv2
import depthai as dai
from itertools import cycle

Setup 4: 遍历所有场景模式和特效模式

scenes = cycle([item for name,item in vars(dai.RawCameraControl.SceneMode).items() if name !="UNSUPPORTED" and name.isupper()])
effects = cycle([item for name,item in vars(dai.RawCameraControl.EffectMode).items() if name.isupper()])curr_scene = "OFF"
curr_effect = "OFF"

这段代码创建了两个无限循环的迭代器sceneseffects,用于循环遍历dai.RawCameraControl.SceneModedai.RawCameraControl.EffectMode中的所有场景模式和特效模式。

scenes迭代器通过从dai.RawCameraControl.SceneMode中选择大写名称的项,并排除UNSUPPORTED和非大写字母的项来创建。这样可以获取到所有合法的场景模式。

effects迭代器通过从dai.RawCameraControl.EffectMode中选择大写名称的项来创建,也排除了非大写字母的项。

curr_scenecurr_effect是当前选择的场景和特效模式,默认为"OFF"。

这段代码的作用是创建了用于循环遍历场景模式和特效模式的迭代器,并初始化当前选择的场景和特效模式为"OFF"。

Setup 5: 创建pipeline

pipeline = dai.Pipeline()

Setup 6: 创建节点

camRgb = pipeline.create(dai.node.ColorCamera)
camRgb.setIspScale(1,3)xoutRgb = pipeline.create(dai.node.XLinkOut)
xoutRgb.setStreamName("video")
camRgb.video.link(xoutRgb.input)

camRgb.setIspScale(1,3)将ISP(图像信号处理)的缩放比例设置为1:3。这意味着从摄像头读取到的图像将会在宽度上保持原始大小,而高度会缩小为原来的1/3。

创建了一个xoutRgb节点,并设置了该节点对应的输出流名称为"video"。xoutRgb节点将会作为管道的输出节点,用于将视频流传输到其他设备或模块。

通过camRgb.video.link(xoutRgb.input)将颜色摄像头节点的视频输出链接到xoutRgb节点的输入。这样就建立了颜色摄像头节点到xoutRgb节点的数据流连接。

camControlIn = pipeline.create(dai.node.XLinkIn)
camControlIn.setStreamName("camControl")
camControlIn.out.link(camRgb.inputControl)

创建一个camControlIn节点,它代表了XLinkIn节点,用于接收来自其他设备或模块的相机控制指令。

使用camControlIn.setStreamName("camControl")设置了它的流名称为"camControl"。

通过camControlIn.out.link(camRgb.inputControl)camControlIn节点的输出连接到camRgb节点的输入控制引脚(inputControl)上。这样,通过XLinkIn节点可以接收来自其他设备或模块的相机控制指令,并将其传递给颜色摄像头节点。

Setup 7: 连接设备并启动管道

with dai.Device(pipeline) as device:

Setup 8: 创建与DepthAI设备通信的输入队列和输出队列

    videoQ = device.getOutputQueue(name="video", maxSize=4, blocking=False)ctrlQ = device.getInputQueue(name="camControl")

创建了两个队列对象:videoQctrlQ。这些队列用于在设备上接收和发送数据。

videoQ是一个输出队列,通过调用device.getOutputQueue(name="video", maxSize=4, blocking=False)来创建。它将从设备上的"video"流接收数据,并最多存储4个数据帧。blocking=False表示在队列为空时,从队列获取数据时不会阻塞。

ctrlQ是一个输入队列,通过调用device.getInputQueue(name="camControl")来创建。它用于发送相机控制指令到设备上的相机控制节点。这里的"name"参数与之前设置的相机控制流名称"camControl"对应。

Setup 9: 定义putText函数

    def putText(frame, text, coords):cv2.putText(frame, text, coords, cv2.FONT_HERSHEY_SIMPLEX, 0.5, (0, 0, 0), 4)cv2.putText(frame, text, coords, cv2.FONT_HERSHEY_SIMPLEX, 0.5, (255, 255, 255), 1)

定义了一个putText函数,它将在图像帧上绘制文本。

函数接受三个参数:

  • frame:要绘制文本的图像帧。
  • text:要绘制的文本内容。
  • coords:文本的起始坐标。

在函数内部,使用cv2.putText函数两次进行文本绘制:

  • 第一次调用用于绘制黑色的文本,具有较大的轮廓(thickness=4),用于创建阴影效果。使用cv2.FONT_HERSHEY_SIMPLEX指定字体,0.5指定字体比例因子,(0, 0, 0)指定文本颜色(黑色)以及thickness=4指定较大的轮廓宽度。
  • 第二次调用用于绘制白色的文本,具有较小的轮廓(thickness=1),用于绘制文本内容。使用相同的参数,但将文本颜色设置为(255, 255, 255)(白色)以及thickness=1指定较小的轮廓宽度。

这样,函数将在图像帧的指定坐标上绘制带有阴影效果的文本。

Setup 10: 主循环

    while True:

获取视频帧

 		videoIn = videoQ.tryGet()if videoIn is not None:frame = videoIn.getCvFrame()putText(frame, f"[E] Effect: {curr_effect}", (10, 20))putText(frame, f"[S] Scene: {curr_scene}", (10, 40))cv2.imshow("video", frame)

这段代码从输出队列videoQ中获取一个视频帧。

首先,使用videoQ.tryGet()方法尝试获取一个视频帧。如果成功获取到视频帧,则将其赋值给videoIn变量。

然后,使用getCvFrame()方法从视频帧对象videoIn中获取OpenCV格式的图像帧,并将其赋值给frame变量。

接下来,使用putText()函数在图像帧上绘制文本。其中,使用f-string将当前特效(curr_effect)和场景(curr_scene)的值转换为字符串,并绘制在图像上。

最后,使用cv2.imshow("video", frame)显示图像帧,窗口标题为"video"。

这段代码的作用是从输出队列中获取视频帧,并在图像帧上绘制当前特效和场景的文本,最后在窗口中显示图像。

f-string是Python中格式化字符串的一种方式。它允许在字符串中插入变量或表达式的值。

一个f-string的格式为:在字符串前加上字母"f",然后用花括号{}括起需要插入的变量或表达式。

例如,f"[E] Effect: {curr_effect}"中的花括号内的curr_effect表示要插入的变量,而整个字符串中的"[E] Effect: "是固定的文本部分。

当这个f-string被执行时,curr_effect的值会被插入到相应位置来替代花括号内的部分。

这样可以方便地将变量的值插入到字符串中,以构建带有动态内容的文本。在给图像帧添加文本时,可以使用f-string将变量的值插入到文本中来实现动态文本。

等待用户按键输入

		key = cv2.waitKey(1)if key == ord('e') or key == ord('E'):effect = next(effects)print("Switching colorCamera effect:", str(effect))curr_effect = str(effect).lstrip("EffectMode.")cfg = dai.CameraControl()cfg.setEffectMode(effect)ctrlQ.send(cfg)# Scene currently doesn't workelif key == ord('s') or key == ord('S'):scene = next(scenes)print("Currently doesn't work! Switching colorCamera Scene:", str(scene))curr_scene = str(scene).lstrip("SceneMode.")cfg = dai.CameraControl()cfg.setSceneMode(scene)ctrlQ.send(cfg)elif key == ord('q'):break

这段代码中,cv2.waitKey(1)用于等待用户按键输入,并返回按下键的ASCII码。

使用if语句判断用户按下的键。如果按下键是字母 ‘e’ 或 ‘E’,则执行以下代码块:

  1. 调用next(effects)effects迭代器中获取下一个特效。
  2. 打印信息以指示切换特效,并将特效转换为字符串并去除前缀"EffectMode."。
  3. 创建一个dai.CameraControl()对象,并使用setEffectMode()方法设置特效模式为获取到的特效。
  4. 将配置对象cfg通过控制队列ctrlQ发送出去。

如果按下的键是字母 ‘s’ 或 ‘S’,则执行以下代码块:

  1. 调用next(scenes)scenes迭代器中获取下一个场景。
  2. 打印信息以指示切换场景,并将场景转换为字符串并去除前缀"SceneMode."。
  3. 创建一个dai.CameraControl()对象,并使用setSceneMode()方法设置场景模式为获取到的场景。
  4. 将配置对象cfg通过控制队列ctrlQ发送出去。

如果按下的键是字母 ‘q’,则跳出循环,结束程序的运行。

这段代码的作用是根据用户按键的不同来切换特效、场景,或者结束程序的运行。

Setup 11:运行程序

在终端中输入如下指令运行程序


python main.py

效果如下
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/1805.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

MongoDB基本使用(一)

MongoDB基本使用 Nosql简介 NoSQL(NoSQL Not Only SQL ),意即”不仅仅是SQL”。 在现代的计算系统上每天网络上都会产生庞大的数据量, 这些数据有很大一部分是由关系数据库管理系统(RDBMS)来处理。 1970年 E.F.Codd’s提出的关系…

对于小米随手吸尘器各种问题的初始办法

本人在什么值得买发过,现在只不过是为了让账号看起来更丰盈一点,现在再发一次。 充不进去电/使用的时候短暂吸气,这两个问题,在上个月的时候我就已经发现了这个问题。 然后我就拆开了那个主机,就是那个保温杯一样的东…

【Tableau案例】神奇宝贝属性及实力强弱|数据可视化

提前声明:神奇宝贝的数据分析仅供参考,不涉及对于神奇宝贝的各种评价,另外我是初学tableau,涉及到使用的tableau操作可能很简单,复杂的还掌握不熟练,之后会拿时间系统学习tabelau。 数据预处理 该数据集有…

Kangas:计算机视觉中的pandas

Kangas:计算机视觉中的pandas 介绍Kangas的优点 使用Kangas读取CSV文件读取图像文件Kangas DataGrid训练模型 介绍 在计算机视觉领域,Kangas是一种在图像数据处理和分析方面越来越受欢迎的工具之一。就像Pandas改变了数据分析人员处理表格数据的方式一样…

圆和矩形是否有重叠

🎈 算法并不一定都是很难的题目,也有很多只是一些代码技巧,多进行一些算法题目的练习,可以帮助我们开阔解题思路,提升我们的逻辑思维能力,也可以将一些算法思维结合到业务代码的编写思考中。简而言之&#…

黑产科普丨揭秘游戏黑灰产业链

自今年起,游戏版号已恢复常态化发放,游戏行业在官方发文肯定、重获资本青睐、AI降本增效等多方助力下持续回暖。暑期档将至,游戏厂商为了抢占更多的市场份额,占据更多的玩家视野,将有大量的游戏选择在这个时间上线。 …

[Flask] Flask会话

由于HTTP的无状态性,为了使某个域名下的所有网页能够共享某些数据,Cookie和Session应运而生 1.Cookie对象 HTTP是无状态(stateless)协议,一次请求响应结束后,服务器不会留下任何关于对方状态的信息 也就是说,尽管在…

哈工大计算机网络传输层协议详解之:可靠数据传输的基本原理

哈工大计算机网络传输层协议详解之:可靠数据传输的基本原理 哈工大计算机网络课程传输层协议详解之:流水线机制与滑动窗口协议哈工大计算机网络课程传输层协议详解之:TCP协议哈工大计算机网络课程传输层协议详解之:拥塞控制原理剖…

MyBatisPlus基础功能使用

文章目录 MyBatisPlus基础功能CRUDBaseMapperServiceImpl 条件构造器注解一对多、多对一映射 MyBatisPlus基础功能 CRUD BaseMapper BaseMapper 接口是 MyBatis-Plus 提供的一个基础 Mapper 接口,它定义了一系列的通用数据库操作方法,包括插入、更新、…

【C/C++】使用类和对象 练习EasyX图形库

创作不易&#xff0c;本篇文章如果帮助到了你&#xff0c;还请点赞 关注支持一下♡>&#x16966;<)!! 主页专栏有更多知识&#xff0c;如有疑问欢迎大家指正讨论&#xff0c;共同进步&#xff01; &#x1f525;c系列专栏&#xff1a;C/C零基础到精通 &#x1f525; 给大…

黑马微信小程序-实现本地服务九宫格并展示商品列表

一、九宫格实现 1.获取数据 1.1准备接口 黑马接口&#xff1a;https://applet-base-api-t.itheima.net/categories 说明&#xff1a;这是获取九宫格的数据接口 1.2使用接口 说明&#xff1a;声明变量获取数据。 getGridList() {wx.request({url: https://applet-base-api-t.…

ECS云服务器U实例评测,可以免费体验哦

目录 一、ECS云服务器U实例介绍 话题一、U实例使用体感如何&#xff0c;是否和主售型实例有区别&#xff0c;具体体现在哪里&#xff1f; 话题二、结合相关数据材料&#xff0c;对您感兴趣的场景 话题三、使用u实例是否为您的云上业务或者测试项目提供了帮助支持&#xff1…