imgaug库指南(18):从入门到精通的【图像增强】之旅

引言

在深度学习和计算机视觉的世界里,数据是模型训练的基石,其质量与数量直接影响着模型的性能。然而,获取大量高质量的标注数据往往需要耗费大量的时间和资源。正因如此,数据增强技术应运而生,成为了解决这一问题的关键所在。而imgaug,作为一个功能强大的图像增强库,为我们提供了简便且高效的方法来扩充数据集。本系列博客将带您深入了解如何运用imgaug进行图像增强,助您在深度学习的道路上更进一步。我们将从基础概念讲起,逐步引导您掌握各种变换方法,以及如何根据实际需求定制变换序列。让我们一起深入了解这个强大的工具,探索更多可能性,共同推动深度学习的发展。


前期回顾

链接主要内容
imgaug库指南(十):从入门到精通的【图像增强】之旅详细介绍了imgaug库的数据增强方法 —— 加性噪声(AddElementwise方法)
imgaug库指南(11):从入门到精通的【图像增强】之旅详细介绍了imgaug库的数据增强方法 —— 加性高斯噪声(AdditiveGaussianNoise方法)
imgaug库指南(12):从入门到精通的【图像增强】之旅详细介绍了imgaug库的数据增强方法 —— 加性拉普拉斯噪声(AdditiveLaplaceNoise方法)
imgaug库指南(13):从入门到精通的【图像增强】之旅详细介绍了imgaug库的数据增强方法 —— 加性泊松噪声(AdditivePoissonNoise方法)
imgaug库指南(14):从入门到精通的【图像增强】之旅详细介绍了imgaug库的数据增强方法 —— 乘法运算(Multiply方法)
imgaug库指南(15):从入门到精通的【图像增强】之旅详细介绍了imgaug库的数据增强方法 —— 乘法运算(MultiplyElementwise方法)
imgaug库指南(16):从入门到精通的【图像增强】之旅详细介绍了imgaug库的数据增强方法 —— Cutout方法
imgaug库指南(17):从入门到精通的【图像增强】之旅详细介绍了imgaug库的数据增强方法 —— Dropout方法

在本博客中,我们将向您详细介绍imgaug库的数据增强方法 —— CoarseDropout方法


CoarseDropout方法

功能介绍

iaa.CoarseDropoutimgaug库中一个数据增强方法,可用于神经网络的训练。它通过粗略地随机丢弃图像区域,模拟了经典的【Dropout】技术,有力地缓解了模型的过拟合问题。此方法通过将图像的特定区域巧妙地设为黑色,促使模型在训练过程中更加注重图像的其他关键部分,从而提升模型的泛化能力。

语法


import imgaug.augmenters as iaa
# 将2%到10%的像素用原图大小2%到5%的黑色方块覆盖
aug = iaa.CoarseDropout(p=(0.02, 0.1), size_percent=(0.02, 0.05))
  • p: 定义为图像中有多少比例的像素被黑色方块覆盖。

    • p为浮点数,则图像中被黑色方块覆盖的区域占整个图像的比例为p
    • p为元组(a, b),则图像中被黑色方块覆盖的区域占整个图像的比例为从区间[a, b]中采样的随机数;
    • p为列表,则图像中被黑色方块覆盖的区域占整个图像的比例为从列表中随机采样的数;
  • size_percent: 定义每个黑色方块的大小。

    • size_percent为浮点数0.02,则每个黑色方块大小为(1/size_percent, 1/size_percent), 即(50, 50);
    • size_percent为元组(a, b),则每个黑色方块大小为(1/size, 1/size), size为从区间[a, b]中采样的随机数;
    • size_percent为列表,则每个黑色方块大小为(1/size, 1/size), size为从列表中随机采样的数;

示例代码

  1. 使用不同的p
import cv2
import imgaug.augmenters as iaa
import matplotlib.pyplot as plt# 读取图像
img_path = r"D:\python_project\lena.png"
img = cv2.imread(img_path)
image = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)# 创建数据增强器
# 将20%的像素用大小为(50, 50)的黑色方块覆盖(1/0.02=50)
aug1 = iaa.CoarseDropout(p=0.2, size_percent=0.02)
# 将40%的像素用大小为(50, 50)的黑色方块覆盖(1/0.02=50)
aug2 = iaa.CoarseDropout(p=0.4, size_percent=0.02)
# 将60%的像素用大小为(50, 50)的黑色方块覆盖(1/0.02=50)
aug3 = iaa.CoarseDropout(p=0.6, size_percent=0.02)# 对图像进行数据增强
blurred_image1 = aug1(image=image)
blurred_image2 = aug2(image=image)
blurred_image3 = aug3(image=image)# 展示原始图像和数据增强后的图像
fig, axes = plt.subplots(2, 2, figsize=(10, 10))
axes[0][0].imshow(image)
axes[0][0].set_title("Original Image")
axes[0][1].imshow(blurred_image1)
axes[0][1].set_title("Augmented Image1")
axes[1][0].imshow(blurred_image2)
axes[1][0].set_title("Augmented Image2")
axes[1][1].imshow(blurred_image3)
axes[1][1].set_title("Augmented Image3")
plt.show()

运行结果如下:

图1 原图及数据增强结果可视化

可以从图1看到:

  • p越大时, 数据增强后的新图像会出现更多个大小为(50, 50)的黑色方块。
  1. 使用不同的 size_percent
import cv2
import imgaug.augmenters as iaa
import matplotlib.pyplot as plt# 读取图像
img_path = r"D:\python_project\lena.png"
img = cv2.imread(img_path)
image = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)# 创建数据增强器
# 将20%的像素用大小为(50, 50)的黑色方块覆盖(1/0.02=50)
aug1 = iaa.CoarseDropout(p=0.2, size_percent=0.02)
# 将20%的像素用大小为(25, 25)的黑色方块覆盖(1/0.04=25)
aug2 = iaa.CoarseDropout(p=0.2, size_percent=0.04)
# 将20%的像素用大小为(10, 10)的黑色方块覆盖(1/0.1=10)
aug3 = iaa.CoarseDropout(p=0.2, size_percent=0.1)# 对图像进行数据增强
blurred_image1 = aug1(image=image)
blurred_image2 = aug2(image=image)
blurred_image3 = aug3(image=image)# 展示原始图像和数据增强后的图像
fig, axes = plt.subplots(2, 2, figsize=(10, 10))
axes[0][0].imshow(image)
axes[0][0].set_title("Original Image")
axes[0][1].imshow(blurred_image1)
axes[0][1].set_title("Augmented Image1")
axes[1][0].imshow(blurred_image2)
axes[1][0].set_title("Augmented Image2")
axes[1][1].imshow(blurred_image3)
axes[1][1].set_title("Augmented Image3")
plt.show()

运行结果如下:

图2 原图及数据增强结果可视化

可以从图2看到:

  • size_percent=0.02时,黑色方块大小为(50, 50)。
  • size_percent=0.04时,黑色方块大小为(25, 25)。
  • size_percent=0.1时,黑色方块大小为(10, 10)。

注意事项

  1. 丢弃概率和区域大小psize_percent参数共同决定了黑色方块(丢弃区域)的数量和大小。较大的p可能导致更多的区域被丢弃。这些参数需要根据你的应用进行适当调整。
  2. 与其他增强器的结合使用:可以与其他图像增强方法结合使用,以获得更丰富的效果。例如,可以先应用模糊,然后再应用粗略丢弃。
  3. 结果的可重复性:每次应用增强器可能会产生稍微不同的结果,因为它是随机的操作。为了确保结果的可重复性,可以使用aug.to_deterministic()方法将增强器转换为确定性状态。

总结

iaa.CoarseDropout作为一项图像增强技术,凭借其独特功能,为模型泛化能力的提升开辟了新途径。在神经网络训练过程中,它发挥关键作用,有效避免模型对训练数据中的噪声或特定模式的过度依赖。为了实现最佳效果,用户需审慎调整相关参数,如丢弃概率和区域大小。与其他图像增强方法协同运用,其效用更显卓越。请注意,由于此方法涉及随机过程,每次应用可能产生不同的结果。因此,在测试和评估模型时,务必确保使用一致的增强流程,以维持结果的稳定性。


小结

imgaug是一个强大的图像增强库,它可以帮助你创建出丰富多样的训练数据,从而改进你的深度学习模型的性能。通过定制变换序列和参数,你可以轻松地适应各种应用场景,从计算机视觉到医学影像分析。随着深度学习的发展,imgaug在未来将继续发挥重要作用。因此,将imgaug纳入你的数据增强工具箱是一个明智的选择。

参考链接


结尾

亲爱的读者,首先感谢抽出宝贵的时间来阅读我们的博客。我们真诚地欢迎您留下评论和意见,因为这对我们来说意义非凡。
俗话说,当局者迷,旁观者清。的客观视角对于我们发现博文的不足、提升内容质量起着不可替代的作用。
如果您觉得我们的博文给您带来了启发,那么,希望能为我们点个免费的赞/关注您的支持和鼓励是我们持续创作的动力
请放心,我们会持续努力创作,并不断优化博文质量,只为给带来更佳的阅读体验。
再次感谢的阅读,愿我们共同成长,共享智慧的果实!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/341401.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

鸿蒙Harmony--状态管理器-@Observed装饰器和@ObjectLink装饰器详解

经历的越多,越喜欢简单的生活,干净的东西,清楚的感觉,有结果的事,和说到做到的人。把圈子变小,把语放缓,把心放宽,用心做好手边的事儿,该有的总会有的! 目录 一&#xff…

SQL-DQL-基础查询

目录 DQL-介绍 DQL-语法 DQL-基本查询 🎉欢迎您来到我的MySQL基础复习专栏 ☆* o(≧▽≦)o *☆哈喽~我是小小恶斯法克🍹 ✨博客主页:小小恶斯法克的博客 🎈该系列文章专栏:重拾MySQL 📜其他专栏&#xff1…

python统计分析——小提琴图(plt.violinplot)

参考资料:用python动手学统计学,帮助文档 使用matplotlib.pyplot.violinplot()函数绘制小提琴图 小提琴图是将数值型数据的核密度图与箱线图融合在一起,具体来说是用核密度估计的结果替换了箱子,而形成的一个形似小提琴的图形。 …

SQL SERVER 19安装 SQL Prompt 10.02版本

SQL Prompt最新版官网下载地址:https://download.red-gate.com/SQLPromptDownload.exe 下载完成后,断开网络,全部点下一步。 注册机会报毒,安装前请先关闭杀毒软件! 下载好附件之后解压,打开SQLPrompt_7…

Qt优秀开源项目之二十一:遇见QSkinny,一个轻量级Qt UI库

目录 一.QSkinny简介 二.工作原理 三.编译 一.QSkinny简介 QSkinny库基于Qt Graphic View和Qt/Quick中少量的核心类。它提供了一组轻量级控件,可以在C或QML中使用这些控件。QSkinny默认是启用硬件加速的,非常适合嵌入式设备,目前已经应用于…

商城小程序(8.购物车页面)

目录 一、商品列表区域1、渲染购物车商品列表的标题区域2、渲染商品列表区域的基本结构3、为my-goods组件封装radio勾选状态4、为my-goods组件封装radio-change事件5、修改购物车中商品的选择状态6、为my-goods组件封装NumberBox7、为my-goods封装num-change事件8、修改购物车商…

基于JavaWeb+BS架构+SpringBoot+Vue电影订票系统系统的设计和实现

基于JavaWebBS架构SpringBootVue电影订票系统系统的设计和实现 文末获取源码Lun文目录前言主要技术系统设计功能截图订阅经典源码专栏Java项目精品实战案例《500套》 源码获取 文末获取源码 Lun文目录 1 绪 论 3 1.1研究背景和意义 3 1.2拟解决的问题及特性 3 1.3论文的结构 …

生物信息学导论-北大-序列比对基础知识

最近重新捡起coursera上的课了,这次准备好好学,把考试考了。。因此顺便记录一下学习过程。 ref: https://www.coursera.org/learn/sheng-wu-xin-xi-xue/home Sequence Alignment 序列比对 生物学问题 biological question: how to determine the simi…

科技创新领航 ,安川运动控制器为工业自动化赋能助力

迈入工业4.0时代,工业自动化的不断发展,让高精度运动控制成为制造业高质量发展的重要技术手段。北京北成新控伺服技术有限公司作为一家集工业自动化产品销售、系统设计、开发、服务于一体的高新技术企业,其引进推出的运动控制产品一直以卓越的…

libcurl开源库的编译与使用全攻略

libcurl简介 libcurl 是一个广泛使用的、支持多种协议的、开源的客户端URL传输库,提供了许多用于数据传输的API,例如文件传输、FTP、HTTP、HTTPS、SMTP等。libcurl 的主要特点包括 支持多种协议:libcurl 支持多种协议,如 HTTP、F…

thinkphp美容SPA管理系统源码带文字安装教程

thinkphp美容SPA管理系统源码带文字安装教程 运行环境 服务器宝塔面板 PHP 7.0 Mysql 5.5及以上版本 Linux Centos7以上 基于thinkphp3.23B-JUI1.2开发,权限运用了Auth类认证,权限可以细分到每个功能, 增删改查功能一应俱全,整合了…

基于YOLOv5的道路标志识别项目(yolov5界面GUI)

基于YOLOv5的道路标志识别项目(yolov5界面GUI) English | 简体中文 这是一个关于yolov5的道路标志识别项目,使用Pyqt5开发界面,Yolov5训练模型,数据库Mysql,包含五个模块:初始化参数、标志识别…