OpenCV项目实战-深度学习去阴影-图像去阴影

往期热门博客项目回顾:

计算机视觉项目大集合

改进的yolo目标检测-测距测速

路径规划算法

图像去雨去雾+目标检测+测距项目

交通标志识别项目

yolo系列-重磅yolov9界面-最新的yolo

姿态识别-3d姿态识别

深度学习小白学习路线

//正文开始!

图像去阴影算法旨在改善图像质量并恢复阴影下物体的真实颜色与亮度
这对于许多计算机视觉任务如物体识别、跟踪以及增强现实等至关重要。以下是一些图像去阴影算法的基本概述:
在这里插入图片描述

  1. 基于亮度差算法

    • 这种方法通过比较图像中相邻像素或同一物体不同部分的亮度差异来检测阴影。假设在同一光照条件下,物体表面颜色应相对一致,若出现较大差异则可能被认为是阴影区域。通过统计分析或者阈值处理,可以区分出阴影并尝试通过某种方式(例如线性插值、邻域平均或其他修复策略)填充阴影区域以还原原始色彩。
  2. 空洞卷积与注意力融合的对抗式图像阴影去除算法

    • 这类算法采用深度学习方法,尤其是结合生成对抗网络(GANs)的技术。空洞卷积(dilated convolution)有助于捕捉更大范围的上下文信息,而注意力机制能帮助网络更加关注阴影和非阴影区域的关键特征。通过训练这样的网络模型,它可以学习如何从含有阴影的图像中生成无阴影的输出图像。
      在这里插入图片描述
  3. 局部或全局对比度调整

    • 对比度增强和直方图均衡化等技术也可以用于减轻阴影的影响,它们通过对整幅图像或局部区域进行亮度和对比度调整来改善阴影区域的表现。
  4. 形态学操作

    • 在某些简单情况下,可以使用形态学操作如最大滤波和最小滤波来估计和校正阴影。例如,在图像背景较浅的情况下,先对图像应用最大滤波以提取潜在的背景亮度,然后用得到的信息来推测并填补阴影区域。
  5. 基于物理模型的方法

    • 根据光源方向、阴影投射角度及场景深度信息建立物理模型,通过逆向渲染过程来估计阴影并进行去除。
  6. 多尺度分析和混合模型

    • 利用多尺度分析结合多种算法,比如小波变换、高斯金字塔等,能够在不同分辨率层级上分析和处理阴影,然后组合多个层级的结果以获得更准确的阴影去除效果。
      在这里插入图片描述

随着深度学习在图像处理领域的快速发展,越来越多的算法倾向于利用神经网络构建端到端的学习系统来解决阴影去除问题,这些方法通常能提供更优秀的效果,特别是在处理复杂场景和具有丰富纹理的图像时。然而,每种方法都有其适用场景和局限性,实际应用中往往需要根据具体需求和数据特性选择合适的算法。

代码

def parse_args():desc = "Pytorch implementation of DCShadowNet"desc = "Pytorch implementation of DCShadowNet"parser = argparse.ArgumentParser(description=desc)parser.add_argument('--phase', type=str, default='test', help='[train / test]')parser.add_argument('--dataset', type=str, default='SRD', help='dataset_name')#parser.add_argument('--datasetpath', type=str, default='/disk1/yeying/dataset/SRD', help='dataset_path')parser.add_argument('--datasetpath', type=str, default='SRD', help='dataset_path')parser.add_argument('--iteration', type=int, default=1000000, help='The number of training iterations')parser.add_argument('--batch_size', type=int, default=1, help='The size of batch size')parser.add_argument('--print_freq', type=int, default=1000, help='The number of image print freq')parser.add_argument('--save_freq', type=int, default=100000, help='The number of model save freq')parser.add_argument('--decay_flag', type=str2bool, default=True, help='The decay_flag')parser.add_argument('--lr', type=float, default=0.0001, help='The learning rate')parser.add_argument('--weight_decay', type=float, default=0.0001, help='The weight decay')parser.add_argument('--adv_weight', type=int, default=1, help='Weight for GAN')parser.add_argument('--cycle_weight', type=int, default=10, help='Weight for Cycle')parser.add_argument('--identity_weight', type=int, default=10, help='Weight for Identity')parser.add_argument('--dom_weight', type=int, default=1, help='Weight for domain classification')parser.add_argument('--ch_weight', type=int, default=1, help='Weight for shadow-free chromaticity')parser.add_argument('--pecp_weight', type=int, default=1, help='Weight for shadow-robust feature')parser.add_argument('--smooth_weight', type=int, default=1, help='Weight for boundary smoothness')parser.add_argument('--use_ch_loss', type=str2bool, default=True, help='use shadow-free chromaticity loss')parser.add_argument('--use_pecp_loss', type=str2bool, default=True, help='use shadow-robust feature loss')parser.add_argument('--use_smooth_loss', type=str2bool, default=True, help='use boundary smoothness loss')parser.add_argument('--ch', type=int, default=64, help='base channel number per layer')parser.add_argument('--n_res', type=int, default=4, help='The number of resblock')parser.add_argument('--n_dis', type=int, default=6, help='The number of discriminator layer')parser.add_argument('--img_size', type=int, default=256, help='The size of image')parser.add_argument('--img_h', type=int, default=480, help='The org size of image')parser.add_argument('--img_w', type=int, default=640, help='The org size of image')parser.add_argument('--img_ch', type=int, default=3, help='The size of image channel')parser.add_argument('--result_dir', type=str, default='results', help='Directory name to save the results')parser.add_argument('--device', type=str, default='cpu', choices=['cpu', 'cuda'], help='Set gpu mode; [cpu, cuda]')parser.add_argument('--benchmark_flag', type=str2bool, default=False)parser.add_argument('--resume', type=str2bool, default=True)parser.add_argument('--epoch', type=int, default=1)parser.add_argument('--use_original_name', type=str2bool, default=False, help='use original name the same as the test images')parser.add_argument('--im_suf_A', type=str, default='.png', help='The suffix of test images [.png / .jpg]')

运行流程

1.pip install -r requirements.txt
2将图片放在dataset\SRD\testA文件夹下3.运行python main_test.py --dataset SRD --datasetpath  E:\001_code\DC-ShadowNet-Hard-and-Soft-Shadow-Removal-main_22\dataset\SRD\  --use_original_name False
E:\001_code\DC-ShadowNet-Hard-and-Soft-Shadow-Removal-main_22\dataset\SRD\是你的文件路径
4.results/SRD/500000查看结果

最后,计算机视觉、图像处理、毕业辅导、作业帮助、代码获取,远程协助,代码定制,私聊会回复!

call me :qq1309399183

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/587245.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

苹果安卓双端短视频直播系统源码,带后台-支持二开和采集

搭建教程 1.PHP5.6-7.2 mysql 5.6 redis5.0 nginx1.15 2.宝塔就完全满足了 我刚开了台服务器,建议用阿里云的 我这个是腾讯云 先让服务器 自己装着 时间比较长 3.搭建前需要准备的东西 腾讯云直播、七牛存储、百度语音、腾讯地图等好多东西 七牛存储…

2024 开源数据工程生态系统全景图

作者 | ALIREZA SADEGHI 翻译 | Debra Chen 简介 虽然生成式人工智能和ChatGPT带来的沸沸扬扬的炒作令科技界为之一振,但在数据工程领域,2023年仍然是一个令人振奋和充满活力的一年,数据工程生态系统变得更加多样化和复杂化,系…

MySQL数据库(数据库连接池)

文章目录 1.批处理应用1.基本介绍2.批处理演示1.创建测试表2.修改url3.编写java代码 3.批处理源码分析 2.数据库连接池1.传统连接弊端分析2.数据库连接池基本介绍1.概念介绍2.数据库连接池示意图3.数据库连接池种类 3.C3P0连接池1.环境配置1.导入jar包2.将整个lib添加到项目中3…

如何设计一个通用的 Excel 导入导出功能?

以JSON配置的方式去实现通用性和动态调整,当然,这个通用仍然存在一定的局限性,每个项目的代码风格都不同。 想要写出一个适合所有项目的通用性模块并不容易,这里的通用局限于其所在项目,所以该功能代码如果不适用于自…

初学者必看!bashplotlib库让你轻松在Bash脚本中实现数据可视化

1. 是什么 bashplotlib 是一个 Python 库,用于在 Bash 脚本中生成数据可视化。它允许用户使用 Python 代码创建各种类型的图表,并将它们嵌入到 Bash 脚本中。bashplotlib 支持多种图表类型,包括条形图、折线图、饼图等。 2. 核心功能 bashplo…

YOLOv8全网独家改进: 小目标 | 注意力 |卷积和注意力融合模块(CAFMAttention) | 2024年4月最新成果

💡💡💡本文独家改进:卷积和注意力融合模块(CAFMAttention),增强对全局和局部特征的提取能力,2024年最新的改进思路 💡💡💡创新点:卷积和注意力巧妙设计 💡💡💡如何跟YOLOv8结合:1)放在backbone后增强对全局和局部特征的提取能力;2)放在detect前面,增…

共享社会经济路径(SSP1-5)中国及分省人口预估数据库_v2

v1数据集: 在共享社会经济路径(SSPs)全球框架下,根据本地化人口和经济参数,采用人口-发展-环境(PDE)模型,构建2020-2100年SSPs人口格点数据;采用柯布-道格拉斯&#xff…

MySQL基础知识(一)-超详细Windows系统安装MySQL详细教程

1.简介 原计划,今天这篇想要给小伙伴们讲解一下python操作mysql数据库,但是由于近期换了一台新的电脑,所以一看mysql数据库都没安装,所有才有了这篇文章。尽管网上不乏此类型的文章,但是刚好自己要安装,所以…

8个例子探秘 Python 元类与定制类

大家好,今天我们要一起探索 Python 世界里的神秘角色——元类(Metaclasses),它们就像魔法一样,能让我们的类变得超乎寻常。想象一下,如果你的类能自己决定自己的行为,那是不是超级酷炫&#xff…

3.5网安学习第三阶段第五周回顾(个人学习记录使用)

本周重点 ①SSRF服务器端请求伪造 ②序列化和反序列化 ③Vaudit代码审计 本周主要内容 ①SSRF服务器端请求伪造 一、概述 SSRF: server site request forgery (服务器端请求伪造)。 SSR: 服务端请求,A服务器通过函数向B服务器发送请求。 SSRF发生的前提条件…

STM32-02基于HAL库(CubeMX+MDK+Proteus)GPIO输出案例(LED流水灯)

文章目录 一、功能需求分析二、Proteus绘制电路原理图三、STMCubeMX 配置引脚及模式,生成代码四、MDK打开生成项目,编写HAL库的GPIO输出代码五、运行仿真程序,调试代码 一、功能需求分析 在完成开发环境搭建之后,开始使用STM32GP…

谷歌google广告和必应Bing广告,是否二选一?

搜索引擎广告凭借其精准定向、高度可见性和高效转化能力,成为众多企业拓展海外市场、提升品牌影响力的重要手段。其中,谷歌Google与必应Bing作为全球两大主流搜索引擎,各自拥有庞大的用户群体与独特的市场优势。面对这两大广告平台&#xff0…