Albumentations库使用-编程知识

Albumentations库使用

news/2025/1/21 7:22:05/文章来源:https://www.cnblogs.com/inchbyinch/p/18335626

1 Albumentations库介绍

一个好用的开源图像处理库，适用于对RGB、灰度图、多光谱图像，以及对应的mask、边界框和关键点同时变换。通常用于数据增广，是PyTorch生态系统的一部分。

主页：https://albumentations.ai/

2 核心点

支持的变换：https://albumentations.ai/docs/getting_started/transforms_and_targets/

分为两类：pixel-level transforms 和 spatial-level transforms. 前者像素级变换，mask等不需要动；后者mask同步变换；

变换概率：https://albumentations.ai/docs/getting_started/setting_probabilities/

每种变换都有一个参数p，来控制应用这个变换的概率；
有的变换默认p为1，而有的默认为0.5；
如果有嵌套，比如Compose、OneOf、GaussNoise等，概率相乘；
对于OneOf里面的各个变换概率，会被归一化；

捕获变换的参数：https://albumentations.ai/docs/examples/replay/

用replay可以捕获变换的参数，从而用到多张图上；
也可以用来debug；

多张图片同步变换，比如多张图对应同一个mask，或者一张图对应多个mask：https://albumentations.ai/docs/examples/example_multi_target/

3 代码示例

3.1 测试代码

适用于在本地测试各个变换的实际效果。

    import randomimport cv2from matplotlib import pyplot as pltimport albumentations as A## 可视化变换前后图像和对应maskdef visualize(image, mask, original_image=None, original_mask=None):fontsize = 14if original_image is None and original_mask is None:f, ax = plt.subplots(2, 1, figsize=(8, 5))ax[0].imshow(image, cmap=plt.cm.gray)ax[1].imshow(mask, cmap=plt.cm.gray)else:f, ax = plt.subplots(2, 2, figsize=(8, 5))ax[0, 0].imshow(original_image, cmap=plt.cm.gray)ax[0, 0].set_title('Original image', fontsize=fontsize)ax[1, 0].imshow(original_mask, cmap=plt.cm.gray)ax[1, 0].set_title('Original mask', fontsize=fontsize)ax[0, 1].imshow(image, cmap=plt.cm.gray)ax[0, 1].set_title('Transformed image', fontsize=fontsize)ax[1, 1].imshow(mask, cmap=plt.cm.gray)ax[1, 1].set_title('Transformed mask', fontsize=fontsize)image = cv2.imread(r"D:\samples\0000.png", cv2.IMREAD_GRAYSCALE)mask = cv2.imread(r"D:\samples\0000_mask.png", cv2.IMREAD_GRAYSCALE)## 变换示例1：pixel-level transforms，mask不变# aug = A.RandomGamma(p=1, gamma_limit=(60, 90))# aug = A.RandomBrightnessContrast(p=1, brightness_limit=(-0.1, 0.2), contrast_limit=(-0.4, 0.4))# aug = A.CLAHE(p=1, clip_limit=2.0, tile_grid_size=(4, 4))# aug = A.MotionBlur(p=1, blur_limit=5)# aug = A.GlassBlur(p=1, sigma=0.05, max_delta=1, iterations=1)# aug = A.GaussianBlur(p=1, blur_limit=(1, 3))## 变换示例2：spatial-level transforms# aug = A.ElasticTransform(p=1, alpha=80, sigma=8, alpha_affine=10)# aug = A.GridDistortion(p=1, num_steps=5, distort_limit=(-0.3, 0.3))# aug = A.OpticalDistortion(distort_limit=1, shift_limit=1, p=1)# aug = A.RandomResizedCrop(size=(120,248), scale=(0.5,1.0), ratio=(1.8,2.4), p=1)# aug = A.Affine(p=1, scale=(0.9,1.1), translate_percent=None, shear=(-20, 20), rotate=(-40,40))aug = A.Perspective(p=1, scale=(0.05, 0.3))random.seed(9) #固定种子便于复现，实际使用时注掉augmented = aug(image=image, mask=mask)image_elastic = augmented['image']mask_elastic = augmented['mask']print(f"image_elastic.shape {image_elastic.shape}")print(f"mask_elastic.shape {mask_elastic.shape}")visualize(image_elastic, mask_elastic, original_image=image, original_mask=mask)

3.2 实际使用代码

适用于嵌入Pytorch的dataloader，用于数据增广。

里面HorizontalFlip变换发生概率为 0.9 * 0.5；
第一个OneOf中RandomGamma变换发生概率为 0.9 * 0.6 * (1 / (1+2+1))；


# Define the transformations
self.transform = A.Compose([A.OneOf([A.RandomGamma(p=1, gamma_limit=(60, 90)),A.RandomBrightnessContrast(p=2, brightness_limit=(-0.1, 0.2), contrast_limit=(-0.4, 0.4)),A.CLAHE(p=1, clip_limit=2.0, tile_grid_size=(4, 4))], p=0.6),A.OneOf([A.MotionBlur(p=1, blur_limit=5),A.GlassBlur(p=1, sigma=0.05, max_delta=1, iterations=1),A.GaussianBlur(p=1, blur_limit=(1, 3))], p=0.6),A.HorizontalFlip(p=0.5),A.Affine(p=0.6, scale=(0.9,1.1), translate_percent=None, shear=(-10, 10), rotate=(-30,30)),A.RandomResizedCrop(p=0.6, size=(120,248), scale=(0.6,1.0), ratio=(1.9,2.3)),A.Perspective(p=0.8, scale=(0.05, 0.3)),
], p=0.9, additional_targets={'image0': 'image'})#训练时进行数据增广
if self.train:transformed = self.transform(image=data['ir'], image0=datax['speckle'], mask=data['gt'])data['ir'] = transformed['image']data['speckle'] = transformed['image0']data['gt'] = transformed['mask']

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.hqwc.cn/news/775823.html

如若内容造成侵权/违法违规/事实不符，请联系编程知识网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

LinkAI RAG知识库平台优化之路

LinkAI RAG知识库平台支持无结构文档、Q&A问答对、多列表格以及网站内容自动导入，并加入了自研的增强解析功能支持对文档中图片以及表格的自动解析。支持基于语义的向量检索和基于关键词的全文检索的增强混合检索功能，生成的回复可以标注答案来源，同时可以在使用记录中查…

14. 迭代器、生成器、模块与包、json模块

1.迭代器 1.1 迭代器介绍迭代器是用来迭代取值的工具每一次迭代得到的结果会作为下一次迭代的初始值,单纯的重复并不是迭代# while循环实现迭代取值 a = [1, 2, 3, 4, 5, 6] index = 0 while index < len(a):print(a[index])index += 1 1.2 可迭代对象内置有_ _iter_ _方…

# 代码随想录二刷(哈希表)

代码随想录二刷(哈希表) 三数之和思路反正对于我来说是真的难想出来。若这道题还是采用哈希表的思路去做，非常麻烦，并且还要考虑去重的操作。所以这道题其实用双指针，是更方便的。具体程序如下： class Solution:def threeSum(self, nums: List[int]) -> List[List[int]]…

ctfshow-web入门-nodejs系列

web334 下载源码后缀改为zip打开即可先对源码经行一个简单的分析 login.js// 引入Express框架 var express = require(express);// 创建一个路由实例 var router = express.Router();// 引入用户数据，假设user模块导出的是一个包含用户项的对象 var users = require(../modul…

2021年我因为Tab Session Manager丢失数据，好像是研究过一次leveldb的查看/解码方式但是当时好像因为时间关系没能成功 / chrome .ldb文件

Default\Local Storage\leveldb .ldb2023年下半年我因为chatmindai修改域名，又研究过一次，因为时间关系也没有细究最近，我想查看一下anki的devtool的Local Storage，即https://ankiweb.net/shared/info/31746032这个插件产生的 C:\Users\xxx\AppData\Local\Anki\QtWebEngine…

wq

联合省选 2024 Day2T1 迷宫守卫题解

联合省选 2024 Day2T1 迷宫守卫题解好像距离联合省选已经半年了，前两天看到这题才想起来改，距离分班已经半年了，也算是好好学了半年了，但是还是那么菜，有点绷不住，感觉不如文化课后来翻到题解区第二篇题解才知道自己赛时想的反悔贪心其实是正解，但是当时啥也不会，主…

小白程序员也要对世界进行第一次的呐喊！

身为程序员对世界的第一声呐喊——Hello World！新建一个文件夹新建一个目录，并将其命名为Hello.java（关键一步）注意！文件类型显示的是java文件才成功（文件的后缀要改为java）双击文件，开始编写（本人使用的是Notepad++进行编写）输入图片中的代码（全部要用英文输入法…

Django模板、模版语言和静态文件

1. templates模板（html）在app目录下创建一个templates目录，用于存放网页模板利用url返回网页点击查看代码 def user_list(request):return render(request,"user_list.html");输入url地址时，会去app目录下的templates目录下寻找名为user_list的HTML文件（根据app…

Cuberite——低配mc服务器的最佳选择

最近白嫖了一个1h1g的服务器，想拿它来开mc服务器，正当我用mcsmanager开服的时候，突然给我报了一条OutOfMemoryError下面就给大家介绍一下Cubreite Cuberite Cuberite is a Minecraft-compatible multiplayer game server that is written in C++ and designed to be efficie…

关于我回家之后在干啥

快踩

一图看懂Git、HTTPS、Docker、k8s和微服务