摘要:
高效地将多通道的图像数据压缩(如高光谱、多光谱成像数据)至较低的通道数,对提高深度学习(DL)模型的训练速度和预测至关重要。本文主要展示利用PCA降维结合weight-average的图像融合方法。文章主要参考了题为“Noninvasive Detection of Salt Stress in Cotton Seedlings by Combining Multicolor Fluorescence–Multispectral Reflectance Imaging with EfficientNet-OB2”在论文中使用的方法。
论文源:Noninvasive Detection of Salt Stress in Cotton Seedlinmbining Multicolor Fluorescence–Multispectral Reflectance Imaging with EfficientNet-OB2 | Plant Phenomics (science.org)
PCA-WA简介:
PCA-WA(主成分分析-加权平均)是一种图像融合方法,结合了主成分分析(PCA,principal component analysis)和加权平均(WA,weight average)两种技术。
优点:
- 保留主要信息:通过PCA方法,可以提取出源图像中的主要成分,即包含最多信息的特征。这有助于在融合过程中保留关键信息,使得融合后的图像在保留重要特征方面表现较好。
- 降低维度:PCA方法可以将高维数据降维,从而减少计算量和存储需求。这在处理大规模图像数据时尤为重要,可以加快处理速度和节省存储空间。
缺点:
- 对源图像质量敏感:PCA-WA方法的性能在很大程度上取决于源图像的质量。如果源图像存在噪声、模糊或对比度低等问题,那么融合后的图像质量可能会受到影响。
- 可能产生光谱失真:在使用PCA进行降维时,可能会丢失一些光谱信息。这可能导致融合后的图像在光谱特性上与源图像存在差异,从而产生光谱失真现象。
注意事项
数据预处理:在进行数据融合之前需要将数据进行对应的校正,避免后续噪声污染
输入数据:为M*N*C的double矩阵也就是校正后的图像浮点数值。需要事先将这些变量存储为.mat文件。储存变量命为a
操作示范
首先是输入的文件:如图,PCA需要所有处理的样本信息,所以按照格式将所有样本整理好
单个样本的信息如图:我测试的数据是自己采集的4K分辨率且有14个通道的多源光谱数据,变量统一为a,其中几个未融合的通道的图像可以展示如下
使用PCA-WA算法进行图像融合后,生成的图像会存放至预设的文件夹中
融合后的数据,前三个主成分占95%的贡献率,所以融合后为3个主成分通道。手动将这些数据归一化映射至uint8(0-255)展示如下:融合后数据量得到了充分的压缩。
代码
主脚本代码FusionProject
clear all获得PCA-WA融合的数据
WA图像融合,全称为Weighted Averaging图像融合,
也叫简单加权融合或者像素加权平均法,是一种图像融合方法。
这种方法的基本思想是将多源信道采集到的关于同一目标的图像
数据经过处理和计算,将各自信道中的有利信息提取出来,然后综合成
一幅高质量的图像。在具体实现时,WA图像融合通过对来自不同图像的对应像素进行加权平均,
以得到融合后图像中的每个像素值。这种方法具有简单易实现、运算速度快
的优点,并能提高融合图像的信噪比。然而,它也存在一些缺点,比如可能
会削弱图像中的细节信息,降低图像的对比度,并在一定程度上使图像中的
边缘变得模糊。为了改进这些缺点,可以采用一些优化方法,
如主成分分析(Principal Component Analysis,PCA)来优化权值的选择,
从而得到一幅亮度方差最大的融合图像。%输入部分(根据自己的需求修改这部分内容)%要处理文件所在的文件夹
% (多个文件夹则输入多个文件夹,要包含所有样本,PCA计算才准确),样本变量名均为a
% 注意地址要单引号标志
DealPath{1}='F:\Test\A';
DealPath{2}='F:\Test\B';%处理好的文件输出位置,对应你输入文件的数量
OutputPath{1}='C:\Users\ljy\Desktop\Test1\A';
OutputPath{2}='C:\Users\ljy\Desktop\Test1\B';%%图片的基本信息
%通道数
ChannelNum=14;
%红色荧光(F740)所在的通道
fluo_CNum=4;
%图像输出的分辨率
outputReso=[300 400];orinPath=cd();
%%这一过程可能很漫长,运行时间主要取决于你的样本量、数据大小、CPU性能及硬盘速度。
%%1000个样本跑一个小时以上是正常的%%阶段1:获取数据的通道均值
fileNum=length(DealPath);
allData=[];
%启用红色荧光分割图像,(如果前期工作已经校正及图像分割了,请关闭)
% 其他数据把分割关掉(1改为0)
for i=1:fileNumallData=[allData;AverageChannelData(DealPath{i},ChannelNum,[0,fluo_CNum])];
end%阶段二:PCA分析%归一化
[ynum,~]=size(allData);
stdr =std(allData); %计算标准差,计算每一列的标准差
averageD=mean(allData,1);for i=1:ynumdata2(i,:)=allData(i,:)-averageD(1,:);
end
%sr是预处理后的数据,使原始数据每个参数除于其标准差
sr =data2./repmat(stdr,size(allData,1),1);%% PCA%获取主成分系数
[coeff,~,~,~,explained,~]= pca(sr);%分析占 95% 解释性的主成分
for i=1:ChannelNumif sum(explained(1:i))>95numP=ibreakend
end%阶段3融合图像
for i=1:fileNumsrcDir=dir(DealPath{i}); %获得选择的文件夹[numFile,~]=size(srcDir);for j=3 :numFilenames_Fir=srcDir(j).('name');newfile_Fir=[DealPath{i},'\',names_Fir];%数据文件名load(newfile_Fir);%图像归一化for cn=1:numPNora(:,:,cn)=(a(:,:,cn)-averageD(cn))./stdr(cn);end%融合FusionPic=imresize(FusionPic_WA_PCA(Nora,coeff),outputReso);cd(OutputPath{i});save(names_Fir,"FusionPic");%储存cd(orinPath);end
end
附带自定义函数
T_SGM
%阈值分割函数,获得分割的蒙版%输入:img:图像(灰度图像)
% ThresH:阈值
% (为0时为二值化分割,为1时为迭代法全局阈值分割,为2时为全局阈值Otsu法阈值分割,三为基于形态学元素的局部分割,4为指定阈值分割)
%pluse:补充数据,当ThresH为3时,pluse表示形态学的元素的半径,其值越大,分割区域越大,为4时为分割的数function output=T_SGM(img,ThresH,pluse)img=im2double(img);%图像二值化if ThresH==0output =im2double(imbinarize(I));
elseif ThresH==1T=0.5*(min(img(:))+max(img(:)));done=false;while ~doneg=(img>=T);%建立区域g,为大于阈值的部分Tn=0.5*(mean(img(g))+mean(img(~g)));%当图像中g的区域与非g的区域的均值接近于目标阈值时,分割完成done = abs(T-Tn)<0.1;T=Tn;endoutput=imbinarize(img,T);
elseif ThresH==2Th=graythresh(img);%阈值output=imbinarize(img,Th);
elseif ThresH==3se=strel('disk',pluse);%建立形态学 结构元素ft=imtophat(img,se);%使用结构元素进行滤波Thr=graythresh(ft);%早对滤波后的图像进行阈值取值output = imbinarize(ft,Thr);
elseif ThresH==4output=imbinarize(img,pluse);
endend
SelecValueOfPic
function [actualaverageValue,actualNum,segama,K,S] = SlecValueOfPic(img,range,method)
%SLECVALUEOFPIC
%输入一张分割后的灰度图片;根据这这张图片的像素值统计(除零外),取中间range值的范围的内容;并返回这个范围的平均值;
%这个取值的逻辑是取像素值中间的分布,以个数划分,如10个像素取60%取平均,就是取中间值的6个像素的平均;这种方法可以提高图像反射率的数值的鲁棒性,将噪点和背景的反射屏蔽掉一部分;% actualavergeValue:最后输出的平均值
% img:输入的图像
% range:范围,大小为0-1之间;(折合百分数)
% method:方法 1为中位数法 2为正太分布法 3为平均数法
% actualnum:为成像面积
% segama:偏度segama=0;
K=0;
S=0;
if method==1staticD=imhist(img);allN=sum(staticD(2:256,1));rangeN=ceil(allN*range);thresholdNum=ceil((allN-rangeN)/2);thresholdValue=0;%初始化thresholdValueHigh=0;actualNum=0;for i=2:256%计算区间,为0的背景不算;nowSum=sum(staticD(2:i,1));if nowSum>thresholdNumif thresholdValue==0thresholdValue=i;%获得了最低门槛;endendif nowSum>(thresholdNum+rangeN)if thresholdValueHigh==0thresholdValueHigh=i;%获得了最高门槛;endendendallV=0;if thresholdValue~=0for j=thresholdValue:thresholdValueHigh%计算这个像素区间的平均值repreValue=staticD(j,1)*(j-1);%统计是从零开始统计;allV=allV+repreValue;endactualNum=sum(staticD(thresholdValue:thresholdValueHigh,1));actualaverageValue=allV/rangeN;elseactualNum=0;actualaverageValue=0;endelseif method==2%正太分布估计,此时actualnum为偏度[r,c]=find(img);[actualaverageValue,segama] = normfit(img(find(img)));K=kurtosis(img(find(img)));%峰度S=skewness(img(find(img)));%偏度[actualNum,~]=size(r);elseif method==3%平均,正太分布和平均效果一致(如果符合正太分布的话);[r,c]=find(img);actualaverageValue = mean(img(find(img)),'all');[actualNum,~]=size(r);
endend
Map_uint8
function U8_p =Map_uint8(doubleP,num_min,num_max)
band_div=(num_max-num_min)/256;
U8_p=(doubleP-num_min)/band_div;
MapMax=find(U8_p(:,:)>255);
MapMin=find(U8_p(:,:)<0);
U8_p(MapMax)=255;
U8_p(MapMin)=0;
U8_p=uint8(U8_p);
end
FusionPic_WA_PCA
function FusionPic=FusionPic_WA_PCA(IMGmat,PCAdet)%输入:IMGmat 为基本处理(校正)后的成像数据(储存格式为matlab data *.mat)
% 大小为M(图像高度)*N(图像宽度)*C(图像通道数)
%输入: PCAdet 为PCA的降维数据,为PCA-WA的权重提供参考[y,x,cnum]=size(IMGmat);
FusionPic=zeros(y,x,cnum);
%数据叠加
for i=1:cnumfor j=1:cnumFusionPic(:,:,i)=FusionPic(:,:,i)+PCAdet(i,j)*IMGmat(:,:,j);end
end
DeleNos_dot
%输入 mask为2值化图像
%在特定区域内的分割若达不到比例,则进行消除function output=DeleNos_dot(mask,length,Percent)numDiv=ceil(Percent*length^2);
[ysize,xsize]=size(mask);for i=length:xsize-length%用区域蒙版的量做判断消除杂点for j=length:ysize-lengthif mask(j,i)==1if sum(sum(mask(j-3:j+3,i-3:i+3)))<numDivmask(j,i)=0;endendend
end
output=mask;
AverageOneSample
function data = AverageOneSample(Sample,EX)
%主要是求图像校正后,分割后的平均值
%EX为1*2的double 分别代表范围和取值的方法 默认【0.6,3】%[actualaverageValue,actualNum,segama,K,S] = slecValueOfPic(img,range,method)
%SLECVALUEOFPIC
%输入一张分割后的灰度图片;根据这这张图片的像素值统计(除零外),取中间range值的范围的内容;并返回这个范围的平均值;
% actualavergeValue:最后输出的平均值
% img:输入的图像
% range:范围,大小为0-1之间;
% method:方法 1为中位数法 2为正太分布法 3为平均数法,基本上2和3一致
% actualnum:为成像面积
% segama:偏度[x,y,z]=size(Sample);
for i=1:z[data(i,1),data(i,2),~,~,~] = SlecValueOfPic(Sample(:,:,i),EX(1),EX(2));
endend
AverageChannelData
%检查文件数量是否匹配
function allData=AverageChannelData(aimPath,numchannel,IFSGM)%输入部分
%aimPath:采集目标的路径
%aimPath='F:\23新疆大田数据校正后\SSS';%目标路径,得用单引号"
%IFSGM 大小为1*2,(1,1)若为1则执行基于荧光的分割,(1,2)为红色荧光所在的位置orinPath=cd();%函数执行所在的路径,默认原路径
%目标文件
srcDir=dir(aimPath); %获得选择的文件夹
[numFile,~]=size(srcDir);
data=zeros(numchannel,2);
for j=3 :numFilenames_Fir=srcDir(j).('name');newfile_Fir=[aimPath,'\',names_Fir];%数据文件名load(newfile_Fir);if IFSGM(1,1)==1tureMask=T_SGM(Map_uint8(a(:,:,3),min(min(a(:,:,3))),max(max(a(:,:,3)))),4,0.045);%图像分割tureMask2=DeleNos_dot(tureMask,10,0.2);%清理噪点[yn,xn,zn]=size(a);b=zeros(yn,xn,zn);for i=1:14b(:,:,i)=a(:,:,i).*tureMask2;endelseb=a;enddata = AverageOneSample(b,[0.6,3]);allData(j-2,1:14)=data(1:14,1)';
endend