Yellowbrick特征可视化分析
- ⭐Yellowbrick
- ⭐特征分析可视化
- ⭐Rank1D
- ⭐Rank2D
⭐Yellowbrick
Yellowbrick是一个用于可视化机器学习模型和评估性能的Python库。它提供了一系列高级可视化工具,帮助数据科学家和机器学习从业者更好地理解、调试和优化他们的模型。
它在scikit-learn的api基础上做了扩展,能让我们更容易的驾驭模型优化阶段。
⭐特征分析可视化
⭐Rank1D
默认情况下,Rank1D使用Shapiro-Wilk算法来评估特征分布的正态性。然后绘制条形图,显示每个特征的相对等级。
默认情况下,Rank2D可视化工具使用皮尔逊相关系数检测两个特征之间的相关性。
import matplotlib.pyplot as plt
import pandas as pd
# 导入数据
df=pd.read_excel("D:\A_data\Data_2022.C\高钾无风化.xlsx")
m=['类型']
y=df[m]
#print(y)
i=['氧化钾(K2O)','氧化钙(CaO)','二氧化硅(SiO2)','二氧化硅(SiO2)','氧化镁(MgO)','氧化铝(Al2O3)','氧化铁(Fe2O3)','氧化铜(CuO)','氧化铅(PbO)','氧化铅(PbO)','五氧化二磷(P2O5)','氧化锶(SrO)','氧化锡(SnO2)','二氧化硫(SO2)']
X=df[i]
#print(X)
#解决中文乱码问题
plt.rcParams['font.sans-serif']=['SimHei']from yellowbrick.features import rank1d
visualizer = rank1d(X, color="b")
⭐Rank2D
默认情况下,Rank2D可视化工具使用皮尔逊相关系数检测两个特征之间的相关性。
#解决保存图像是负号'-'显示为方块的问题
plt.rcParams['axes.unicode_minus']=False
from yellowbrick.features import rank2d
visualizer = rank2d(X, color="b")