相关性是有关两个变量之间变化的指示,在前面的章节中,无涯教程讨论了Pearson的相关系数以及相关的重要性,可以绘制相关矩阵以显示哪个变量相对于另一个变量具有较高或较低的相关性。
在以下示例中,Python脚本将为Pima印度糖尿病数据集生成并绘制相关矩阵,它可以借助Pandas DataFrame上的corr()函数生成,并借助 pyplot 进行绘制。
from matplotlib import pyplot from pandas import read_csv import numpy Path=r"C:\pima-indians-diabetes.csv" names=[preg, plas, pres, skin, test, mass, pedi, age, class] data=read_csv(Path, names=names) correlations=data.corr() fig=pyplot.figure() ax=fig.add_subplot(111) cax=ax.matshow(correlations, vmin=-1, vmax=1) fig.colorbar(cax) ticks=numpy.arange(0,9,1) ax.set_xticks(ticks) ax.set_yticks(ticks) ax.set_xticklabels(names) ax.set_yticklabels(names) pyplot.show()
运行上面代码输出
从相关矩阵的上述输出中,无涯教程可以看到它是对称的,即左下与右上是相同的。还观察到,每个变量彼此正相关。
机器学习 中的 矩阵图函数 - 无涯教程网无涯教程网提供相关性是有关两个变量之间变化的指示,在前面的章节中,无涯教程讨论了Pearson的相关...https://www.learnfk.com/python-machine-learning/machine-learning-with-python-correlation-matrix-plot.html