上机实验一:数据准备与模型评估
1、实验目的
熟悉 Python 的基本操作,掌握对数据集的读写实现、对模型性能的评估实现的能力;
加深对训练集、测试集、N 折交叉验证、模型评估标准的理解。
2、实验内容
(1)利用 pandas 库从本地读取 iris 数据集;
(2)从 scikit-learn 库中直接加载 iris 数据集;
(3)实现五折交叉验证进行模型训练;
(4)计算并输出模型的准确度、精度、召回率和 F1 值。
3、操作要点
(1)安装 Python 及 pycharm(一种 Python 开发 IDE),并熟悉 Python 基本操作;
(2)学习 pandas 库里存取文件的相关函数,以及 scikit-learn 库里数据集下载、交叉验
证、模型评估等相关操作;
(3)可能用的库有 pandas,scikit-learn,numpy 等,需要提前下载 pip;
(4)测试模型可使用随机森林 rf_classifier = RandomForestClassifier(n_estimators=100),
或其它分类器;
(5)撰写实验报告,提交源代码;实验报告在所有上机实验结束后提交。
4、主要仪器设备
微机及 Python 软件。