尝试调整超参数,例如批量大小、迭代周期数和学习率,并查看结果。
-
num_epochs = 10, batch_size = 256, lr = 0.1情况下
-
num_epochs = 5, batch_size = 256, lr = 0.1情况下
可以尝试一下,三种参数变化,会发现lr变小,需要的训练次数num_epochs增加,batch_size变小。
增加迭代周期的数量。为什么测试精度会在一段时间后降低?我们怎么解决这个问题?
因为过拟合问题,模型过于拟合训练集数据了,应对测试集与训练集存在一些不同的数据识别不出来。
- 降低num_epochs
- 数据增强,对于输入数据加一点噪声
- 降低模型复杂度,减少神经元