最近还是在搞YOLO弄毕业设计,一开始是在自己电脑上训练的,但是当开始训练时电脑就卡得不行,别的啥都干不了;另一方面训练速度也特别慢,还得一直开着机不能中断。
索性尝试把模型部署到阿里云服务器上训练,用的最低的2核2G的配置,勉勉强强能跑起来,好处自然是不占用自己电脑的时间,虽然速度慢了点,甚至完全是用cpu跑的,但反正折腾的不是自己电脑。
但这时候就遇到了一个问题,以往部署到自己电脑的时候,可以输入localhost:6006查看tensorboard界面,判断训练情况,但是部署到云服务器上如何查看?
我是用screen指令把YOLOv5的训练挂起来的,使用 screen
后台运行 YOLOv5 训练任务的好处是,即使你断开 SSH 连接,训练任务仍然会继续在后台运行。而在另一个连接中启动 TensorBoard 则可以让你随时监控训练的进度和结果。
新建一个SSH连接
cd到YOLOv5的项目文件夹下,运行tensorboard --logdir runs/train
本地主机进入cmd终端,输入ssh -L 6006:localhost:6006 root@123.123.123.123
(“123.123.123.123”替换成云服务器的公网IP)
这个操作的意思是通过SSH隧道将云服务器的 6006 端口转发到本地计算机的 6006 端口。
这样,在本地浏览器打开localhost:6006
,可以直接查看云服务器的tensorboard面板。
为了该死的毕业设计,还得研究一下这图表是啥意思