错误:
torch.distributed.elastic.multiprocessing.errors.ChildFailedError: 这个主要是torch的gpu版本和cuda不适配
我的nvcc -V是11.8
torch使用的:
pip install torch==2.0.1 torchvision==0.15.2 torchaudio==2.0.2 --index-url https://download.pytorch.org/whl/cu118
但是我发现下这个也不行,就降低了一个小版本,但还是cu118 就OK了
pip install torch==2.0.0 torchvision==0.15.1 torchaudio==2.0.1 --index-url https://download.pytorch.org/whl/cu118
Previous PyTorch Versions | PyTorch 附个地址,可以去寻找对应的gpu版本torch
!一定要cu版本和nvcc 的版本相对应!