Pytorch报错解决——(亲测有效)RuntimeError: Distributed package doesn‘t have NCCL built in

在我跑SLADD模型的时候,出现了如下报错:
在这里插入图片描述
上网搜寻一番后,发现了解决方法
第一步:在本文件的开头机上这样两行代码:

import os
os.environ["PL_TORCH_DISTRIBUTED_BACKEND"] = "gloo"

第二步:在本文件代码中找到这样一部分代码:
在这里插入图片描述
dist.init_process_group(backend='nccl', init_method='env://', world_size=args.world_size, rank=rank)这一行中的nccl换成gloo
若要解释原因就是windows系统不支持NCCL,只能换用GLOO

亲测这个报错就没了,然而接下来还有好多别的报错…我继续去解决了,解决完再分享别的~

本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
THE END
分享
二维码
< <上一篇
下一篇>>