• 如果觉得本站的内容有帮助,可以考虑打赏博主哦!

  • 问题反馈可发送邮件到stubbornhuang@qq.com

  • 本站会放置Google广告用于维持域名以及网站服务器费用。

  • 欢迎大家交换友链,可在https://www.stubbornhuang.com/申请友情链接进行友链交换申请!

  • 工资「喂饱肚子」,副业「养活灵魂」!

  • 计算机图形学与计算几何经典必备书单整理,下载链接可参考:https://www.stubbornhuang.com/1256/

  • 在本站开通年度VIP,无限制下载本站资源和阅读本站文章

  • 本站由于前段时间遭受到大量临时和国外邮箱注册,所以对可注册的邮箱类型进行了限制!

  • 感谢大家访问本站,希望本站的内容可以帮助到大家!

Pytorch – torch.distributed.init_process_group函数详解

Pytorch 发布于2022-08-29 阅读 4,183次 0次评论 0次点赞 本文共832个字,阅读需要3分钟。

在pytorch中使用torch.nn.parallel.DistributedDataParallel进行分布式训练时,需要使用torch.distributed.init_process_group()初始化torch.nn.parallel.DistributedDataParallel包。

1 torch.distributed.init_process_group

1. 函数形式

torch.distributed.init_process_group(backend, init_method=None, timeout=datetime.timedelta(seconds=1800), world_size=-1, rank=-1, store=None, group_name='')

2. 函数功能

初始化默认的分布式进程组,同时初始化分布式包。

3. 函数参数

  • backend:类型为str或者Backend,必需参数。所使用的Backend。可选值为mpi,gloo,nccl。我们可以通过小写的字符串如"gloo"指定该字段的值,也可以通过Backend.GLOO设置该字段的值;
  • init_method:类型为str,可选参数。指定如何初始化进程组的url。如果没有指定参数init_method或者store,则使用默认值env://
  • world_size:类型为int,可选参数。参与分布式训练的进程数。如果指定了参数store,则为必需参数。默认值为-1;
  • rank:类型为int,可选参数。当前进程的序号(范围为0到world_size-1)之间。如果指定了参数store,则为必需参数。默认值为-1;
  • store:类型为Store,可选参数。所有的工作进程都可以访问的键/值store,用于交换连接/地址信息;
  • group_name:类型为str,可选参数。进程组名称;
  • timeout:类型为timedelta,可选参数。对进程组指定的操作超时,默认值为30分钟;

欢迎扫码关注我的微信公众号,及时获取文章更新

微信公众号二维码

本文作者:StubbornHuang

版权声明:本文为站长原创文章,如果转载请注明原文链接!

原文标题:Pytorch – torch.distributed.init_process_group函数详解

原文链接:https://www.stubbornhuang.com/2327/

发布于:2022年08月29日 8:43:06

修改于:2023年06月21日 18:11:23

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

文章末尾
上一篇
工具网站推荐 - PhotoShop、Adobe Premiere、Autodesk AutoCAD、Adobe After Effects等生产力软件下载
工具软件网站
下一篇
工具软件 - 使用Potplayer录制在线直播视频流
工具软件网站
当前分类随机文章推荐

发表评论

您必须 [ 登录 ] 才能发表留言!

关注我们的公众号

微信公众号