dgl.distributed.load_partition

dgl.distributed.load_partition(part_config, part_id, load_feats=True, use_graphbolt=False)[source]

从数据路径加载分区数据。

分区数据包括分区图结构、节点张量字典、边张量字典以及一些元数据。分区可能包含 HALO 节点,这些节点是从其他分区复制而来。然而,节点张量字典仅包含属于本地分区的节点数据。类似地,边张量也仅包含属于本地分区的边数据。元数据包含全局图(而非本地分区)的信息,包括节点数量、边数量以及全局图的节点分配信息。

该函数目前通过本地文件系统接口加载数据。

参数:
  • part_config (str) – 分区配置文件的路径。

  • part_id (int) – 分区 ID。

  • load_feats (bool, 可选) – 是否加载节点/边特征。如果为 False,返回的节点/边特征字典将为空。默认值:True。

  • use_graphbolt (bool, 可选) – 是否加载 GraphBolt 分区。默认值:False。

返回值:

  • DGLGraph – 图分区结构。

  • Dict[str, Tensor] – 节点特征。

  • Dict[(str, str, str), Tensor] – 边特征。

  • GraphPartitionBook – 图分区信息。

  • str – 图名称

  • List[str] – 节点类型列表

  • List[(str, str, str)] – 边类型列表