dgl.dataloading

dgl.dataloading 包提供了两个基本原语,用于构建从图数据加载的数据管道。Sampler 代表从原始图生成子图样本的算法,而 DataLoader 代表对这些样本进行迭代的迭代器。

DGL 提供了一些内置的采样器,它们是 Sampler 的子类。创建新的采样器遵循相同的范例。阅读我们的用户指南章节 第6章:大规模图上的随机训练 以获取更多示例和解释。

整个包仅适用于 PyTorch 后端。

DataLoaders

DataLoader

采样图数据加载器。

GraphDataLoader

批处理图数据加载器。

Samplers

Sampler

图采样器的基类。

NeighborSampler

通过邻居采样为多层 GNN 构建节点表示计算依赖关系的采样器。

LaborSampler

通过 Labor 采样为多层 GNN 构建节点表示计算依赖关系的采样器,来自 NeurIPS 2023 论文 Layer-Neighbor Sampling -- Defusing Neighborhood Explosion in GNNs

MultiLayerFullNeighborSampler

通过从所有邻居获取消息为多层 GNN 构建节点表示计算依赖关系的采样器。

ClusterGCNSampler

来自 Cluster-GCN: 一种训练深度大型图卷积网络的有效算法 的聚类采样器。

ShaDowKHopSampler

来自 Deep Graph Neural Networks with Shallow Subgraph Samplers 的 K 跳子图采样器。

SAINTSampler

来自 GraphSAINT: 基于图采样的归纳学习方法 的随机节点/边/游走采样器。

Sampler 转换

as_edge_prediction_sampler(sampler[, ...])

从节点级采样器创建边级采样器。

BlockSampler([prefetch_node_feats, ...])

用于以消息传递流图 (MFGs) 形式采样 mini-batch 的基类。

特征预取的实用类和函数

set_node_lazy_features

为输入图的 ndata 分配惰性特征,用于预取优化。

set_edge_lazy_features

为输入图的 edata 分配惰性特征,用于预取优化。

set_src_lazy_features

为输入图的 srcdata 分配惰性特征,用于预取优化。

set_dst_lazy_features

为输入图的 dstdata 分配惰性特征,用于预取优化。

LazyFeature

特征预取的占位符。