BuiltinDataset

class dgl.graphbolt.BuiltinDataset(name: str, root: str = 'datasets')[source]

基类: OnDiskDataset

一个工具类,用于从 AWS S3 下载内置数据集并将其加载为 OnDiskDataset

可用的内置数据集包括

cora

cora 数据集是一个同构引用网络数据集,专为节点分类任务设计。

ogbn-mag

ogbn-mag 数据集是一个异构网络,由 Microsoft Academic Graph (MAG) 的一个子集组成。详情请参阅 ogbn-mag

注意

在原始图上添加了反向边并移除了重复边。

ogbl-citation2

ogbl-citation2 数据集是一个有向图,表示从 MAG 提取的论文子集之间的引用网络。详情请参阅 ogbl-citation2

注意

在原始图上添加了反向边并移除了重复边。

ogbn-arxiv

ogbn-arxiv 数据集是一个有向图,表示 MAG 索引的所有计算机科学 (CS) arXiv 论文之间的引用网络。详情请参阅 ogbn-arxiv

注意

在原始图上添加了反向边并移除了重复边。

ogbn-papers100M

ogbn-papers100M 数据集是一个有向图,表示 MAG 索引的所有计算机科学 (CS) arXiv 论文之间的引用网络。详情请参阅 ogbn-papers100M

注意

在原始图上添加了反向边并移除了重复边。

ogbn-products

ogbn-products 数据集是一个无向无权图,表示亚马逊产品共同购买网络。详情请参阅 ogbn-products

注意

在原始图上添加了反向边。节点特征存储为 float32。

ogb-lsc-mag240m

ogb-lsc-mag240m 数据集是一个从 Microsoft Academic Graph (MAG) 中提取的异构学术图。详情请参阅 ogb-lsc-mag240m

注意

在原始图上添加了反向边。

igb-hom 和 igb-hom-[tiny|small|medium|large]

igb-hom-[tiny|small|medium|large] 和 igb-hom 数据集是一个同构引用网络,旨在帮助开发人员高精度地训练和评估 GNN 模型。详情请参阅 igb-hom-[tiny|small|medium|large]

注意

在原始图上添加了自环边。节点特征存储为 float32。

igb-het-[tiny|small|medium]

igb-het-[tiny|small|medium] 数据集是一个异构引用网络,旨在帮助开发人员高精度地训练和评估 GNN 模型。详情请参阅 igb-het-[tiny|small|medium]

注意

在原始图上添加了四种反向边类型。节点特征存储为 float32。

参数:
  • name (str) – 内置数据集的名称。

  • root (str, 可选) – 数据集的根目录。默认为 datasets