dgl.data

dgl.data 包包含 DGL 托管的数据集,以及用于从外部资源下载、处理、保存和加载数据的工具。

基类

DGLDataset

用于创建图数据集的基础 DGL 数据集。

CSVDataset

从 CSV 文件加载和解析图数据的 Dataset 类。

节点预测数据集

用于节点分类/回归任务的数据集

SSTDataset

斯坦福情感树库数据集。

KarateClubDataset

用于节点分类的 Karate Club 数据集

CoraGraphDataset

Cora 引文网络数据集。

CiteseerGraphDataset

Citeseer 引文网络数据集。

PubmedGraphDataset

Pubmed 引文网络数据集。

CoraFullDataset

用于节点分类任务的 CORA-Full 数据集。

AIFBDataset

用于节点分类任务的 AIFB 数据集

MUTAGDataset

用于节点分类任务的 MUTAG 数据集

BGSDataset

用于节点分类任务的 BGS 数据集

AMDataset

AM 数据集。

AmazonCoBuyComputerDataset

AmazonCoBuy 数据集中用于节点分类任务的 'Computer' 部分。

AmazonCoBuyPhotoDataset

用于节点分类任务的 AmazonCoBuy 数据集。

CoauthorCSDataset

Coauthor 数据集中用于节点分类任务的 'Computer Science (CS)' 部分。

CoauthorPhysicsDataset

Coauthor 数据集中用于节点分类任务的 'Physics' 部分。

PPIDataset

用于归纳节点分类的蛋白质-蛋白质相互作用数据集

RedditDataset

用于社区检测(节点分类)的 Reddit 数据集

SBMMixtureDataset

对称随机块模型混合

FraudDataset

欺诈节点预测数据集。

FraudYelpDataset

欺诈 Yelp 数据集

FraudAmazonDataset

欺诈 Amazon 数据集

BAShapeDataset

来自 GNNExplainer: Generating Explanations for Graph Neural Networks 的 BA-SHAPES 数据集

BACommunityDataset

来自 GNNExplainer: Generating Explanations for Graph Neural Networks 的 BA-COMMUNITY 数据集

TreeCycleDataset

来自 GNNExplainer: Generating Explanations for Graph Neural Networks 的 TREE-CYCLES 数据集

TreeGridDataset

来自 GNNExplainer: Generating Explanations for Graph Neural Networks 的 TREE-GRIDS 数据集

WikiCSDataset

Wiki-CS 是一个基于维基百科的节点分类数据集,来自 Wiki-CS: A Wikipedia-Based Benchmark for Graph Neural Networks

FlickrDataset

用于节点分类的 Flickr 数据集,来自 GraphSAINT: Graph Sampling Based Inductive Learning Method

YelpDataset

PATTERNDataset

用于图模式识别任务的 PATTERN 数据集。

CLUSTERDataset

用于半监督聚类任务的 CLUSTER 数据集。

ChameleonDataset

关于变色龙的维基百科页面-页面网络,来自 Multi-scale Attributed Node Embedding,后由 Geom-GCN: Geometric Graph Convolutional Networks 修改。

SquirrelDataset

关于松鼠的维基百科页面-页面网络,来自 Multi-scale Attributed Node Embedding,后由 Geom-GCN: Geometric Graph Convolutional Networks 修改。

ActorDataset

电影-导演-演员-编剧网络的仅演员诱导子图,来自 Social Influence Analysis in Large-scale Networks <https://dl.acm.org/doi/10.1145/1557019.1557108>,由 Geom-GCN: Geometric Graph Convolutional Networks <https://arxiv.org/abs/2002.05287> 引入

CornellDataset

WebKB 的 Cornell 子集,后由 Geom-GCN: Geometric Graph Convolutional Networks 修改。

TexasDataset

WebKB 的 Texas 子集,后由 Geom-GCN: Geometric Graph Convolutional Networks 修改。

WisconsinDataset

WebKB 的 Wisconsin 子集,后由 Geom-GCN: Geometric Graph Convolutional Networks 修改。

RomanEmpireDataset

来自 'A Critical Look at the Evaluation of GNNs under Heterophily: Are We Really Making Progress? <https://arxiv.org/abs/2302.11640>'__ 论文的 Roman-empire 数据集。

AmazonRatingsDataset

来自 'A Critical Look at the Evaluation of GNNs under Heterophily: Are We Really Making Progress? <https://arxiv.org/abs/2302.11640>'__ 论文的 Amazon-ratings 数据集。

MinesweeperDataset

来自 'A Critical Look at the Evaluation of GNNs under Heterophily: Are We Really Making Progress? <https://arxiv.org/abs/2302.11640>'__ 论文的 Minesweeper 数据集。

TolokersDataset

来自 'A Critical Look at the Evaluation of GNNs under Heterophily: Are We Really Making Progress? <https://arxiv.org/abs/2302.11640>'__ 论文的 Tolokers 数据集。

QuestionsDataset

来自 'A Critical Look at the Evaluation of GNNs under Heterophily: Are We Really Making Progress? <https://arxiv.org/abs/2302.11640>'__ 论文的 Questions 数据集。

MovieLensDataset

用于边预测任务的 MovieLens 数据集。

边预测数据集

用于边分类/回归和链接预测的数据集

FB15k237Dataset

FB15k237 链接预测数据集。

FB15kDataset

FB15k 链接预测数据集。

WN18Dataset

WN18 链接预测数据集。

BitcoinOTCDataset

用于欺诈检测的 BitcoinOTC 数据集

ICEWS18Dataset

用于时间图的 ICEWS18 数据集

GDELTDataset

用于基于事件的时间图的 GDELT 数据集

图预测数据集

用于图分类/回归任务的数据集

QM7bDataset

用于图属性预测(回归)的 QM7b 数据集

QM9Dataset

用于图属性预测(回归)的 QM9 数据集

QM9EdgeDataset

用于图属性预测(回归)的 QM9Edge 数据集

MiniGCDataset

合成图分类数据集类。

TUDataset

TUDataset 包含许多用于图分类的图核数据集。

LegacyTUDataset

LegacyTUDataset 包含许多用于图分类的图核数据集。

GINDataset

Dataset 类,对应论文 How Powerful Are Graph Neural Networks?

FakeNewsDataset

假新闻图分类数据集。

BA2MotifDataset

来自 Parameterized Explainer for Graph Neural Network 的 BA-2motifs 数据集

ZINCDataset

用于图回归任务的 ZINC 数据集。

MNISTSuperPixelDataset

用于图分类任务的 MNIST 超像素数据集。

CIFAR10SuperPixelDataset

用于图分类任务的 CIFAR10 超像素数据集。

数据集适配器

AsNodePredDataset

为一个标准的半监督直推式节点预测任务重新调整数据集用途。

AsLinkPredDataset

为链接预测任务重新调整数据集用途。

AsGraphPredDataset

为一个标准的图属性预测任务重新调整数据集用途。

工具类

utils.get_download_dir

获取下载目录的绝对路径。

utils.download

下载指定的 URL。

utils.check_sha1

检查文件内容的 sha1 哈希是否与预期的哈希匹配。

utils.extract_archive

提取归档文件。

utils.split_dataset

将数据集分割为训练集、验证集和测试集。

utils.load_labels

从文件加载标签字典

utils.save_info

将数据集相关信息保存到磁盘。

utils.load_info

从磁盘加载数据集相关信息。

utils.add_nodepred_split

将给定数据集分割为训练集、验证集和测试集,用于直推式节点预测任务。

utils.mask_nodes_by_property

根据给定的节点属性,为存在分布偏移的节点分割提供分割掩码,如论文 Evaluating Robustness and Uncertainty of Graph Models Under Structural Distributional Shifts 中所述。

utils.add_node_property_split

根据给定的节点属性创建一个存在分布偏移的节点分割,如论文 Evaluating Robustness and Uncertainty of Graph Models Under Structural Distributional Shifts 中所述。

utils.Subset

数据集在指定索引处的子集