数据集

class dgl.graphbolt.Dataset[source]

基类: object

一个抽象数据集,提供了访问训练所需数据的抽象层。

数据抽象可以是一个原生的 CPU 内存块、一个共享内存块、磁盘上已打开文件的文件句柄、一个提供数据访问 API 的服务等。数据集中有 3 个主要组成部分:

  • 任务

    一个任务包含若干元信息以及训练集/验证集/测试集。一个数据集可以包含多个任务。

  • 特征存储

    一个键值存储,用于存储节点/边/图的特征。

  • 图拓扑

    图拓扑用于子图采样算法生成子图。

property all_nodes_set: ItemSet | HeteroItemSet

返回包含所有节点的 ItemSet。

property dataset_name: str

返回数据集名称。

property feature: FeatureStore

返回特征。

property graph: SamplingGraph

返回图。

property tasks: List[Task]

返回任务列表。