数据集
- class dgl.graphbolt.Dataset[source]
基类:
object
一个抽象数据集,提供了访问训练所需数据的抽象层。
数据抽象可以是一个原生的 CPU 内存块、一个共享内存块、磁盘上已打开文件的文件句柄、一个提供数据访问 API 的服务等。数据集中有 3 个主要组成部分:
- 任务
一个任务包含若干元信息以及训练集/验证集/测试集。一个数据集可以包含多个任务。
- 特征存储
一个键值存储,用于存储节点/边/图的特征。
- 图拓扑
图拓扑用于子图采样算法生成子图。
- property all_nodes_set: ItemSet | HeteroItemSet
返回包含所有节点的 ItemSet。
- property feature: FeatureStore
返回特征。
- property graph: SamplingGraph
返回图。