QM7bDataset

class dgl.data.QM7bDataset(raw_dir=None, force_reload=False, verbose=False, transform=None)[source]

基类:DGLDataset

用于图属性预测 (回归) 的 QM7b 数据集

该数据集包含 7,211 个分子,具有 14 个回归目标。节点表示原子,边表示键。边数据 'h' 表示库仑矩阵的条目。

参考:http://quantum-machine.org/datasets/

统计信息

  • 图数量:7,211

  • 回归目标数量:14

  • 平均节点数量:15

  • 平均边数量:245

  • 边特征大小:1

参数:
  • raw_dir (str) – 用于下载/包含输入数据目录的原始文件目录。默认值:~/.dgl/

  • force_reload (bool) – 是否重新加载数据集。默认值:False

  • verbose (bool) – 是否打印进度信息。默认值:True。

  • transform (callable, optional) – 一个转换函数,接受一个 DGLGraph 对象并返回一个转换后的版本。每次访问时都会对 DGLGraph 对象进行转换。

num_tasks

预测任务数量

类型:

int

num_labels

(已弃用,请改用 num_tasks) 预测任务数量

类型:

int

引发:

UserWarning – 如果作者在远程服务器上更改了原始数据。

示例

>>> data = QM7bDataset()
>>> data.num_tasks
14
>>>
>>> # iterate over the dataset
>>> for g, label in data:
...     edge_feat = g.edata['h']  # get edge feature
...     # your code here...
...
>>>
__getitem__(idx)[source]

按索引获取图和标签

参数:

idx (int) – 项目索引

返回类型:

(dgl.DGLGraph, Tensor)

__len__()[source]

数据集中图的数量。

返回类型:

int