ActorDataset

class dgl.data.ActorDataset(raw_dir=None, force_reload=False, verbose=True, transform=None)[source]

基类: DGLBuiltinDataset

这是从Social Influence Analysis in Large-scale Networks <https://dl.acm.org/doi/10.1145/1557019.1557108>的电影-导演-演员-编剧网络中提取的仅包含演员的子图,由Geom-GCN: Geometric Graph Convolutional Networks <https://arxiv.org/abs/2002.05287>引入。

节点代表演员,边代表在同一维基百科页面上共同出现。节点特征对应于维基百科页面中的一些关键词。

统计信息

  • 节点数: 7600

  • 边数: 33391

  • 类别数: 5

  • 10 个训练/验证/测试划分

    • 训练集: 3648

    • 验证集: 2432

    • 测试集: 1520

参数:
  • raw_dir (str, 可选) – 用于存储处理后数据的原始文件目录。默认值: ~/.dgl/

  • force_reload (bool, 可选) – 是否重新下载数据源。默认值: False

  • verbose (bool, 可选) – 是否打印进度信息。默认值: True

  • transform (callable, 可选) – 一个转换函数,接收一个 DGLGraph 对象并返回其转换后的版本。每次访问时,DGLGraph 对象都会先进行转换。默认值: None

num_classes

节点类别数

类型:

int

说明

该图不包含双向边。

__getitem__(idx)[source]

获取指定索引的数据对象。

__len__()[source]

数据集中的样本数量。