TexasDataset
- class dgl.data.TexasDataset(raw_dir=None, force_reload=False, verbose=True, transform=None)[source]
基类:
GeomGCNDataset
WebKB 的 Texas 子集,后由 Geom-GCN: Geometric Graph Convolutional Networks 修改。
节点代表网页。边代表它们之间的超链接。节点特征是网页的词袋表示。网页被手动分为五个类别:学生 (student)、项目 (project)、课程 (course)、职员 (staff) 和教员 (faculty)。
统计信息
节点数: 183
边数: 325
类别数: 5
10 个训练/验证/测试划分
训练集: 87
验证集: 59
测试集: 37
- 参数:
注意事项
图中不包含双向边。
示例
>>> from dgl.data import TexasDataset >>> dataset = TexasDataset() >>> g = dataset[0] >>> num_classes = dataset.num_classes
>>> # get node features >>> feat = g.ndata["feat"]
>>> # get data split >>> train_mask = g.ndata["train_mask"] >>> val_mask = g.ndata["val_mask"] >>> test_mask = g.ndata["test_mask"]
>>> # get labels >>> label = g.ndata['label']
- __getitem__(idx)
获取指定索引的数据对象。
- __len__()
数据集中的样本数量。