BitcoinOTCDataset

class dgl.data.BitcoinOTCDataset(raw_dir=None, force_reload=False, verbose=False, transform=None)[source]

基类: DGLBuiltinDataset

用于欺诈检测的 BitcoinOTC 数据集

这是在名为 Bitcoin OTC 的平台上使用比特币进行交易的人们组成的谁信任谁网络。由于比特币用户是匿名的,因此需要维护用户信誉记录,以防止与欺诈和风险用户进行交易。

官方网站: https://snap.stanford.edu/data/soc-sign-bitcoin-otc.html

Bitcoin OTC 数据集统计信息

  • 节点数: 5,881

  • 边数: 35,592

  • 边权重范围: -10 到 +10

  • 正边比例: 89%

参数:
  • raw_dir (str) – 用于下载或包含输入数据的原始文件目录。默认值: ~/.dgl/

  • force_reload (bool) – 是否重新加载数据集。默认值: False

  • verbose (bool) – 是否打印进度信息。默认值: True。

  • transform (callable, optional) – 一个转换函数,接受一个 DGLGraph 对象并返回转换后的版本。DGLGraph 对象在每次访问前都会被转换。

graphs

DGLGraph 对象的列表

类型:

list

is_temporal

指示图是否为时序图

类型:

bool

引发:

UserWarning – 如果原始数据被作者在远程服务器上更改。

示例

>>> dataset = BitcoinOTCDataset()
>>> len(dataset)
136
>>> for g in dataset:
....    # get edge feature
....    edge_weights = g.edata['h']
....    # your code here
>>>
__getitem__(item)[source]

按索引获取图

参数:

item (int) – 项索引

返回:

包含以下内容的图

  • edata['h'] : 边权重

返回类型:

dgl.DGLGraph

__len__()[source]

数据集中图的数量。

返回类型:

int