split_dataset

class dgl.data.utils.split_dataset(dataset, frac_list=None, shuffle=False, random_state=None)[source]

基类

将数据集分割为训练集、验证集和测试集。

参数:
  • dataset – 我们假设 len(dataset) 返回数据点的数量,dataset[i] 返回第 i 个数据点。

  • frac_list (listNone可选) – 一个长度为 3 的列表,包含用于训练集、验证集和测试集的数据比例。如果为 None,我们将使用 [0.8, 0.1, 0.1]。

  • shuffle (bool可选) – 默认情况下,我们对数据集进行连续分割。如果为 True,我们将首先随机打乱数据集。

  • random_state (Noneintarray_like可选) – 用于初始化伪随机数生成器的随机种子。可以是介于 0 和 2**32 - 1 之间的任何整数(包含两端)、此类整数的数组(或其他序列),或 None(默认值)。如果 seed 为 None,则 RandomState 将尝试从 /dev/urandom(或 Windows 中的等效项)读取数据(如果可用),否则从时钟中获取种子。

返回:

训练集、验证集和测试集的子集。

返回类型:

list 长度为 3