做网站的快捷方式代码,网站建设合同概念,做火锅加盟哪个网站好,广州十大营销策划公司文章目录 简介数据集划分数据集 简介
记录深度学习编写程序过程中的一些工具函数
数据集
划分数据集
数据集划分思路#xff1a;
若数据集很小#xff0c;直接随机打乱 import random random.shuffle(data)若数据集很大#xff0c;选择随机打乱下标#xff0c;根据下… 文章目录 简介数据集划分数据集 简介
记录深度学习编写程序过程中的一些工具函数
数据集
划分数据集
数据集划分思路
若数据集很小直接随机打乱 import random random.shuffle(data)若数据集很大选择随机打乱下标根据下标实现数据集划分 get_dataset_split_num 无需输入训练集只输入验证集和测试集的比例或具体数量 def get_dataset_split_num(n, valid0, test0):n: 数据集数量valid, test: 可为比例和具体数值if valid 1:assert test 1assert valid test 0valid_num int(n * valid)test_num int(n * test)train_num n - valid_num - test_numelse:valid_num validtest_num testtrain_num n - valid_num - test_numreturn train_num, valid_num, test_num运行: train_num, valid_num, test_num get_dataset_split_num(100, valid0.2, test0.31)
train_num, valid_num, test_num get_dataset_split_num(100, valid20, test31)cut_datasets 数据集打乱 def cut_datasets(arr, valid0, test0):arr: 为下标数组train_num, valid_num, _ get_dataset_split_num(len(arr), valid, test)a1 arr[:train_num]a2 arr[train_num:train_num valid_num]a3 arr[train_num valid_num:]return a1, a2, a3