网站建设工期及预算,优秀大校网站,做油和米的网站,深圳网站建设营销策划转自#xff1a;https://zhuanlan.zhihu.com/p/84088095
最近一次新增#xff1a;2020.02.11
大家好#xff0c;先给各位抱拳了#xff01;我是和鲸#xff08;科赛 http://kesci.com#xff09;的运营一枚#xff0c;今天给大家分享以下我们#xff08;通过网线https://zhuanlan.zhihu.com/p/84088095
最近一次新增2020.02.11
大家好先给各位抱拳了我是和鲸科赛 http://kesci.com的运营一枚今天给大家分享以下我们通过网线奔波世界各地搜集过来的数据集们
大家有想要的也可以在评论区许愿我去求捞数据集的小哥哥小姐姐们帮帮忙
另外打一波硬广以下所有数据集都可以在和鲸科赛 http://kesci.com的K-Lab产品中直接挂在项目中使用无需下载。现还有另有免费计算资源可以薅。
请猛戳链接访问和鲸科赛 kesci.com ——结构化数据——
交通
Pronto共享单车数据集70.8MB
欧州航空旅客运输季度数据集更新至2019第二季度63KB
2015年美国✈️✈️航班延误或取消数据集192.3MB
明尼阿波里斯市交通流量数据3.1MB
航班动态起降数据集2GB
交通卡口过车数据数据集100G
Uber 纽约市乘车数据109.1MB
气象
中国历年台风最佳路径数据
1750年至今全球地表气温变化数据
1965-2016全球重大地震数据2.3MB
El Nino厄尔尼诺数据集9.6MB
中国气象数据675.1MB
北京空气质量数据21.5MB
中国空气质量数据集1.2GB
澳大利亚山火数据集100MB
1750年至今全球地表气温变化数据84MB
能源
全球能源之风力预测数据集24.5MB
风力发电机数据集12.3MB
2010年芝加哥能源使用情况26.3MB
中国水资源数据集130KB
镇江电力数据17.7MB
安全
CNNVD中国信息安全漏洞数据库
NVD美国国家通用漏洞数据库335MB
NSL_KDD数据集25.3MB
KDD-CUP99网络入侵检测数据集220MB
医学
心脏病诊断数据集17.6KB
骨科患者的生物力学特征数据集24.4KB
埃博拉数据集1.3MB
癫痫发作识别数据集7.3MB
1000个12导联ECG心电图数据集70.7MB
宫颈癌风险因素数据集99.7KB
手势检测数据集16.9MB
帕金森疾病诊断数据集5.1MB
心脏病相关数据集11.1KB
基于重症监护室ICU多生命体征预测脓毒症21.1KB
内置动脉插管数据集288.7KB
埃及患者的丙型肝炎病毒HCV数据集158KB
急性肝功能衰竭预测数据集848.6KB
心血管疾病数据集2.8MB
新型冠状病毒(2019-nCoV)疫情时间序列数据集1.8MB
游戏
英雄联盟英雄数据253.6KB
Steam游戏汇总
100万数独游戏156.4MB
守望先锋英雄数据集53.4KB
Dota2游戏结果数据集21.3MB
王者荣耀英雄数据集7.8KB
包含用户行为的Steam游戏数据集8.5MB
经济金融
拍拍贷互联网金融数据320MB
P2P信贷平台业务数据400MB
我国主要城市年度数据-产值、人口、就业、教育等10KB
4万条信用贷款业务、4千条现金贷业务脱敏数据
上证A股个股日线数据187.6MB
信用卡评分模型构建数据7.2MB
1978至今的黄金价格数据187.8KB
成人人口普查收入的相关信息3.9MB
金融风险预测数据集2.1MB
9000条信用卡使用情况数据881.7KB
中国工商企业注册信息数据集559.4MB
加密货币市场价格39.0MB
常用汇率过去3年的历史数据31.6KB
信用卡欺诈检测数据集143.8MB
信用违约概率预测 | Kaggle7.2MB
银行电话营销数据集2.1MB
LendingClub贷款数据421.3MB
比特币历史交易数据221.1MB
Dow Jones 股票日结算数据1.6MB
SP 500股价数据128.1MB
PyPortfolioOpt股票价格1.1MB
特斯拉股票价格168.7KB
苹果股票市场数据历史记录41.2KB
7家顶级公司的收购数据69.4KB
2019年全球七百多万个公司的数据275.1MB
美国医疗保险市场数据778.8MB
印度贸易数据19.0MB
30家在美国的大型公司的道琼斯指数数据2.7MB
最近十年谷歌的股票价格数据集165.5KB
桑坦德银行顾客交易预测数据244.3MB
欧元兑换国际主要货币的汇率日数据更至2019.9.262.9MB
众筹网站Kickstarter项目数据集55.3MB
MT4历史数据中心各货币对外汇交易数据905.5MB
Santander客户价值预测数据集31.5MB
消费
出行产品未来14个月销量预测数据集61.2MB
口红数据集1006.6KB
黑五购物数据集23.8MB
去哪儿网—旅游产品机酒数据1.5MB
全球米其林餐厅信息100KB
适合顾客尺码推荐的服装适合数据集150MB
淘宝App用户行为507.3MB
废旧汽车价格预测数据集611.6KB
天猫双十一女性美妆的数据集3.3MB
淘宝云主题点击数据集1.6GB
广告实时竞价数据455.5MB
住房
链家二手房数据集5.1MB
携程房型产品用户行为数据集506.1MB
房价预测103.3KB
阿姆斯特丹airbnb数据集400MB
纽约Airbnb开放数据6.8MB
房价预测103.3KB
体育
NBA数据集62.3MB
欧洲足球联赛数据集172.8MB
2015-2018MLB棒球常规赛数据集322.7MB
120年奥运历史数据集运动员和成绩39.6MB
科比生涯数据集(5.8MB)
植物
蘑菇分类数据集UCI Machine Learning365.2KB
iris鸢尾花数据集4.1KB
土壤湿度的高光谱基准数据集1.6MB
小麦种子数据集9.1KB
100种植物种类数据集35.1MB
天文
不明飞行物世纪报告14.6MB
开普勒望远镜所标注的时间序列数据集27.6MB
推荐系统
资讯内容用户行为数据集153.3MB
Book Crossing 推荐系统数据24.9MB
Jester 推荐系统数据4MB
预测
人力资源分析数据集121.5KB
申请大学的成功率预测数据集12.6KB
用户点击预测数据集516.8MB
Netflix Price 竞赛数据集665.7MB
其他
2017年-2018年 关于申根签证的数据集
垃圾分类数据49.3KB
豆瓣读书数据集5.9MB
豆瓣电影数据集100MB
二战空袭数据集27.2MB
拉勾网上海数据分析师职位数据497.4KB
濒危语言统计736.7KB
CNNVD中国信息安全漏洞数据库
个人睡眠数据66.1KB
2019年世界幸福报告6.7KB
鲍鱼数据集187.5KB
鱼类毒性数据集30.5KB
人口普查收入数据集UCI3.4MB
TMDB 5000部电影数据集40MB ——NLP大类——
6000条周杰伦微博超话数据1.1MB
2016-2019新闻联播语料库11.3MB
中文谣言语料库32.6MB
咪蒙所有公众号文章3.9MB
中国对联数据集28.2MB
1998人民日报标注语料库PFR10.2MB
sentiment140 情感分析数据集72.6KB
人民日报文章数据集(1979-2010)811.9MB
人民日报文章数据集(1949-1978)559.4MB
中文新闻数据集70.3MB
《中餐厅3》19W弹幕数据12.8MB
IMDB电影评论数据32.0MB
中文医学问答数据集85MB
耶鲁文本转SQL语句挑战数据集95.1MB
淘宝某店铺电风扇评论273.9KB
新加坡国立大学SMS语料库23.4MB
豆瓣《哪吒之魔童降世》影评85.1KB
bilibili流行动漫影评数据2.3MB
6000条周杰伦微博超话数据1.1MB
中文经典典籍语料
非正式汉语数据集214.5MB
中文对话情绪语料1.1MB
维基百科中文语料库518.7MB
频率最高的9933个最常用汉字数据集1.0MB
未名BBS热门话题3.6MB
麦当劳就餐负面评论数据集891.1KB
Lord of the Rings指环王数据223.9KB
斯坦福情绪树库带有情感注释的标准情绪数据集6.1MB
关于美国的航空公司的推特的情绪分析数据集2.6MB
聊天语料库数据集210.7MB
短文本分类数据集13.1MB
成语阅读理解数据集195.8MB
论文自动评分数据集78.8MB
多域情感数据集51.2MB
翻译语料595.9MB
社区问答数据集1.7GB
中文科学文献摘要数据集92.9MB
维基百科英文语料库89.0MB
实体识别
用于命名实体识别的带注释语料库26.4MB
使用Lattice LSTM的中文NER数据191.5KB
医疗命名实体识别数据集5.1MB
中文实体关系抽取数据集8.1MB
金融信息负面及主体判定比赛数据集17MB ——CV大类——
Fashion-MNIST图像数据集200.4MB
车辆数据集车辆识别与分类62.5MB
垃圾分类数据集
另一个垃圾分类数据集40.9MB
CIFAR10数据集148MB
GTSRB-德国交通标志识别图像数据253.3MB
手势识别数据库1.1GB
情绪的面部表情170MB
宠物图像数据集783.5MB
枪支目标检测2.4MB
人脸图像数据294.1MB
狗狗种类图像数据集919.5MB
中国交警手势数据集1.8GB
场景分类数据集105.9MB
87种宝石图片数据50.9MB
验证码数据集13.5MB
植物
水稻叶子疾病图片集36.7MB
植物幼苗图片数据集
花卉识别数据集224.9MB
花卉图像分类
可食用野外植物数据集
气象
飓风损害的卫星图像数据集63MB
从卫星图像理解云层数据集42MB
字符识别
TibetanMNIST藏文手写数字数据集53.2MB
MNIST手写识别数据集9.5MB
Chars74K字符识别数据集188.3MB
信用卡卡面图像及标注数据42.9MB
手写数学表达式识别29MB
图片与单词匹配数据集31.1MB
密集不规则文本行数据集353MB
视觉文字识别数据集
HASY手写符号图片数据集127.2MB
麻将图片数据集7.5MB
医疗
犬球虫病寄生虫图片集18.1MB
头部CT图像数据24.4MB
肺部CT图像数据529.0MB
心血管疾病预测2.7MB
深圳医院胸片检查掩膜图片数据集19.8MB
肺部CT图像数据529MB
行人识别
行人检测数据集ETHZ146MB
行人重识别数据集Market-1501145.7MB
行人重识别数据集RAiD140.1MB
行人重识别数据集prid_20111015.3MB
汽车后视摄像头视角行人数据集799.7MB ——语音大类——
Mozilla语音数据集-中文358.2MB
2000个英语读数字的录音8.9MB