首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

机器学习经典开源数据大盘

Kaggle数据集 Kaggle数据集地址 https://www.kaggle.com/datasets 这是我最喜欢的数据集之一,每个数据集都对应于一个小型社区,你可以在其中讨论数据、查找公共代码...这里包含了大量不同类型、不同结构的数据集内容。同时,还可以在其中获取到与每个数据集关联的资料,其中包含了许多数据科学家们提供的数据分析笔记等。 2....Amazon数据集 AWS开放数据地址 https://registry.opendata.aws/ 这个数据集中包含了不同领域的数据内容,例如:公共交通、生态资源、卫星图像等。...根据机器学习问题的类型对数据集进行分类,可找到单变量或多变量时间序列数据集,以及分类、回归或推荐系统的数据集。 4....其中列出的大多数数据集都是免费的,但在使用任何数据集之前,均需检查数据集的许可要求。 7.

87620
您找到你想要的搜索结果了吗?
是的
没有找到

2014国内外数据泄密事件大盘

Verizon发布了《2014年度数据泄露调查报告》,报告中回顾了63737起赛博安全事件和1367起已经确认的数据泄漏事件。报告数据显示:由于数据库原因产生的信息泄漏高达25%。...且听且分析: 春运第一天12306爆用户信息泄露漏洞 2014年铁路春运售票第一天,在经历了早上宕机1小时之后,12306铁路客户服务中心网站再次爆发用户账号串号的问题,大量用户身份证等信息遭泄露。...数据泄密分析 通过2014年Verizon数据泄漏调查报告和全年的数据安全事件,可以发现以下几种数据泄漏原因: 以上事件,不难发现,大多数企业的安全管理和防护都无法跟上网络犯罪的脚步,入侵只需要数分钟或数小时...安华金和安全研究人员建议从以下几点措施来实现数据的安全防护: 措施一:保护核心数据安全,建议使用数据库风险评估工具,定期对数据库进行安全风险检查,发现数据库使用中的安全隐患,及时人工进行加固; 措施二:...; 措施四:运维人员对数据库中的敏感数据修改,一定要记入审计记录,如果出现非法篡改行为可以通过事后追责定责; 措施五:对从数据库批量导出数据的行为、整表删除、不带条件的更新等恶意行为及时中断数据库操作,

1.4K40

Mysql数据类型以及字段属性大盘

也就是说不论中间用何种分隔,存储到数据库之后都是2012-08-00 l  Datetime:存储日期和时间组合,标准格式YYYY-MM-DD HH:MM:SS。...Timstamp:和datetime的区别在于插入和更新会自动回去当前时间 l   Year:存储年份信息,有两位和4位之分 2、  数字数值类型 Bool是tinyint的别名,用于赋值0或者1 Bigint:数据类型提供了...18446744073709551615 Int:提供了第二大的整数范围 Mediumint:提供了第三大整数 SMAllint:提供了第四大整数范围 Tinyint:提供了最小的整数范围,值在-128-127(分清楚范围就不担心数据够不够存储...提供第三大非二进制字符串存存储 Tinyblob:提供最小的二进制字符串存储最多255个字符 Tinytext:提供最小的非二进制字符串存储最多255个字符 Enum:枚举类型,最多可以有65535组不同的数据...Set:枚举类型,最多可以设置有64个成员 数据类型属性 Auto_increment:自增,每次插入该列的值会是上次插入值+1 Default:默认值,当没存入数据时会自动存入默认值 Index:索引

87980

网络排错大盘

无论是OSI七层模型还是DoD模型,都是用来描述网络通信的一个过程,以让我们对网络数据的发送和接收有一个大致的认识。...1.5 清楚知道网络排错的一个重要原则 网络排错,不就是要判断网络哪里出了问题,因此,你就必须要知道数据的走向。 所以一个重要原则是:关注数据的走向。...通过这个测试结果,我们可以清楚地知道电脑在访问互联网时,数据的走向情况: ? 根据这个数据走向,我们就可以得到一个重要的思路,就是根据数据走向来检测网络的通畅情况!...当然,这里并没有提到出口放置防火墙的情况,实际上,思路是一致的,但是,你需要考虑的是,你的访问数据有没有被防火墙给过滤掉,是数据出去的时候过滤了,还是数据回来的时候过滤了?...文章来源:数据中心运维管理 - End -

1.4K30

EEG MEGMRI fNIRS公开数据大盘

数据库目前被试数约1200人,包括结构MRI、静息态MRI、任务态fMRI、MEG等数据模态,其他数据还包括人口统计学数据、神经心理学数据、基因数据。...网址:http://fcon_1000.projects.nitrc.org/indi/CoRR/html/index.html DEAP数据库   采用生理信号进行情绪分析数据库(Database...网址:https://nda.nih.gov/ OpenNEURO   OpenNEURO数据库是一个用于分析和共享来自人脑成像研究的神经影像数据的开放平台。...BrainMap不仅提供用于荟萃分析数据挖掘的数据,还发布用于定量整合神经影像数据的软件和工具。...网址:https://physionet.org/ 总结   笔者在这里较为全面地盘点目前免费的EEG/MEG/MRI/ fNIR公开数据库,这些数据库为科研人员提供了可供分析的海量数据,特别是对脑科学研究结果的可重复性验证以及大数据分析具有重要意义

1.6K01

【涨姿势】统计名词和数据挖掘术语大盘

一、数据挖掘术语 【算法】指的是用于实现某一数据挖掘技术-如分类树、辨识分析等等的特定程序。 【属性】也被称为“特性”、“变量”、或者从数据库的观点,是一个“域” 。...【差异量数】反映一组数据离散程度的量 【一批数据的算术平均数指的是这批数据总和数除以数据总次数后所得的商数。 【平均差】各数据与其平均数的离差绝对值的平均值。...备择假设作为虚无假设的对立假设而存在,因此它也是一个陈述命题,备择假设是对虚无假设的否定 【方差分析】统计学中一种独特的假设检验方法,它的最基本功能就是一次性检验多个总体平均数的差异显著性 【差异系数...2时,称极低相关或接近零相关 【积差相关】是应用最普遍、最基本的一种相关分析方法,尤其适合于对两个连续变量之间的相关情况进行定量分析 【等级相关适用的几种情况】①两列观测数据都是顺序变量数据,或一列是顺序变量数据...纸笔测验和操作测验 7、纸笔测验优点①提高测验的效率,即同时可以进行大团体的测验②便于完整记录学生在题目作答上的反应③便于施测和评分过程的规范化和标准化从而提高学业成就测验的信度与效度④便于对测验中答题信息的分析研究

1.4K60

C#集合类型大盘

IDictionary   IDictionary提供了对键值对集合的访问,也是继承了ICollection和IEnumerable,扩展了通过Key来访问和操作数据的方法...因为采用Hashtable作为存储结构,就意味着里面的数据是无序排列的,所以想按一定的顺序去遍历Dictionary里面的数据是要费一点工夫的。   ...但是不同的地方在于,SortedList实际是将数据存存储在数组中的。也就是说添加和移除操作都是线性的,时间复杂度是O(n),因为操作其中的元素可能导致所有的数据移动。...另外的话由于内部实质是一个数组,所以在List的未必添加数据是比较快的,但是如果在数据的头或者中间添加删除数据相对来说更低效一些因为会影响其它数据的重新排列。...LinkedList   LinkedList在内部维护了一个双向的链表,也就是说我们在LinkedList的任何位置添加或者删除数据其性能都是很快的。因为它不会导致其它元素的移动。

1K70

EEG脑电公开数据大盘

EEG/ MEG/MRI/ fNIRS公开数据大盘点》),但最近笔者又搜罗了不少EEG的公开数据库网站,因此在这篇推文里笔者把目前的EEG公开数据库进行了较为全面的总结,希望对大家有所帮助。...1.采用生理信号进行情绪分析数据库(Database forEmotion Analysis using Physiological Signals,DEAP) 该数据库是由来自英国伦敦玛丽皇后大学等单位的研究人员通过实验采集到的...该数据库主要包括每个被试在面部表情视频刺激下的EEG数据以及心理量表数据。...网址:http://www.eecs.qmul.ac.uk/mmv/datasets/deap/ 2.OpenNEURO 该数据库是一个用于分析和共享来自人脑成像研究的神经影像数据的开放平台。...,用于分析、重新分析和元分析

1.7K20

深度学习应用大盘

➤脑肿瘤检测 https://arxiv.org/abs/1505.03540 在2013年BRATS测试数据集上的报结果表明,802,368参数网络比已发布的最先进的技术改进了超过30倍。.../google-cuts-its-giant-electricity-bill-with-deepmind-powered-ai Google正在使用DeepMind人工智能子公司的技术,以大幅节省其数据中心的电力功耗...http://www.theverge.com/2016/7/5/12095788/amazon-picking-robot-challenge-2016 类似上面的仓库优化,亚马逊研究人员基于深度学习技术分析...➤临床事件预测 http://arxiv.org/pdf/1511.05942v9.pdf 一个RNN训练,8年时间从来自26万患者和14805名医生的EHR数据,该神经网络进行多标签预测(每次诊断或药物类别作为一个标签...生物信息学 http://www.mdpi.com/1422-0067/17/8/1313/htm 药物设计,虚拟筛选(VS),定量结构——活性关系(QSAR)研究,蛋白质结构预测和基因组学(和其他组学)数据挖掘

86880
领券