首页
学习
活动
专区
工具
TVP
发布

深度学习计算机视觉

专栏成员
67
文章
91509
阅读量
30
订阅数
数据挖掘之数据预处理学习笔记数据预处理目的主要任务
数据预处理目的 保证数据的质量,包括确保数据的准确性、完整性和一致性 主要任务 数据清理 填写缺失的值、光滑噪声数据、识别或者删除离群的点,先解决这些脏数据,否者会影响挖掘结果的可信度 噪声数据:所测量数据的随机误差或者方差 数据集成 比如,将多个数据源上的数据合并,同一个概念的数据字段可能名字不同,导致不一致和冗余,这里需要处理 数据规约 将巨大的数据规模变小,又不损害数据的挖掘结果,比如在数学建模里通过SPSS来降维,包括维规约(主成分分析法)和数值规约(数据聚集或者是回归) 回归:用一个函数拟合数据
张俊怡
2018-04-24
1.8K0
数据挖掘引论篇学习笔记为什么进行数据挖掘可以挖掘什么样的数据可以挖掘什么类型的模式使用的技术面向什么类型的应用数据挖掘面临的问题
先从概念上了解数据挖掘 为什么进行数据挖掘 我们生活在大量数据日积月累的年代。分析这些数据是一种重要需求。 数据挖掘能把大型数据转化成知识 数据挖掘是信息数据的进化 可以挖掘什么样的数据 数据库数据 关系数据库是表的汇集,表中通常有大量关系数据 数据仓库数据 数据仓库是从一个或者多个数据源收集的信息存储库,存放在一致的模式下,并且通常驻留在单个站点 事务数据 事务数据库的一个记录代表一个事务,比如顾客的一次购物 其他类型数据 比如多媒体数据等等... 可以挖掘什么类型的模式 特征化与区分 数据特征化 目
张俊怡
2018-04-24
8050
数据挖掘之认识数据学习笔记相关术语熟悉
相关术语熟悉 首先认识数据的属性 属性是一个数据字段,表示数据对象的一个特征 标称属性 标称属性的值是一些符号或事物的名称,这一些值可以看做是枚举的 比如,职业,具有教师、农民、程序员等等 二元属性 二元属性是一种标称属性,只有两个类别或状态:0或1,0代表该属性不出现,1代表出现,二元属性也叫作布尔属性 二元属性有对称或者非对称一说 序数属性 值之间可能有有意义的序或者秩评定 数值属性 它是可度量的值,可以是区间标度或者比例标度 离散属性与连续属性 这个...好理解 数据的基本统计描述 中心趋势度量:
张俊怡
2018-04-24
1.3K0
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档