首页
学习
活动
专区
工具
TVP
发布

PPV课数据科学社区

专栏作者
2119
文章
2429919
阅读量
187
订阅数
【每日一课】SPSS数据挖掘方法概述(3)——聚类分析
PPV课大数据 课程名称 SPSS数据挖掘方法概述(3)——聚类分析 课程目的 学习SPSS中关联、决策树等方法的应用 课程详情 本SPSS培训课程比较实用,直接是关联、决策树等方法的实际操作讲解,没有特别理论的介绍,结合实际例子和具体手动操作来案例分析,讲解的蛮清晰、很有实用性。 视频内容
小莹莹
2018-04-25
9260
数据可视化分析工具大集合
俗话说“巧妇难为无米之炊”。数据时代,没有一款好的数据可视化分析工具,光有团队怎么行? 商场如战场,数据是把枪。亚马逊运用大数据为客户推荐商品信息,阿里用大数据成立了小微金融服务集团,而谷歌更是计划用大数据接管世界……不知不觉,数据已经成为我们生活中必不可少的利器。本文收集了各个平台各种行业的数据可视化分析工具,让你不仅大饱眼福,而且还可以让你事半功倍。 Excel Excel作为一个入门级工具,是快速分析数据的理想工具,也能创建供内部使用的数据图,但是Excel在颜色、线条和样式上课选择的范围有限,这也
小莹莹
2018-04-24
2.5K0
轻松看懂机器学习十大常用算法
来源:不会停的蜗牛 链接:http://www.jianshu.com/p/55a67c12d3e9 通过本篇文章大家可以对ML的常用算法形成常识性的认识。没有代码,没有复杂的理论推导,仅是图解,介绍这些算法是什么以及如何应用(例子主要是分类问题)。以后有机会再对单个算法做深入地解析。 今天的算法如下: 决策树 随机森林算法 逻辑回归 SVM 朴素贝叶斯 K最近邻算法 K均值算法 Adaboost 算法 神经网络 马尔可夫 1. 决策树 根据一些 feature 进行分类,每个节点提一个问题,通过判断,将
小莹莹
2018-04-24
6810
【学习】数据挖掘领域十大经典算法
数据挖掘 国际权威的学术组织ICDM,于06年12月年评选出的数据挖掘领域的十大经典算法: 1 C4.5 分类决策树算法 决策树构造方法其实就是每次选择一个好的特征以及分裂点作为当前节点的分类条件。
小莹莹
2018-04-23
7550
数据挖掘系列(6)决策树分类算法
 从这篇开始,我将介绍分类问题,主要介绍决策树算法、朴素贝叶斯、支持向量机、BP神经网络、懒惰学习算法、随机森林与自适应增强算法、分类模型选择和结果评价。总共7篇,欢迎关注和交流。   这篇先介绍分类问题的一些基本知识,然后主要讲述决策树算法的原理、实现,最后利用决策树算法做一个泰坦尼克号船员生存预测应用。 一、分类基本介绍   物以类聚,人以群分,分类问题只古以来就出现我们的生活中。分类是数据挖掘中一个重要的分支,在各方面都有着广泛的应用,如医学疾病判别、垃圾邮件过滤、垃圾短信拦截、客户分析等等。分类问题
小莹莹
2018-04-23
1.5K0
机器学习系列:(五)决策树——非线性回归与分类
决策树——非线性回归与分类 前面几章,我们介绍的模型都是广义线性模型,基本方法都是通过联接方程构建解释变量与若干响应变量的关联关系。我们用多元线性回归解决回归问题,逻辑回归解决分类问题。本章我们要讨论一种简单的非线性模型,用来解决回归与分类问题,称为决策树(decision tree)。首先,我们将用决策树做一个广告屏蔽器,可以将网页中的广告内容屏蔽掉。之后,我们介绍集成学习(lensemble learning)方法,通过将一系列学习方法集成使用,以取得更好的训练效果。 决策树简介 决策树就是做出一个树状
小莹莹
2018-04-23
1.7K0
机器学习系列:(四)从线性回归到逻辑回归---续篇
欢迎小伙伴们回来继续学习,本篇内容是连着上一篇 “机器学习系列:(四)从线性回归到逻辑回归”文章。 多类分类 现实中有很多问题不只是分成两类,许多问题都需要分成多个类,成为多类分类问题(Multi-class classification)。比如听到一首歌的样曲之后,可以将其归入某一种音乐风格。这类风格就有许多种。scikit-learn用one-vs.-all或one-vs.-the-rest方法实现多类分类,就是把多类中的每个类都作为二元分类处理。分类器预测样本不同类型,将具有最大置信水平的类型作为样本
小莹莹
2018-04-23
5660
【学习】趣味数据挖掘——借水浒传故事,释决策树思路
决策树(又称判定树,DecisionTree)是硕、博士生数据挖掘课程要点和难点,教学实践表明,这一章需要数学基础知识多,难得有趣。明知是难点,偏向难点行,再难也要“趣味”一番,从课程PPT中取了一些素材,把漫谈的焦点选在了水泊梁山。 天罡地煞之精彩出笼水浒传第71回“忠义堂石碣受天文,梁山泊英雄排座次”中,施耐庵有段精彩的描述: “….忠义堂上做醮至第七日,…三更,….只听得天上一声响,如裂帛相似,…卷出一块火来,….竟钻入正南地下去了。宋江随即叫人将铁锹锄头掘开泥土,…只见一个石碣,正面两侧面各有天
小莹莹
2018-04-20
6960
Come On!决策树算法!
机器学习在各个领域都有广泛的应用,特别在数据分析领域有着深远的影响。决策树是机器学习中最基础且应用最广泛的算法模型。本文介绍了机器学习的相关概念、常见的算法分类和决策树模型及应用。通过一个决策树案例,着重从特征选择、剪枝等方面描述决策树的构建,讨论并研究决策树模型评估准则。最后基于 R 语言和 SPSS 这两个工具,分别设计与实现了决策树模型的应用实例。 机器学习概念 机器学习 (Machine Learning) 是近 20 多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度
小莹莹
2018-04-20
9040
大数据可视化系列1: 可视化周期表
以上这张类似化学元素周期表的“可视化法周期表”,由www.visual-literacy.org开发。 它列出了100种讯息表达的可视化法。点击此处,您会看到完整表格,并且随着鼠标滑动,看到每种可视化
小莹莹
2018-04-20
7360
【学习】R语言与机器学习学习笔记(2)决策树算法
算法二:决策树算法 决策树定义 首先,我们来谈谈什么是决策树。我们还是以鸢尾花为例子来说明这个问题。 观察上图,我们判决鸢尾花的思考过程可以这么来描述:花瓣的长度小于2.4cm的是setosa(图中绿色的分类),长度大于1cm的呢?我们通过宽度来判别,宽度小于1.8cm的是versicolor(图中红色的分类),其余的就是virginica(图中黑色的分类) 我们用图形来形象的展示我们的思考过程便得到了这么一棵决策树: 这种从数据产生决
小莹莹
2018-04-19
8320
让我们像驯化小狗一样驯化算法
人类进化学家当中有一种理论,说的是小狗这种宠物是从野兽进化而来,因为只有那些获得了社会化智慧的犬科动物才能存活下来。几千年前狼群在人类聚集地的周围活动,逐渐开始熟悉了人类的意图和心情。换句话说,它们的大脑开始适应人类的大脑活动。随着时间的过去,它们的行为甚至是外观都变得不那么凶猛,更适应人类的情感,更具有共生性。这个时候,它们就变成了狗。 在这里用狗的进化做例子是因为,人类目前正在与另外一种我们之外的物种共生在一起,和犬科动物相比,它更加危险也更有威力:这就是算法。Facebook的内容是算法决定的,
小莹莹
2018-04-19
5290
决策树:使用SPSS分析银行拖欠货款用户的特征
前两文章,已经从理论上解释了构造决策树进行分类的做法。 下面将利用工具SPSS来实现决策树分类。 案例: 某银行收集了2064个银行货款客户的信息,并且标识出客户是否违约。现在银行想了解一下那些拖欠货款者的客户具体有哪些特征,并且想构建一个模型,用于评估新的货款者的拖欠货款风险的评估。 数据如下所示。 IBM SPSS Statistics工具是IBM推出的专业的用于数据分析和数据挖掘的工具,其中内置了大量的数据挖掘模型。决策树模型就在其中,点击菜单:分析à分类à树 打开决策配置界面。 第一步:
小莹莹
2018-04-19
1.1K0
神奇的数据挖掘
谈到BI,就会谈到数据挖掘(Data mining)。数据挖掘是指用某些方法和工具,对数据进行分析,发现隐藏规律并利的一种方法。下面我们将通过具体的例子来学习什么是数据挖掘。 案例“上大学分析”-体验
小莹莹
2018-04-18
7610
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档