首页
学习
活动
专区
工具
TVP
发布

ml

专栏作者
664
文章
633582
阅读量
64
订阅数
数据挖掘之聚类算法K-Means总结
序   由于项目需要,需要对数据进行处理,故而又要滚回来看看paper,做点小功课,这篇文章只是简单的总结一下基础的Kmeans算法思想以及实现; 正文:     1.基础Kmeans算法.   Kmeans算法的属于基础的聚类算法,它的核心思想是: 从初始的数据点集合,不断纳入新的点,然后再从新计算集合的“中心”,再以改点为初始点重新纳入新的点到集合,在计算”中心”,依次往复,直到这些集合不再都不能再纳入新的数据为止. 图解:     假如我们在坐标轴中存在如下A,B,C,D,E一共五个点,然后我们初始化
Gxjun
2018-03-27
9560
数据挖掘之聚类算法Apriori总结
项目中有时候需要用到对数据进行关联分析,比如分析一个小商店中顾客购买习惯. 1 package com.data.algorithm; 2 3 import com.google.common.base.Splitter; 4 import com.google.common.collect.Lists; 5 import com.google.common.collect.Maps; 6 import org.slf4j.Logger; 7 import org.slf4j.
Gxjun
2018-03-27
9730
数据挖掘学习笔记--AdaBoost算法(一)
声明: 这篇笔记是自己对AdaBoost原理的一些理解,如果有错,还望指正,俯谢~ 背景: AdaBoost算法,这个算法思路简单. 正文: AdaBoost算法,是一种组合算法(通过多个弱分类器,组合成一个强分类器):   关于AdaBoost算法的流程,简单的描述,我们以A Short Introduction to Boosting中提到的用AdaBoosting进行二分类来描述一 下AdaBoost算法的具体流程:   1; 不妨假设给定要训练的数据包含下面三个信息data{weight,valu
Gxjun
2018-03-27
7390
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档