腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
kevindroid
专栏作者
举报
40
文章
34473
阅读量
30
订阅数
订阅专栏
申请加入专栏
全部文章
编程算法
java
android
其他
存储
hashmap
二叉树
机器学习
c 语言
c++
node.js
xml
json
数据库
access
git
mapreduce
yarn
容器
缓存
hadoop
jvm
rpc
微信
安全
windows
nat
case
digits
equals
excel
hashset
input
integer
lowercase
matrix
numbers
palindrome
process
range
return
string
title
uppercase
函数
数学
搜索文章
搜索
搜索
关闭
mahout学习之聚类(1)——向量的引入与距离测度
编程算法
机器学习
access
聚类的基本概念 聚类就是将一个给定的文档集中的相似项目分成不同簇的过程,可以将簇看作一组簇内相似而簇间有别的项目的集合。 对文档集的聚类涉及以下三件事: 1. 一个算法:将文档集阻止到一起的算法 2. 相似性与不相似的概念 3. 停止的条件 聚类数据的表示 mahout将输入数据以向量的形式保存,在机器学习领域,向量指一个有序的数列,有多个维度,每个维度都有一个值。比如在二维空间,一个坐标就是一个向量。 将数据转换为向量 在mahout中,向量被实现为三个不同的类来针对不同的场景: 1.
用户1665735
2018-06-20
1.1K
0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
立即发文
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档