首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

机器学习:基于网格聚类算法

STING算法两个参数: • 网格步长——确定空间网格划分 • 密度阈值——网格对象数量大于等于该阈值表示该网格为稠密网格 STING网格建立流程 1 .首先我们先划分一些层次...[1497412999075_3899_1497412999367.jpg] CLIQUE算法两个参数: • 网格步长——确定空间网格划分 • 密度阈值——网格对象数量大于等于该阈值表示该网格为稠密网格...如果数据某一k-1维空间中不密集,那么数据k维空间中也是不密集 3、 遍历所有网格,判断当前网格是否为“未处理”,若不是“未处理”状态,则处理下一个网格;若是“未处理”状态,则进行步骤4~8处理,...WaveCluster算法需要两个参数: • 网格步长——确定空间网格划分 • 密度阈值——网格对象数量大于等于该阈值表示该网格为稠密网格 WaveCluster算法流程...(3)发现任意形状类簇:许多聚类算法基于距离(欧式距离或曼哈顿距离)来量化对象之间相似度。基于这种方式,我们往往只能发现相似尺寸和密度球状类簇或者凸型类簇。

13.5K50

各种聚类算法介绍和比较「建议收藏」

具体如下: 1、算法处理能力:处理大数据集能力(即算法复杂度);处理数据噪声能力;处理任意形状,包括有间隙嵌套数据能力; 2、算法是否需要预设条件:是否需要预先知道聚类个数,是否需要用户给出领域知识...1.2算法流程 以下流程以自下向上为例。 1. 将每个对象看作一类,计算两两之间最小距离; 2. 将距离最小两个类合并成一个新类; 3. 重新计算新类与所有类之间距离; 4....重复2、3,直到所有点都被处理 DBSCAN聚类算法原理基本要点:确定半径eps值 ①DBSCAN算法需要选择一种距离度量,对于待聚类数据集中,任意两个之间距离,反映了点之间密度,说明了点与点是否能够聚到同一类中...4.2算法流程 这些算法用不同网格划分方法,将数据空间划分成为有限个单元(cell)网格结构,并对网格数据结构进行了不同处理,但核心步骤是相同: 1、 划分网格 2、 使用网格单元数据统计信息对数据进行压缩表达...这是一种非常特殊距离算法,它可以计算两个不同长度向量距离,也可以对两对向量中不同时间段数据做匹配。DTW主要用在时间序列部分场合里。

3.7K25
您找到你想要的搜索结果了吗?
是的
没有找到

【独家】一文读懂聚类算法

聚类基本概念 1.1 定义 聚类是数据挖掘中概念,就是按照某个特定标准(如距离)把一个数据集分割成不同类或簇,使得同一个簇数据对象相似性尽可能大,同时不在同一个簇中数据对象差异性也尽可能地大...1.4 衡量聚类算法优劣标准 处理大数据集能力; 处理任意形状,包括有间隙嵌套数据能力; 算法处理结果与数据输入顺序是否相关,也就是说算法是否独立于数据输入顺序; 处理数据噪声能力;...算法流程: 将每个对象看作一类,计算两两之间最小距离; 将距离最小两个类合并成一个新类; 重新计算新类与所有类之间距离; 重复1、2,直到所有类最后合并成一类。...输入层对应一个高维输入向量,输出层由一系列组织2维网格有序节点构成,输入节点与输出节点通过权重向量连接。学习过程中,找到与之距离最短输出层单元,即获胜单元,对其更新。...2.5 基于网格聚类算法 基于网格方法把对象空间量化为有限数目的单元,形成一个网格结构。所有的聚类操作都在这个网格结构(即量化空间)上进行。

1.9K80

【非监督学习 | 聚类】聚类算法类别大全 & 距离度量单位大全

其目标划分原则是组(内部)距离最小化,而组间(外部)距离最大化。商业上,聚类可以帮助市场分析人员从消费者数据库中区分出不同消费群体,并且概括出每一类消费者消费模式或消费习惯。...层次分析方法 BIRCH算法(平衡迭代规约和聚类),CURE算法(代表点聚类)和CHAMELEON算法(动态模型)。优点:可以自动发现任意形状和大小聚类,不需要预先指定聚类个数。...) 距离或相似度度量方法 数值型或类别型数据可选多种距离度量方法,如欧几里德距离、曼哈顿距离等优点:不需要预先指定数量,可用于发现任意形状簇...曼哈顿距离(Manhattan Distance) 曼哈顿距离衡量两个向量之间沿坐标轴距离二维空间中,曼哈顿距离等于两个点横坐标差绝对值加上纵坐标差绝对值。...二维空间中,切比雪夫距离等于两个点横坐标差最大绝对值和纵坐标差最大绝对值中较大值。优点:对异常值不敏感,适用于稀疏数据。缺点:不考虑维度之间相关性。

22810

【非监督学习 | 聚类】聚类算法类别大全 & 距离度量单位大全

其目标划分原则是组(内部)距离最小化,而组间(外部)距离最大化。商业上,聚类可以帮助市场分析人员从消费者数据库中区分出不同消费群体,并且概括出每一类消费者消费模式或消费习惯。...层次分析方法 BIRCH算法(平衡迭代规约和聚类),CURE算法(代表点聚类)和CHAMELEON算法(动态模型)。 优点:可以自动发现任意形状和大小聚类,不需要预先指定聚类个数。...层次聚类(Hierarchical Clustering) 距离或相似度度量方法 数值型或类别型数据 可选多种距离度量方法,如欧几里德距离、曼哈顿距离等 优点:不需要预先指定数量,可用于发现任意形状簇...曼哈顿距离(Manhattan Distance) 曼哈顿距离衡量两个向量之间沿坐标轴距离二维空间中,曼哈顿距离等于两个点横坐标差绝对值加上纵坐标差绝对值。...二维空间中,切比雪夫距离等于两个点横坐标差最大绝对值和纵坐标差最大绝对值中较大值。 优点:对异常值不敏感,适用于稀疏数据。缺点:不考虑维度之间相关性。

17910

【非监督学习 | 聚类】聚类算法类别大全 & 距离度量单位大全

其目标划分原则是组(内部)距离最小化,而组间(外部)距离最大化。商业上,聚类可以帮助市场分析人员从消费者数据库中区分出不同消费群体,并且概括出每一类消费者消费模式或消费习惯。...层次分析方法 BIRCH算法(平衡迭代规约和聚类),CURE算法(代表点聚类)和CHAMELEON算法(动态模型)。优点:可以自动发现任意形状和大小聚类,不需要预先指定聚类个数。...) 距离或相似度度量方法 数值型或类别型数据可选多种距离度量方法,如欧几里德距离、曼哈顿距离等优点:不需要预先指定数量,可用于发现任意形状簇...曼哈顿距离(Manhattan Distance) 曼哈顿距离衡量两个向量之间沿坐标轴距离二维空间中,曼哈顿距离等于两个点横坐标差绝对值加上纵坐标差绝对值。...二维空间中,切比雪夫距离等于两个点横坐标差最大绝对值和纵坐标差最大绝对值中较大值。优点:对异常值不敏感,适用于稀疏数据。缺点:不考虑维度之间相关性。

30910

IM里“附近的人”功能实现原理是什么?如何高效率地实现它?

具体在产品技术上实现原理,也很容易理解: 1)现在移动端(ios、android等),通过系统API很容易抓到用户当前位置(即经纬度数据); 2)根据第1步中经纬度数据,很容易计算出两个之间距离...)GEODIST:返回两个给定位置之间距离; 4)GEOHASH:返回一个或多个位置对象Geohash表示; 5)GEORADIUS:以给定经纬度为中心,返回目标集合中与中心距离不超过给定最大距离所有位置对象...范围单位:m | km | ft | mi --> 米 | 千米 | 英尺 | 英里 额外参数: - WITHDIST:返回位置对象同时,将位置对象与中心之间距离也一并返回。...两个参数选项,调用georadius时是否真的只查询了主实例,还是进行了只读封装。...实际搜索时,首先会根据搜索半径计算geohash网格等级(即右图中网格大小等级),并确定九宫格位置(即红色九宫格位置信息);再依次查找计算九宫格中点(蓝点和红点)与中心点距离,最终筛选出距离范围

1.8K00

算法】聚类算法

1 定义 聚类是数据挖掘中概念,就是按照某个特定标准(如距离)把一个数据集分割成不同类或簇,使得同一个簇数据对象相似性尽可能大,同时不在同一个簇中数据对象差异性也尽可能地大。...算法流程: 将每个对象看作一类,计算两两之间最小距离; 将距离最小两个类合并成一个新类; 重新计算新类与所有类之间距离; 重复1、2,直到所有类最后合并成一类。...输入层对应一个高维输入向量,输出层由一系列组织2维网格有序节点构成,输入节点与输出节点通过权重向量连接。学习过程中,找到与之距离最短输出层单元,即获胜单元,对其更新。...3.5 基于网格聚类算法 基于网格方法把对象空间量化为有限数目的单元,形成一个网格结构。所有的聚类操作都在这个网格结构(即量化空间)上进行。...COD (Clustering with Ob2structed Distance) 就是处理这类问题典型算法 , 其主要思想是用两点之间障碍距离取代了一般欧氏距离来计算其间最小距离

1.7K130

Redis 到底是怎么实现“附近的人”这个功能呢?

: 返回两个给定位置之间距离; GEOHASH: 返回一个或多个位置对象Geohash表示; GEORADIUS: 以给定经纬度为中心,返回目标集合中与中心距离不超过给定最大距离所有位置对象;...范围单位:m | km | ft | mi --> 米 | 千米 | 英尺 | 英里 额外参数: WITHDIST:返回位置对象同时,将位置对象与中心之间距离也一并返回。...两个参数选项,调用georadius时是否真的只查询了主实例,还是进行了只读封装。...实际搜索时,首先会根据搜索半径计算geohash网格等级(即右图中网格大小等级),并确定九宫格位置(即红色九宫格位置信息);再依次查找计算九宫格中点(蓝点和红点)与中心点距离,最终筛选出距离范围点...并可推算出Redis中GEORADIUS查找附近的人功能,时间复杂度为:O(N+log(M)),其中N为指定半径范围位置元素数量,而M则是被九宫格圈住计算距离元素数量。

1.1K10

集成聚类系列(一):基础聚类算法简介

聚类分析就是无监督学习下数据对象探索合适过程,探索过程中,簇与簇之间数据对象差异越来越明显,簇数据对象之间差异越来越小。...聚类算法相似度量 聚类最终目标就是已知无标签数据集上找到合适簇,将这些无标签数据合理划分到合适簇中。其中簇样本相似度很高,不同簇样本间相似度很低。...基于层次聚类算法通常会用平均距离,最大距离,最小距离作为衡量距离方法,算法如果使用最大距离来度量类与类距离时,称为最远邻聚类算法;当使用最小距离作为衡量类与类之间距离时,称为邻聚类算法。...如果一个点p邻域所包含密度可达对象点数目大于指定个数,则需要创建一个以点p为核心新类。...算法优点: 比传统kmeans聚类算法普适性更强,不仅可以用于凸数据,对于任意形状数据空间也能得到很好聚类。 算法缺点: 进行聚类之前需要设置具体应用尺度参数,通常需要一些经验。

1.5K50

Redis 到底是怎么实现“附近的人”这个功能

: 返回两个给定位置之间距离; GEOHASH: 返回一个或多个位置对象Geohash表示; GEORADIUS: 以给定经纬度为中心,返回目标集合中与中心距离不超过给定最大距离所有位置对象...范围单位:m | km | ft | mi --> 米 | 千米 | 英尺 | 英里 额外参数: - WITHDIST:返回位置对象同时,将位置对象与中心之间距离也一并返回。...两个参数选项,调用georadius时是否真的只查询了主实例,还是进行了只读封装。...实际搜索时,首先会根据搜索半径计算geohash网格等级(即右图中网格大小等级),并确定九宫格位置(即红色九宫格位置信息);再依次查找计算九宫格中点(蓝点和红点)与中心点距离,最终筛选出距离范围点...并可推算出Redis中GEORADIUS查找附近的人功能,时间复杂度为:O(N+log(M)) 其中N为指定半径范围位置元素数量,而M则是被九宫格圈住计算距离元素数量。

78020

Redis 到底是怎么实现“附近的人”这个功能

: 返回两个给定位置之间距离; GEOHASH: 返回一个或多个位置对象Geohash表示; GEORADIUS: 以给定经纬度为中心,返回目标集合中与中心距离不超过给定最大距离所有位置对象;...范围单位:m | km | ft | mi --> 米 | 千米 | 英尺 | 英里 额外参数: - WITHDIST:返回位置对象同时,将位置对象与中心之间距离也一并返回。...两个参数选项,调用georadius时是否真的只查询了主实例,还是进行了只读封装。...实际搜索时,首先会根据搜索半径计算geohash网格等级(即右图中网格大小等级),并确定九宫格位置(即红色九宫格位置信息);再依次查找计算九宫格中点(蓝点和红点)与中心点距离,最终筛选出距离范围点...并可推算出Redis中GEORADIUS查找附近的人功能,时间复杂度为:O(N+log(M)) 其中N为指定半径范围位置元素数量,而M则是被九宫格圈住计算距离元素数量。

89930

看用 Redis 如何实现微信「​附近的人」​功能?

: 返回两个给定位置之间距离; GEOHASH: 返回一个或多个位置对象Geohash表示; GEORADIUS: 以给定经纬度为中心,返回目标集合中与中心距离不超过给定最大距离所有位置对象;...范围单位:m | km | ft | mi --> 米 | 千米 | 英尺 | 英里 额外参数: - WITHDIST:返回位置对象同时,将位置对象与中心之间距离也一并返回。...两个参数选项,调用georadius时是否真的只查询了主实例,还是进行了只读封装。...实际搜索时,首先会根据搜索半径计算geohash网格等级(即右图中网格大小等级),并确定九宫格位置(即红色九宫格位置信息);再依次查找计算九宫格中点(蓝点和红点)与中心点距离,最终筛选出距离范围点...并可推算出Redis中GEORADIUS查找附近的人功能,时间复杂度为:O(N+log(M)) 其中N为指定半径范围位置元素数量,而M则是被九宫格圈住计算距离元素数量。

90150

利用 Redis 实现“附近的人”功能!

GEODIST:返回两个给定位置之间距离。 GEOHASH:返回一个或多个位置对象 GeoHASH 表示。...范围单位:m | km | ft | mi --> 米 | 千米 | 英尺 | 英里 额外参数: WITHDIST:返回位置对象同时,将位置对象与中心之间距离也一并返回。...调用 GEORADIUS 时是否真的只查询了主实例,还是进行了只读封装。感兴趣朋友可以自己研究下。...再依次查找计算九宫格中点(蓝点和红点)与中心点距离,最终筛选出距离范围点(红点)。 算法分析 为什么要用这种算法策略进行查询,或者说这种策略优势在哪,让我们以问答方式进行分析说明。...其中 N 为指定半径范围位置元素数量,而 M 则是被九宫格圈住计算距离元素数量。 结合 Redis 本身基于内存存储特性,实际使用过程中有非常高运行效率。

97620

Redis 是怎么实现 “附近的人”

: 返回两个给定位置之间距离; GEOHASH: 返回一个或多个位置对象Geohash表示; GEORADIUS: 以给定经纬度为中心,返回目标集合中与中心距离不超过给定最大距离所有位置对象...范围单位:m | km | ft | mi --> 米 | 千米 | 英尺 | 英里 额外参数: - WITHDIST:返回位置对象同时,将位置对象与中心之间距离也一并返回。...两个参数选项,调用georadius时是否真的只查询了主实例,还是进行了只读封装。...实际搜索时,首先会根据搜索半径计算geohash网格等级(即右图中网格大小等级),并确定九宫格位置(即红色九宫格位置信息);再依次查找计算九宫格中点(蓝点和红点)与中心点距离,最终筛选出距离范围点...并可推算出Redis中GEORADIUS查找附近的人功能,时间复杂度为:O(N+log(M)) 其中N为指定半径范围位置元素数量,而M则是被九宫格圈住计算距离元素数量。

1.4K10

用 Redis 查询 “附近的人” !妙啊!

: 返回两个给定位置之间距离; GEOHASH: 返回一个或多个位置对象Geohash表示; GEORADIUS: 以给定经纬度为中心,返回目标集合中与中心距离不超过给定最大距离所有位置对象;...范围单位:m | km | ft | mi --> 米 | 千米 | 英尺 | 英里 额外参数: WITHDIST:返回位置对象同时,将位置对象与中心之间距离也一并返回。...两个参数选项,调用georadius时是否真的只查询了主实例,还是进行了只读封装。...实际搜索时,首先会根据搜索半径计算geohash网格等级(即右图中网格大小等级),并确定九宫格位置(即红色九宫格位置信息);再依次查找计算九宫格中点(蓝点和红点)与中心点距离,最终筛选出距离范围点...其中N为九宫格范围位置元素数量(要算距离);M是指定层级格子数量,log(M)是跳表结构中找到每个格子首元素时间复杂度(这个过程一般会进行9次)。

22940

Redis 到底是怎么实现“附近的人”这个功能呢?

: 返回两个给定位置之间距离; GEOHASH: 返回一个或多个位置对象Geohash表示; GEORADIUS: 以给定经纬度为中心,返回目标集合中与中心距离不超过给定最大距离所有位置对象;...范围单位:m | km | ft | mi --> 米 | 千米 | 英尺 | 英里 额外参数: WITHDIST:返回位置对象同时,将位置对象与中心之间距离也一并返回。...两个参数选项,调用georadius时是否真的只查询了主实例,还是进行了只读封装。...实际搜索时,首先会根据搜索半径计算geohash网格等级(即右图中网格大小等级),并确定九宫格位置(即红色九宫格位置信息);再依次查找计算九宫格中点(蓝点和红点)与中心点距离,最终筛选出距离范围点...并可推算出Redis中GEORADIUS查找附近的人功能,时间复杂度为:O(N+log(M)),其中N为指定半径范围位置元素数量,而M则是被九宫格圈住计算距离元素数量。

1.9K10

揭开Redis“附近的人”神秘面纱

: 返回两个给定位置之间距离; GEOHASH: 返回一个或多个位置对象Geohash表示; GEORADIUS: 以给定经纬度为中心,返回目标集合中与中心距离不超过给定最大距离所有位置对象...范围单位:m | km | ft | mi --> 米 | 千米 | 英尺 | 英里 额外参数: - WITHDIST:返回位置对象同时,将位置对象与中心之间距离也一并返回。...两个参数选项,调用georadius时是否真的只查询了主实例,还是进行了只读封装。...实际搜索时,首先会根据搜索半径计算geohash网格等级(即右图中网格大小等级),并确定九宫格位置(即红色九宫格位置信息);再依次查找计算九宫格中点(蓝点和红点)与中心点距离,最终筛选出距离范围点...并可推算出Redis中GEORADIUS查找附近的人功能,时间复杂度为:O(N+log(M)) 其中N为指定半径范围位置元素数量,而M则是被九宫格圈住计算距离元素数量。

94220

Redis 实现「附近的人」

: 返回两个给定位置之间距离; GEOHASH: 返回一个或多个位置对象Geohash表示; GEORADIUS: 以给定经纬度为中心,返回目标集合中与中心距离不超过给定最大距离所有位置对象;...范围单位:m | km | ft | mi --> 米 | 千米 | 英尺 | 英里 额外参数: - WITHDIST:返回位置对象同时,将位置对象与中心之间距离也一并返回。...两个参数选项,调用georadius时是否真的只查询了主实例,还是进行了只读封装。...实际搜索时,首先会根据搜索半径计算geohash网格等级(即右图中网格大小等级),并确定九宫格位置(即红色九宫格位置信息);再依次查找计算九宫格中点(蓝点和红点)与中心点距离,最终筛选出距离范围点...其中N为九宫格范围位置元素数量(要算距离);M是指定层级格子数量,log(M)是跳表结构中找到每个格子首元素时间复杂度(这个过程一般会进行9次)。

70220

CGAL功能大纲

,以及检查点集是否是强凸函数。...此外,还描述了一些用于计算船体点特定极值点和子序列函数,如一组点上、下船体。 三维凸包3D Convex Hulls 这个包提供了计算三维凸壳函数,以及检查点集是否是强凸函数。...孔方向必须与外轮廓方向相反,任何轮廓之间不能有交集。一个孔不能在任何其他孔有界区域。...迭代单元四舍五入是单元四舍五入一种修改,其中每个顶点与任何非关联边之间距离至少为0.5像素。这个包支持这两种方法。...多维度三角剖分dD Triangulations 这个包提供了欧几里得空间中操作三角函数(纯单纯复合体)类,这些类维数可以在编译时或运行时指定

94710
领券