文章/答案/技术大牛

发布

社区首页 >问答首页 >DBSCAN输入解释

问DBSCAN输入解释
EN

Stack Overflow用户

提问于 2014-09-27 08:40:21

回答 2查看 1.7K关注 0票数 0

DBSCAN算法到底以什么作为输入？

为什么我在weka和编码算法中有不同的输出？

在一个编码算法中，它只需要2个输入，而在weka中它可能需要3个输入。

有人能帮我理解一下算法吗？

cluster-analysis

data-mining

dbscan

回答 2

Stack Overflow用户

发布于 2014-09-27 08:50:12

该算法在维基百科中得到了很好的描述。配置输入是：

eps：epsilon社区的最大距离。
minPts：形成区域所需的点数。

简单地说:如果数据点周围的epsilon邻域至少包含minPts，则创建一个新的集群。进一步投入：

数据集(显然)
(可能)一个距离函数，如果算法允许这方面的参数化

票数 1

Stack Overflow用户

发布于 2014-09-27 20:16:59

对于"2输入“，你指的是偶然的两个变量(维度)吗？

如果您的代码仅适用于二维，请阅读距离函数。大多数距离函数可以很容易地计算出二维以上的距离函数。例如，欧几里得距离定义为

sqrt(pow(x_i-y_i, 2).sum())

当你把i从1循环到n> 2的时候，效果也很好。

DBSCAN有两个明显的隐参数和一个隐参数: minPts和epsilon是明显的参数，隐藏参数是距离函数。这对结果的影响最大，需要数据的理解才能选择。不幸的是，没有选择这个参数的经验法则。这取决于你的数据。

如果您在Weka实现中得到了不同的结果，我并不感到惊讶。它包含隐式数据规范化，这往往会产生意想不到的结果.DBSCAN的最佳实现可以在埃尔基中找到。如果您启用数据索引，它会非常快。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/26072900

复制

相似问题

问DBSCAN输入解释
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问DBSCAN输入解释EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问DBSCAN输入解释
EN