文章/答案/技术大牛

发布

社区首页 >问答首页 >sci学习: KNeighborsClassifier -填充矩阵与类标签

问sci学习: KNeighborsClassifier -填充矩阵与类标签
EN

Stack Overflow用户

提问于 2018-10-09 11:43:50

回答 2查看 463关注 0票数 1

我试图得到与k近邻对应的类标签。在遍历文档 for KNeighborsClassifier时，()函数返回每个数据样本的类标签，而points ()函数返回总体矩阵中最近点的指数。

这是我的代码：

from sklearn.neighbors import KNeighborsClassifier
X_train = [[1.0,2.0], [2.0, 3.0], [4.0, 5.0], [6.0, 7.0]]
y_train = ['Hello', 'this', 'is', 'test']
neigh = KNeighborsClassifier(n_neighbors=2, n_jobs=8)
neigh.fit(x_train, y_train)    
X_test = [[3.0, 3.0]]


>>> neigh.predict(xtest)
array(['Hello'], dtype='<U5')
>>> neigh.kneighbors(xtest)
(array([[1. , 2.23606798]]), array([[1, 0]]))

我想得到k近邻类的标签，。填充矩阵与文档中指定的类标签之间的关系是什么？

knn

python

scikit-learn

回答 2

Stack Overflow用户

回答已采纳

发布于 2018-10-09 11:58:52

问题：

填充矩阵与文档中指定的类标签之间的关系是什么？

答案是，人口矩阵的元素和类标签之间存在一对一的对应关系。第一个标号对应于总体矩阵的第一个元素，第二个标签对应于第二个元素，等等。例如，您的示例中有以下关系：

[1.0, 2.0] <-> 'Hello'
[2.0, 3.0] <-> 'this'
[4.0, 5.0] <-> 'is'
[6.0, 7.0] <-> 'test'

因此，如果您想获得k个最近邻的类标签，可以使用kneighbors函数。函数从文档返回：

dist :表示指向点的长度的数组，只有在return_distance=True时才出现 ind :人口矩阵中最近点的数组指数。

这样做的目的是使用ind数组获取类标签，如下所示：

from sklearn.neighbors import KNeighborsClassifier

X_train = [[1.0, 2.0], [2.0, 3.0], [4.0, 5.0], [6.0, 7.0]]
y_train = ['Hello', 'this', 'is', 'test']
neigh = KNeighborsClassifier(n_neighbors=2, n_jobs=8)
neigh.fit(X_train, y_train)
X_test = [[3.0, 3.0]]

prediction = neigh.predict(X_test)
distances, indices = neigh.kneighbors(X_test)

print([y_train[i] for i in indices[0]])

输出

['this', 'Hello']

票数 1

Stack Overflow用户

发布于 2018-10-09 12:01:45

如果仔细观察，neigh.kneighbors(xtest)返回两个值。您获得的第一个数组是到两个最近邻居的距离列表。二是训练数据集中邻域的索引。

neigh.kneighbors(xtest)
(array([[1. , 2.23606798]]), array([[1, 0]]))

您只需从y_train获取这些索引的标签即可。

dist,indices = neigh.kneighbors(xtest)
for item in indices[0]:
  print y_train[item]

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/52720270

复制

相似问题

问sci学习: KNeighborsClassifier -填充矩阵与类标签
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问sci学习: KNeighborsClassifier -填充矩阵与类标签EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问sci学习: KNeighborsClassifier -填充矩阵与类标签
EN