腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
不同
K
值
虹膜
模型
的
KNN
模型
的
统计
度量
?
、
、
、
我写了一些python代码来拟合著名
的
KNN
模型
的
虹膜
数据集,我尝试了
不同
的
k
值
,如
k
=2,
k
=3,
k
=5,据我所知,与这些
不同
的
k
值
,混淆矩阵,准确度得分和分类报告
值
应该是
不同
的
,然而,无论我给出
k
值
,
统计</e
浏览 11
提问于2020-02-09
得票数 1
2
回答
需要在
KNN
中进行交叉验证
、
我读到在
KNN
算法中我们需要交叉验证,因为我们从
KNN
的
训练测试中发现
的
K
值
可能无法对未见数据进行泛化。给出
的
逻辑是,在求
K
值
时使用测试数据集,因此
KNN
-算法具有测试数据集
的
信息,因为
K
是通过测试数据集发现
的
。这和看不见
的
数据不一样。但是是的,
K
值
是从测试数据集中找到
的
,因此我们得到了我们<
浏览 0
提问于2022-01-09
得票数 0
2
回答
如何改进
knn
模型
?
、
、
、
我建立了一个
knn
分类
模型
。不幸
的
是,我
的
模型
有超过80%
的
准确性,我想得到一个更好
的
结果。我能要些小费吗?也许我用了太多
的
预测器?我
的
数据= from sklearn.model_selection import train_test_split
k
浏览 10
提问于2022-12-03
得票数 -1
1
回答
用
KNN
模型
使用ROC曲线是否明智?如果是的话,为什么?
、
、
、
我是一个初学者做我
的
第一个ML项目。我正在对不平衡数据集进行二进制监督分类,并希望使用ROC曲线作为我
的
模型
的
性能
度量
。我使用Logistic回归、支持向量机和
K
近邻作为分类器。然而,当我预测
K
近邻
的
概率时,我不明白ROC曲线在哪里派上用场,因为阈值无论如何都不能变。那么,为什么还要为
K
最近
的
内格勃( Neigbors )实施ROC曲线呢?
浏览 0
提问于2022-12-15
得票数 2
回答已采纳
1
回答
无法在pandas数据帧中执行空
值
分析
、
、
我想在这里执行空
值
分析。在这里,我提到了数据集
的
前两行 Shop_name Bikes_avaiable Shop_location Average_price_of_bikesdtr,mtg,Harley Davidson Portland 6022$ 4.8 除了shop_name,每一列都有一些空
值
。早些时候,我使用了基于均值
的
估算和基于频率
的
估算来替换空
值
浏览 16
提问于2020-06-28
得票数 0
2
回答
如果在
KNN
模型
中不指定任何距离,如何计算n_neighbors参数?
、
、
如果我们不指定距离,n_neighbors是如何计算
的
?
浏览 0
提问于2021-07-12
得票数 1
2
回答
“r”‘s’s“看护”包中
的
列车测试分拆
、
我现在要做
的
是一个相当简单
的
机器学习工作流,即: 现在,我也知道我可以通过调用knnFit <- train() knnFit <- train(Species~., data=training, method="
knn
当然,我可以限制方法应该尝试
的</e
浏览 2
提问于2016-03-01
得票数 8
回答已采纳
1
回答
如何在
KNN
模型
中定义
k
的
最优
值
?
、
这是我在Rstudio中
的
脚本:library(ggplot2)library(scales)librarydb_test <- iris[-row_train,] table(db_train#qcStackCode#Species)model_
knn
<-train(Species ~ ., data = db_train, me
浏览 0
提问于2021-11-11
得票数 2
回答已采纳
2
回答
kNN
:培训、测试和验证
、
、
、
由于我可以提取50个特征,所以我正在考虑在这里找到最好
的
特征组合。训练集、验证集和测试集
的
划分如下:Validation set = 15%我在验证集上使用正向特征选择来找到最佳特征组合,最后使用测试集来检查总体准确性
浏览 1
提问于2012-05-30
得票数 7
1
回答
如何规划一个避免过度拟合
的
模型
分析?
、
来自
统计
学,我正在尝试学习机器学习。我读过很多关于ML
的
教程,但是没有真正
的
训练。 我正在做一个小项目,我
的
数据集有6
k
行和大约300个特性。正如我在教程中所读
的
,我将我
的
数据集分成一个训练样本(80%)和一个测试样本(20%),然后用交叉验证(5倍)对我
的
算法进行训练。当我重新运行我
的
程序两次(我只测试了
KNN
,我现在知道这是非常不合适
的
),我得到了真正
不同
的
结
浏览 0
提问于2019-03-14
得票数 4
回答已采纳
1
回答
在
KNN
中,为什么数据是
模型
?
、
、
在机器学习讲座幻灯片中,有人说没有针对
KNN
的
特定
模型
,其中数据是
KNN
的
模型
。然而,对于
KNN
,它被写入数据就是
模型
。这句话我不清楚,我
的
问题是为什么数据是
KNN
的
浏览 0
提问于2020-05-20
得票数 1
2
回答
用带数值
的
KNN
分类
给定
的
数据集由数值组成。困扰我
的
一件事是,我必须从所有的
KNN
,ANN,SVM。在执行
KNN
时,我遇到了一个问题,比如如果
K
是用户定义
的
,那么如何找到它
的
值
,我们必须从哪个
值
开始,以及何时停止它。如果有人回答我
的
问题,我会非常感谢
的
。
浏览 2
提问于2014-02-15
得票数 1
回答已采纳
1
回答
KNN
在插入符号中
的
自定义参数调整
、
、
我有一个
k
最近
的
近邻实现,允许我计算
k
的
多个
值
以及训练和测试数据
的
多个子集(例如,
K
折叠交叉验证中
的
所有折叠,AKA重采样
度量
)。我
的
实现也可以利用多个核心。据我所知,在使用trainControl时,我
浏览 4
提问于2013-11-04
得票数 2
回答已采纳
2
回答
网络有机器学习
模型
吗?
、
、
我正在研究一个回归问题,目标是估计整个交通网络
的
历史交通量。我在100个地点设置了交通计数器,因此一个
模型
可以了解交通量与一些解释变量(例如速度、道路特性、天气)之间
的
关系。之后,我可以应用该
模型
来估计在没有交通计数器
的
地方
的
历史交通量。 我
的
神经网络运行得相当好,但我想知道是否有机器学习
模型
可以明确地解释我
的
道路网络
的
拓扑结构,以及相邻道路上
的
交通是高度相关
的
。我可以添加“最近<
浏览 0
提问于2017-02-05
得票数 7
回答已采纳
1
回答
如何使用R在
K
近邻中找到
K
的
最佳
值
?
、
、
我
的
数据集包含5851个观测
值
,分为训练集(3511个观测
值
)和测试集(2340个观测
值
)。我现在想用
KNN
训练一个
模型
,有两个变量。我想做10倍
的
CV,重复5次,使用ROC
度量
和一个标准误差规则,并对变量进行预处理。代码如下所示。,我已经尝试了很多
不同
的
K
值
(例如,
K
= 10:20,30:40,50:60,150:160 +
不同
的</e
浏览 0
提问于2020-04-24
得票数 1
1
回答
根据插入符号R中
的
模型
选择tuneGrid
、
我尝试在
虹膜
数据集上应用ML,使用"
knn
“和"rpart”算法。这是我
的
密码:library(caret) tt_index <- createDataPartition(dataset$Sepal.Length0.9, list = FALSE)test_set <- dataset[-tt_index, ] models <- c("
浏览 0
提问于2020-06-21
得票数 1
回答已采纳
2
回答
回归
模型
的
不确定性估计
、
、
、
、
给出一个具有n个特征
的
回归
模型
,如何
度量
模型
对每个预测
的
不确定性或可信度?假设对于一个特定
的
预测,它
的
准确性是惊人
的
,但另一方面,它不是。我想找一个
度量
,让我决定,对于每一帧,我是否愿意“听”
模型
。
浏览 0
提问于2022-01-01
得票数 2
2
回答
在Python中将
KNN
从小型监督数据集应用到大型无监督数据集
、
、
我用Python在一个包含大约200个样本
的
小监督数据集上训练和测试了一个
KNN
模型
。我想将这些结果应用于一个包含数千个样本
的
更大
的
无监督数据集。我
的
问题是:有没有一种方法可以使用小
的
监督数据集来拟合
KNN
模型
,然后更改大
的
无监督数据集
的
K
值
?我不想通过使用较小数据集中
的
低
K
值
来过度拟合
模型
,
浏览 34
提问于2019-01-31
得票数 0
回答已采纳
2
回答
在哪种情况下,我们不应该放弃第一级
的
分类变量?
、
、
、
机器学习
的
初学者,我正在研究一热编码
的
概念. 与
统计
中
的
数据
不同
,当您总是想要删除第一个级别以拥有
k
-1假人(正如讨论过
的
在SE上),似乎有些
模型
需要保留它并拥有
k
假人。我知道拥有
k
级别可能会导致共线性问题,但我不知道有
k
-1级别会导致什么问题。但是,由于pandas.get_dummies()在默认情况下对false有它
的
drop_first参数,所以这在某些时候肯定是有用<em
浏览 0
提问于2019-03-19
得票数 7
1
回答
使用插入符号设置参数范围
、
我正在使用自适应方法来找到我
的
最佳
模型
参数。然而,我找不到一种方法来设置参数
的
最小
值
和最大
值
。 method = "
knn
", trControl =
浏览 0
提问于2018-09-04
得票数 2
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券