腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
使用
其他
两个
分类
变量
作为
行
和
列
绘制
分类
变量
、
我正在尝试
绘制
贷款状态,
使用
row
作为
性别,column
作为
自雇人员。size=2.2,aspect=1.6)g.add_legend()错误为- TypeError:无法连接'str‘
和
’
浏览 5
提问于2017-07-21
得票数 0
1
回答
分离散点图并添加线条
、
、
、
我有一个包含分组数据集的数据框,每个组有12
行
和
2
列
,第三
列
是
分类
变量
。我试图用拟合线
绘制
3个不同的散点图(
作为
分类
变量
的函数),但到目前为止,我只能将所有数据点放在一个图中。
浏览 8
提问于2021-06-26
得票数 0
1
回答
可以将PCA应用于部分数据集吗?
、
、
、
、
我正在
使用
kaggle数据集,它有超过130个特征,包括116个
分类
和
14个连续特性。我
绘制
了14个连续
变量
的热图,发现它们大多与响应
变量
弱相关,但高度相关。我试图将PCA应用于数据的这一部分,并将它们
作为
列
与
分类
变量
结合在一起。这样做可以吗?或者我是否应该对
分类
变量
进行一次热编码/标签编码,并对整个数据集进行pca?
浏览 0
提问于2019-03-20
得票数 1
回答已采纳
1
回答
如何在sci-kit学习中找到LDA决策边界
我正在尝试用sci-kit learn LDA
分类
器
绘制
决策边界。谢谢!
浏览 0
提问于2013-03-15
得票数 2
1
回答
SAS程序框图
绘制
多个
变量
、
我试图
使用
boxplot来检验
分类
变量
和
多个数值
变量
之间的关系。我
使用
的是kaggle的乳腺癌数据集:https://www.kaggle.com/uciml/breast-cancer-wisconsin-data 数据有
列
'diagnosis‘
作为
分类
标准/因
变量
(
分类
),
其他
30
列
(全部为数字)<e
浏览 10
提问于2019-01-17
得票数 0
回答已采纳
2
回答
缺失值的确定与范畴值的处理
、
、
、
、
我有一个数据集(1000万
行
,55
列
),其中有许多缺失的值。我需要
使用
其他
不缺失的值来预测这些值,即用不属于NaN的东西替换它们。平均值
和
中位数不是解决办法。我试图对
其他
方法进行研究,但这些方法都不起作用,因为我有很多
分类
变量
。我还尝试
使用
一个热编码将
分类
变量
转换为整数,但我不确定这在我的情况下是否是一个解决方案,因为只有一个
分类
列
,我将得到600个新
列<
浏览 0
提问于2017-05-23
得票数 4
1
回答
在Python中创建虚拟对象的
分类
变量
、
、
我正在尝试从只包含0
和
1的三
列
中创建一个
分类
变量
。它们将完美地匹配在一起
作为
一个
分类
变量
-但是我找不到一个将它们合并为一个的代码:
作为
一个标记为“运动”的
分类
变量
。任何创建
分类
变量
的想法或
其他
方式都将不胜感激。 编辑:“移动”应该是一个包含三个
分类
变量
的对象
浏览 20
提问于2020-11-11
得票数 0
1
回答
朴素贝叶斯
分类
器
我正在研究一个朴素的贝叶斯
分类
器,并希望
使用
MATLAB对一些数据进行
分类
。在MATLAB中给出的费舍尔虹膜数据的例子中(详见),他们只考虑了前
两个
变量
(花瓣长度
和
宽度)。我想用更多的特征进行
分类
,比如花瓣长度
和
花瓣宽度。 在这个Fisher Iris示例的文档中提到,“您可以
使用
包含花冠测量的
两个
列
。”我想用3
列
或4
列
表示4个属性
和
2个类。我想
浏览 0
提问于2017-05-09
得票数 2
4
回答
不同类型目标
变量
的多目标
分类
、
、
我有一个包含100多
列
和
两个
目标
变量
的数据集:$target1$是
分类
的,即$0$或$1$,而$target2$是连续的,即范围为$0 \space到\space 100$的值。我尝试
使用
多输出
分类
从雪橇,
使用
随机森林
作为
一个集合,它是很好地预测连续目标
变量
,但不是
分类
目标
变量
。
浏览 0
提问于2018-02-09
得票数 5
1
回答
按数字汇总类别
变量
: gtsummary包
、
我需要关于如何
使用
gtsummary包编写R代码的帮助,以创建一个汇总表,其中几个
分类
变量
作为
行
,
列
的一侧( "by“
变量
)在我的例子中是一个数字
变量
,以年为单位。因此,本质上,我想通过患者的平均/中位年龄来总结几个患者的
分类
特征。例如,在这个包中,
使用
数据"trial",我希望在表的
行
轴上有
分类
变量
(标记、阶段、等级),而
浏览 57
提问于2020-04-21
得票数 0
回答已采纳
1
回答
使用
R中的一组betas进行预测
、
、
假设我
使用
MCMC
绘制
了Beta的后视图。对于每一
行
,我都有一组betas。是否可以将这行betas代码转换为R中的模型对象,这样我就可以
使用
predict()函数了?具体地说,一些betas是用于
分类
随机
变量
的,所以如果我想手动应用betas,这将是困难的。 我认为要手动完成这项工作,我必须将每个
分类
变量
转换为多
列
指示
变量
。
浏览 3
提问于2018-11-02
得票数 1
1
回答
给定的数据是如何在图形上
绘制
的
我来自编程背景,现在学习数据科学
和
算法背后的数学知识。我明白分隔点的飞机。但不明白这些分数最初是怎么得到的。请告诉我理解这件事的线索。
浏览 0
提问于2019-09-17
得票数 0
回答已采纳
2
回答
如何根据与
其他
列
中值匹配的
行
的值创建新
列
?
、
、
假设我有一个数据框架,其中有几个
分类
变量
和
一些
列
,它们是字符串值。我想创建一个新
列
,如果
分类
列
中的某些值匹配(或不匹配),则为每一
行
粘贴来自
其他
行
的字符串值。这是一个玩具的例子。data.frame("id" = c(1,2,3,2), "year" = c(2000,2000,2004,2004), "words" = c("a b",
浏览 0
提问于2018-09-22
得票数 1
回答已采纳
2
回答
利用可用的数据,忽略缺失的数据来构建
分类
器
、
、
、
我正在
使用
R平台中的randomForest包来构建一个二进制
分类
器。大约有30,000
行
,其中14,000
行
是正类,16,000
行
是负类。我有15个已知对
分类
很重要的
变量
。我有一些额外的
变量
(大约5个),它们有缺失的信息。这些
变量
的值为1或0。1表示存在某物,而0表示不知道它是否存在。众所周知,如果有1,这些
变量
将是
分类
最重要的
变量
(增加
分类
的可靠性,更有可能样
浏览 0
提问于2012-12-20
得票数 1
回答已采纳
1
回答
素食者::cca()是否将一个类别环境
变量
的每个可能值
作为
一个单独的因素处理?
、
我正在应用典型的对应分析数据,在一个大森林面积排列的48个样地中存在草本植物物种的数据集,其中每个样地的环境
变量
包括连续的(面积以上的树冠覆盖率)
和
分类
(微地形,可能的值为碗、坡度、脊
和
水平)
变量
。在
绘制
CCA时,我注意到
分类
变量
的所有可能值都是
绘制
的,而只
绘制
了单个连续
变量
的名称(下图)。这是否表明函数cca()将
分类
变量
的每个可能值
作为
不同的
浏览 4
提问于2022-05-18
得票数 1
1
回答
如何从dataframe中删除包含空值
和
分类
变量
的
行
?
、
我尝试从从Excel导入的数据帧中删除具有空值
和
分类
变量
的
行
。我已经尝试了许多
其他
函数
和
许多不同的方法,但我不能放弃它们,至少不是全部。 brea
浏览 2
提问于2020-03-31
得票数 0
0
回答
在构建决策树模型时处理
分类
特征
、
、
、
我
使用
H2O来构建
分类
模型,比如GBM、DRF
和
DL。我拥有的数据集包含一些
分类
列
,如果我想
使用
它们
作为
构建模型的功能,是否需要手动将它们转换为虚拟
变量
?我读到GBM可以在内部哑化
分类
变量
?
浏览 4
提问于2017-06-08
得票数 3
回答已采纳
1
回答
Keras -
使用
具有多个
分类
变量
的嵌入
、
如果我正确理解了嵌入矩阵的概念,它们的存在是为了提供一种比
使用
一种热编码更有效的方法来编码
分类
变量
。似乎如果你有多个
分类
变量
作为
Keras模型的输入,你需要为每个
分类
变量
使用
一个单独的嵌入矩阵。但是,我找不到
使用
Keras提供的embedding类对多个
分类
变量
使用
嵌入的方法。文档中的示例仅展示了当模型的输入是单个
分类
变量
时如何
浏览 5
提问于2020-01-25
得票数 3
2
回答
有目标
列
的XGBOOST有
分类
数据,特性也有
分类
数据。
、
、
我有一个巨大的数据集,在特性中包含
分类
列
,我的目标
变量
也是
分类
的。但是,由于所有的值都不是序数,我可以为特征、
分类
列
和
目标
变量
应用一个热编码吗? 谢谢
浏览 0
提问于2022-03-24
得票数 0
1
回答
如何在R中
绘制
多个范畴
变量
的平行坐标
、
、
、
、
在
使用
来自ggparcoord包的GGally
绘制
并行坐标图时,我遇到了一个困难。因为有
两个
分类
变量
,我想在可视化中显示的是下面的图像。我发现在ggparcoord中,groupColumn只允许对单个
变量
进行分组(颜色),当然我可以
使用
showPoints标记轴上的值,但我也需要根据
分类
变量
改变这些标记的形状。还有
其他
方案可以帮助我实现我的想法吗?
浏览 4
提问于2017-06-04
得票数 11
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Matlab建立SVM,KNN和朴素贝叶斯模型分类绘制ROC曲线
R语言朴素贝叶斯Naive Bayes分类Iris鸢尾花和HairEyeColor学生性别和眼睛头发颜色数据
SPSS分析技术:加权个案;让频数记录数据也能用SPSS做列联表分析
在R语言中实现Logistic逻辑回归
8个数据清洗Python代码,复制可用,最长11行
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券