使用dataframe列更改系数的级别

腾讯云

开发者社区

文档建议反馈控制台

首页

文章/答案/技术大牛

发布

3回答

、

如何使用数据框的列更改因子的级别？下面的示例是对原始数据集的简化，但显示了我试图实现的目标。<- df %>% arrange(desc(Y)) 使用ndf$X更改df$X (原始数据集)的顺序。df1 TUG 50003 WQD 30005 PRF 1000 请注意，问题不是按降序排列df，而是如何在levels

浏览 37提问于2020-10-23得票数 1

回答已采纳

2回答

我有一个3686行34列的数据帧。write.csv2(data, file = folder/data.csv2)保存这个data.frame，然后用read.csv2(folder/data.csv2)再次将它加载到R中时，它也有相同的行数(3686)；但是，当我用unique(data$Species)询问物种(因子)的数量时，环境中的数据表有708个级别，而我导入的数据表只显示了554个级别。str(imported_<em

浏览 0提问于2021-02-22得票数 1

1回答

从glm得到R中所有离散状态的系数

、、

我有一个dataframe，它有一个具有以下状态的离散列当我用glm拟合数据时模型$系数只返回9

浏览 4提问于2014-05-21得票数 0

1回答

更改dataframe列的级别在dataframe中更改值

、

x = x_value其结果是： x这样就改变了我最初创建的一行中x的值。当我为数据框架中的一个因素列分配级别时，这不是简单地定义元数据吗？如何维护原始值--在这个列中，赋值级别时只有一个值= "yes“的列？或者我应该创建空的

浏览 2提问于2020-02-07得票数 1

回答已采纳

1回答

在星火中，RDD和Dataframe有什么区别？

、、

嗨，我是相对较新的阿帕奇火花。我想了解RDD、dataframe和数据集之间的区别。感谢有人能解释RDD、dataframe和数据集之间的区别。

浏览 1提问于2019-08-20得票数 2

2回答

如何做多列from_tuples？

、、、

我了解如何使用pd.MultiIndex.from_tuples()来更改以下内容(A,a) 1(B,b) 3Caps Lower B a 2但是如何更改表单中的列元组？编辑：，我有一个元组列标题的原因是，当我将带有单一级别列的Da

浏览 3提问于2016-06-15得票数 15

回答已采纳

2回答

如何在python中追加循环

、、

我有190列的数据透视表要在我的脚本上循环，我有这个脚本：183 CORSEC_Mainstream Media_Negative Count ... 0.520 我想将189列附加到我的脚本中编辑：corr = p

浏览 2提问于2020-05-27得票数 0

1回答

如何有效地将大型DataFrame列作为值列表发送给函数

、、

我试图在DataFrame列上找到一个统计量(基尼系数)，其中我需要传递特定列的所有值才能计算统计量(基尼系数)。方法1：将聚合值发送到统

浏览 2提问于2016-12-31得票数 1

3回答

虚系数回归因子

、、、

假设我在稀疏矩阵上有一个经过训练的glmnet模型，多个预测器包含不同级别的因素(因此也包括不同数量的虚拟预测器)。~ catVar,df) coef(train, s="lambda.min") 转换虚拟系数/值或整体公式的最佳(最有效)方法是什么，就好像虚拟列不是稀疏格式(只是一列不

浏览 1提问于2015-09-10得票数 2

回答已采纳

2回答

如何改变数据帧的行-用一个值替换另一个值

下面是我的名为'b‘的示例数据帧Tom Yellow MedJane Blue Med简单的方法：b$winner[b$winner=='Tom'] = as.factor('Tom

浏览 0提问于2010-05-13得票数 2

回答已采纳

1回答

将因子列拆分为R中的多个列

、、、

我想将每个观察值的回归系数与实际变量相乘。在没有因子的情况下，我可以通过将变量矩阵元素乘以系数向量来实现这一点 v_coef <- as.matrix(vars) %*% as.matrix(coef) 然而，我面临的问题是，我的一个变量是一个因素因此，回归返回与虚拟变量关联的多个系数(每年一个系数，不包括一年)。因此，上面的代码行不再起作用，因为几个系数与变量矩阵中的同一列

浏览 21提问于2019-02-07得票数 0

回答已采纳

1回答

如何在Python中导入Excel文件列，并找到它们之间的相关系数？

、

我在Excel文件中有很多列的数字(例如，AAA、BBB、CCC、DDD和EEE)。我需要将这些列导入到Python中，并找出每2列之间的相关系数。仅显示相关系数在+0.5到+1和-0.5到-1之间的列。import pandas as pddf = pd.DataFrame(data) df.corr() ?

浏览 30提问于2020-04-02得票数 0

1回答

GLM输出故障

、

所以，我想在RStudio中运行一个重复测量GLM，我在done...for中有很大一部分...然而，并不是所有的日期都显示在我的输出中(缺少2015年12/1)。以下是输出的一部分以及我的模型代码，因此您可以理解我的意思： CH4f1 <- glm(GC_CH4.flux~River*Site*Date*Hum.Hol, data = Rdata_w.o_OL_DateDate9/1/2017 -38.4031 96.7184 -0.39

浏览 17提问于2020-05-30得票数 0

1回答

电火花函数理解-转换因子

、、

以下内容验证了dataframe是否具有所需的列要求将2.5的换算系数适用于F栏，即值2，换算系数2

浏览 6提问于2022-01-14得票数 0

回答已采纳

1回答

将矩阵转换为表格

、

我使用以下命令创建了Spearman相关值的矩阵 pd.DataFrame.corr 现在我正尝试将这个矩阵转换成一个包含X值、Y值和Spearman相关系数列的表。这样我就可以用最高的系数对它进行排名。谁能帮我把这个矩阵转换成3列的表？谢谢!

浏览 36提问于2021-04-16得票数 1

回答已采纳

1回答

将模型分数应用于星火DataFrame* - Python*

、、

我正在尝试使用PySpark将一个分数应用于星火PySpark。让我们假设我在Spark之外构建了一个简单的回归模型，并希望将模型中创建的系数值映射到DataFrame中的各个列，以创建一个新列，即每个不同源列的和乘以各个系数。我知道Spark中有许多用于建模的实用程序，但我想了解如何实现这种“蛮力”方法。我还知道DataFrames/RDD是不可变的，

浏览 4提问于2016-03-01得票数 1

回答已采纳

1回答

将dataframe列类型从整数更改为因数

、、、

我在R中的代码有以下一些琐碎的任务：(级别的顺序在绘图中很重要，所以这很可能必须通过这样的任务来完成)from rpy2 import robjects d = {'a': robjec

浏览 2提问于2013-10-30得票数 1

回答已采纳

1回答

使某一列反其自身

、

将变量相对于自身进行回归应该会给出1的斜率。b <- rnorm(100, 30,7) # only to create a

浏览 0提问于2019-09-18得票数 1

回答已采纳

1回答

指定未在分组熊猫中工作的数据

、、、

在使用熊猫的复杂链式方法中，其中一个步骤是将数据按列分组，然后计算一些指标。这是我想要实现的程序的一个简化例子。我在工作流程中有更多的任务，但一开始很不幸地失败了。import pandas as pd data = pd.DataFrame({'Group':['A','A','A','B','B','

浏览 12提问于2022-05-30得票数 0

回答已采纳

1回答

在逻辑回归中，R返回比预期更多的系数

、

我正在使用一个来自网站的数据集来检查逻辑回归。R返回变量"age“的三个系数，下面是数据集。年龄变量有四个级别：<25，25-29，30-39，40-49。第四和第五列是响应变量，对应于"No“(第四列)和"Yes”(第五列)。当我使用这个数据集执行逻辑回归时，我得到了年龄变量的更多系数。notUsing) ~ age + education + wa

浏览 8提问于2020-05-08得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云