R将dataframe列中的NA值替换为其他行和同一列中的现有值_将列值替换为其他列中的值_将列和行中的值替换为dataframe中给定行索引 - 腾讯云开发者社区

r、function、dataframe

我使用以下代码用中值更新R中的dataframe中的列。这可以很好地工作，但我希望能够从程序的其他部分调用它作为函数，传递其他数据帧和列。 medianVal <- median(df$column, na.rm = T) df$column[is.na(df$column)] <- medianVal 我尝试使用的代码的逻辑是传递DataFrame和列，获取中间值，更新并返回数据帧 updateWithMedian <- function(DataFrame, Column) { medianValue <- median(Column, na.rm = T)

浏览 12提问于2020-04-16得票数 1

回答已采纳

1回答

rpy2处理R到Python中NA/缺失值的问题

r、python-2.7、rpy2

在使用rpy2包将保存在R中的dataframe转换为Python时，我遇到了一个问题。 import os os.environ['R_HOME'] = '/Library/Frameworks/R.framework/Resources' import rpy2.robjects as ro from rpy2.robjects import pandas2ri # define a trivial dataframe in R ro.r('n = c(1,2)') ro.r("b = c(NA,'def')

浏览 4提问于2017-02-14得票数 2

1回答

对重复项进行分组，允许NaN等于任何值

python-3.x、pandas、dataframe、duplicates、pandas-groupby

我想在基于多个列的DataFrame中聚合重复的行，但对“复制”的含义有一个非常规的定义。假设有一个包含两列的DataFrame：A和B In [45]: df = pd.DataFrame([[0, 0], [pd.NA, 0], [0, 1], [pd.NA, 1], [1, 1]], columns=['A', 'B']).convert_dtypes() In [63]: df Out[63]: A B 0 0 0 1 <NA> 0 2 0 1 3 <NA> 1 4 1

浏览 8提问于2020-03-21得票数 2

回答已采纳

2回答

R:循环遍历多个列并使用函数中的所有列？

在R中:我如何循环多个列并使用一个定制的函数，该函数接受来自每个列的参数并相应地修改这些列？例如，我有以下数据： > head(runTimeSep) hours h minutes min 1 70 min NA <NA> 2 21 min NA <NA> 3 106 min NA <NA> 4 75 min NA <NA> 5 14 min NA <NA> 6 82 min NA <NA> 7 1 h

浏览 3提问于2016-09-27得票数 0

回答已采纳

4回答

如何从数据帧中删除包含n*NA的行

r、filter、merge、rows、na

我有许多大约10列、大约200000行的大型数据集。并非所有列都包含每行的值，尽管至少有一列必须包含要显示的行的值，但我想为一行中允许多少个NA设置一个阈值。我的Dataframe看起来像这样： ID q r s t u v w x y z A 1 5 NA 3 8 9 NA 8 6 4 B 5 NA 4 6 1 9 7 4 9 3 C NA 9 4 NA 4 8 4 NA 5 NA D 2 2 6 8 4 NA 3 7 1 32 我希望能够删除包含2个以上单元格的行，这些单元格包含要获取的NA

浏览 0提问于2013-08-08得票数 9

2回答

如果列包含Pandas中的任何字符串值，则从dataframe中删除值。

python、pandas、dataframe

我希望从包含浮点dtype列字符串值的dataframe中删除行。例如，如果我有一个amount字段，我希望删除dataframe中的所有行，这些行在amount字段中包含一个值"NA“。到目前为止我已经试过以下几种方法- to_drop = ['NA'] data = data[~data['gross'].isin(to_drop)] 和 data = data[data.gross.str != 'NA'] 我得到了“一个只有字符串值的.str访问器，它在熊猫中使用np.object_ dtype”。正确的方法是什么？

浏览 5提问于2017-08-13得票数 2

回答已采纳

3回答

熊猫:找到特定列不是NA的行，但其他列都是

python、pandas

我有一个包含大量NA值的DataFrame。我想编写一个查询，它返回特定列不是NA但的行，所有其他列都是NA。我可以获得一个Dataframe，其中所有列值都不是NA： df[df.interesting_column.notna()] 但是，我想不出怎么说“从DataFrame返回的每一列中只有行不是'interesting_column‘是NA”。我不能使用.dropna，因为所有行和列都至少包含一个NA值。我意识到这可能是令人尴尬的简单。我尝试了许多.loc变体，加入/合并在不同的配置，我没有得到任何东西。在我对这件事做一个for循环之前，任何指针都会很感激。

浏览 0提问于2018-05-17得票数 10

回答已采纳

1回答

R:使用rnorm()忽略NAs

r、na

在R中，我试图根据dataframe中存在的列生成一列正态分布的随机值。由于我正在使用的列中有NAs，所以NAs将在新列中返回。，有什么办法我可以忽略这些NAs吗？我使用内置的“空气质量”数据集作为一个虚拟示例来说明我的问题，因为它包括NAs。示例代码： > airquality$random <- rnorm(n = nrow(airquality), mean = (50 + airquality$Ozone*1.2 + airquality$Solar.R*0.5 + airquality$Wind*3 + airquality$Temp*0.2), sd = 5) Wa

浏览 5提问于2022-02-21得票数 1

回答已采纳

1回答

如何在不删除列或行的情况下从dataset中清除或删除NA值

r、na

有什么优雅的解决方案可以在不删除NA所在的行或列的情况下从NA值中清除数据？示例：输入数据 C1 C2 C3 R1 A <NA> <NA> R2 <NA> A <NA> R3 <NA> <NA> A R4 B <NA> <NA> R5 <NA> B <NA> R6 <NA> <NA> <NA> R7 C <NA> B R8 C

浏览 0提问于2016-01-05得票数 0

回答已采纳

2回答

将data.frame中的值替换为下一列中的值

r、rscript

我有两个列的dataframe names duration 1 J 97 2 G NA 3 H 53 4 A 23 5 E NA 6 D NA 7 C 73 8 F NA 9 B 37 10 I 67 我想要做的是用来自同一行的names列的值替换工期列中的所有NA值。我怎么能做到这一点？

浏览 1提问于2016-08-22得票数 0

回答已采纳

2回答

R中时间序列的线性插值

r、time-series、linear-interpolation

我有一个数据集，每分钟测量一次体温，持续8个小时。我删除了异常数据，现在有了NA值，有时只有一个，有时超过10个。我想用线性插值来替换丢失的数据。我尝试了不同的方法，但我不能‘近似’工作(NA值仍然是NA…)或者甚至找到一种方法来指定为R以使用之前的值(相同的列，减1行)或之后的值(相同的列，+1行)。在本例中，我尝试仅替换一个NA，+1和-1仅读取为1，因此它不起作用 df$var1_lini <- ifelse (!is.na(df$var1),df$var1, ifelse (!is.na(df$var[+1]),df$var[-1]+(df$va

浏览 2提问于2018-02-01得票数 1

2回答

通过映射多个列创建两个新列

如何匹配R中的列并提取值。举个例子:我想用dataframe_two匹配dataframe_one的Name和City列，然后返回另外两个temp和ID列的输出，如果匹配，也应该返回TRUE和ID。我的输入是： dataframe_one Name City Sarah ON David BC John KN Diana AN Judy ON dataframe_two Name City ID Dave ON 1092 Diana AN 2314 Judy ON 1290 Ari KN 145

浏览 2提问于2019-11-26得票数 0

1回答

比较数据帧中类似的列，用NA替换差异

我试图编写一个函数，将两个数据帧中的因子列与相同的列名进行比较。函数无法返回正确的结果，对于z和zz字段，这应该是d2列c1和c2中的NA。该函数应该识别数据帧d2列c1和c2中的行，而不是数据帧d1列c1和c2中的行，将这些值替换为NA。 ` c1 <- c("A", "B", "C", "D", "E") c2 <- c("AA", "BB", "CC", "DD", "EE") d1 &l

浏览 3提问于2022-05-28得票数 1

回答已采纳

1回答

如何将dataframe中的句点值替换为null或其他值？

python、pandas、dataframe、replace

以下代码： print(PB_PID_group) print(type(PB_PID_group)) 给了我： PI . [., 5398, 5482, 5467] 1311 [5185, ., 5398, 5467, 5576] 1667 [., 6446] 3352 [.] 935 [.] Name: PID, dtype: object <class 'pandas.core.series.S

浏览 0提问于2016-12-26得票数 1

回答已采纳

3回答

R中的IFELSE返回错误值

r、if-statement

我有一个包含分类值的数据框架，这些值是手动输入的，并且有几个错误。有人清理了坏数据，我将其加载到R中，并将其与我的其余数据合并。到目前为止一切都很好。例如，假设这是"Value“列中原始数据(好数据和坏数据的混合)的数据，以及"Value_Clean”列中错误数据的更正。显然，这是一个很小的例子，但是我的实际数据帧有几十个不同值和几千行的更正。 test <- data.frame(ID = c(1, 2, 3) , Value = c("Discuss plan", "Discuss plan", "

浏览 1提问于2020-02-27得票数 2

回答已采纳

2回答

在我做了老鼠计算和保存我的结果之后，我如何保持丢失的值保持不变呢？

r、dataframe、imputation、r-mice

作为一个新的R用户，我很难理解为什么我的dataframe中的NA值不断变化。我在Kaggle上运行我的代码。也许这就是我的问题产生的原因？有多个列具有NA值，所以我决定尝试使用多个估算来处理na值。因此，我创建了一个新的dataframe，其中的列只有na值，并开始计算。 abc1 <- select(abc, c(9,10,15,16,17,18,19,25,26)) #mice imputation input_data = abc1 my_imp = mice(input_data, m=5, method="pmm", maxit=20) summa

浏览 15提问于2021-12-21得票数 0

2回答

如何在R中加速简单的变异命令

r、dplyr、processing-efficiency

我对R非常陌生，但我有一个相对简单的mutate命令，它运行在大型数据集(4,000,000+行x 150列)上，目前运行15+小时。该查询使用一个if语句，它只查看两个列--一个数值变量和一个日期(nb --有些日期是NA)，并返回一个二进制标志。对于一个很小的例子来说，效果很好，但是对于超过100万行的操作却显得非常低效。我使用Rv3.5，RStudio 1.2.1335和dplyr 0.8.0.1 ## create dummy dataframe df <- data.frame(diff = c(35,432,-278,6556,90,10,76,-24,6),

浏览 0提问于2019-09-05得票数 4

回答已采纳

3回答

如何在R中执行rowttest？

我有一个4列679行的数据帧，我需要使用genefilter包中的da函数rowttest执行测试。一个want列出前两列和另外两列。 A_R1 A_R2 B_R1 B_R2 1 2 7 7 4 5 8 7.5 5 5 9 NA 6 5 10 NA ... 我使用了这段代码，但我真的不确定"fac“是什么意思。我还以为是行数呢。 #t.test is the dataframe used ttest2=na.omit(ttest) ro

浏览 0提问于2013-02-27得票数 1

2回答

应用多个条件级别组

python、pandas、pandas-groupby

问题1: 我有一个数据框架，其中包含两个月值列，如month1和month2。如果month1列中的值不是NA，则将相应的amount值与month1列相加。如果month1列中的值是NA，那么选择相应的'month2‘值并在month1列中搜索它并执行sum。 import pandas as pd df = pd.DataFrame( { 'month1': [1, 2, 'NA', 1, 4, 'NA', 'NA'], 'month2': ['NA

浏览 1提问于2019-08-16得票数 1

回答已采纳

1回答

在R中最快地将char转换为可选的布尔值

r、dplyr

我正在使用dplyr对R进行一些数据处理。我要导入的数据是基于CSV的，并使用readr导入。我有很多列，"Y“代表TRUE，"N”代表FALSE，空代表NA。目前，我将它们作为因子引入，然后使用以下函数使用dplyr::mutate_at转换所有受影响的列： factor_to_logical_y_na_n <- function(x) { dplyr::case_when( x == "Y" ~ TRUE, is.na(x) ~ NA, TRUE ~ FALSE) } 不过，我怀疑有一种更有效的方法来实现这一点( 30

浏览 3提问于2018-09-07得票数 0

1回答

向dataframe添加列，跳过按行粘贴的步骤-

我对合并有问题。我有两个数据。数据1： structure(list(row = c(1, 2, 3, 1, 2, 3, 1, 2, 3, 1, 2, 3, 1, 2, 3), col = c(1, 1, 1, 2, 2, 2, 3, 3, 3, 4, 4, 4, 5, 5, 5), ltr = c("-", ".", ".", ".", ".", "Q", ".", "A", "R", "-", ".

浏览 1提问于2019-06-11得票数 1

回答已采纳

1回答

识别行中缺失值的可用性-R

我有这样一个缺少值的数据框架(Df)： df： head1 head2 head3 ----- ----- ----- 34 32 6 NA NA 45 45 NA 11 54 15 98 45 56 NA 3 1 78 NA 5 NA 我想返回这样一个列(Head4) head1 head2 head3 head4 ----- ----- ----- ----- 34 32 6 1

浏览 3提问于2016-03-24得票数 1

回答已采纳

2回答

通过匹配行和列将数据格式合并为数据格式

r、dataframe、join、merge、matching

最近我又开始使用R了。我有以下问题：我已经创建了一种基于列和行的数据have格式，其中我希望合并较小的数据格式。我希望保留大格式数据的尺寸，并插入较小数据的数据。我正在使用的表相当大，但我已经创建了一些示例数据。大型dataframe，它是一个空格式表： formattable <- data.frame("Agriculture" = c(NA,NA,NA,NA,NA,NA,NA,NA),"Mining" = c(NA,NA,NA,NA,NA,NA,NA,NA), "Industry" = c(NA,N

浏览 17提问于2022-07-22得票数 1

2回答

R编程基本插补

A有一个名为TideModel的DataFrame，它包含以下列和示例数据。基本上，它由每分钟的潮汐数据和每5分钟的大气压组成，我想在一个新的列中插入和输出每分钟的大气压，叫做AtmP new。平均9行似乎是前进的方向，但我不知道如何做到这一点。我已经尝试过approx和colMeans。 Time Tide AtmP 00:00 0.51 1010.75 00:01 0.52 NA 00:02 0.52 NA 00:03 0.52 NA 00:04 0.52 NA 00:05 0.52 NA 00:06

浏览 0提问于2019-07-04得票数 1

1回答

如何根据其他列的条件计算数据框中每6行的平均值？

r、dataframe、mean

我在R中有一个dataframe，包含3000行和2列(temp，flag)，如果flag列中的相应值不是NA，我会尝试计算" meantemp“作为每6行的第三列，所以如果flage值等于NA，我想在meantemp列NA value中显示。对于这个问题，很抱歉。

浏览 12提问于2021-01-11得票数 0

2回答

在R中，将具有相同列名的数据文件合并为分隔列

r、dataframe

我刚从R开始，这应该是一个基本的功能。我正在尝试合并两个数据格式("with.arthritis“和"withOUT.arthritis")。每个dataframe都有一行和两列(mean_weight和sd_weight)。目标是有一个有2行(旧表名)、2列(旧列名)的表。因为某种原因，我得到了3列。输入： Q3 <- merge(with.arthritis, withOUT, by="mean_weight", all=TRUE) rownames(Q3)<- c("with.arthritis", "with

浏览 6提问于2022-07-02得票数 0

1回答

只从多列获取值(非0，非NA)

r、dataframe、apply

这是我的数据的一个例子： df <- data.frame(Timing1 = c("Before", NA, 0, 0, 0, "Before"), Timing2 = c(NA, "During", 0, "During", 0, NA), Timing3 = c(0, NA, "After", "After", NA, 0)) 我想要创建一个名为Timing_combined的新列，它只从其他3列获取字符串(non-NA

浏览 1提问于2020-09-15得票数 1

回答已采纳

1回答

For-循环不使用r在矩阵中插值丢失的值。

r、for-loop、matrix、interpolation、na

我试图在一个矩阵中插值NA-值，其中包含具有坐标(x和y)的th前2列和具有随时间变化的值的24列。因此，我设置了for循环，它应该根据每行中至少两个值(不包括坐标)来插值每一行的NA值。所以我想我的问题是，我的for循环不会跳转到下一行，或者总是跳到第一个单元格？我在Windows 10上使用R版本1.2.1335和R-Version3.4.4 完整的矩阵可以达到行"layer.24“和列492528 x y layer.1 layer.2 layer.3 layer.4 [1,] 562201.9 5

浏览 0提问于2019-07-04得票数 2

回答已采纳

2回答

组合多个列以创建单个变量

r、multiple-columns、demographics

我使用的数据集记录了被调查者的种族。应答记录在多个变量之间，被调查者可以选择多个变量。示例： Black White Asian Hispanic 1 NA NA NA NA 1 NA NA NA NA NA 1 NA NA 1 1 在最后一行中，答辩人会选择亚裔和拉美裔。我想做的是： ( A)将这些列折叠成一个单一的种族变量，不同的代表不同种族的数字(即黑人为1，白人为2等等)。 ( B)使任何报告多列的人都被指定为“多列”。我有点R新手，所以任何帮助都会非常感谢！

浏览 2提问于2021-07-22得票数 1

回答已采纳

2回答

R编程:根据不同列中的数字值选择行

我寻找类似的问题，但找不到根据不同列中的数字值来选择行的答案。我有如下所示的数据集(总共包括24个研究/列和超过28.000行) header <- c("symbol", "gene1", "gene2", "gene3") study1 <- c("0.06", "0.01", "NA", "NA") study2 <- c("0.09", "NA", "0.02",

浏览 2提问于2016-01-12得票数 1

回答已采纳

2回答

R cor.test：“没有足够的有限观察”

r、dataframe、correlation

我目前正在尝试创建一个R函数，用于计算指定列与数据帧中所有数值列的corr.test相关性。下面是我的代码： #function returning only numeric columns only_num <- function(dataframe) { nums <- sapply(dataframe, is.numeric) dataframe[ , nums] } #function returning a one-variable function computing the cor.test correlation of the variable #with

浏览 1提问于2014-07-10得票数 7

1回答

通过对R和number ir中的两组中的列进行排序来排列数据框

我在R中有以下数据帧，我想排列和生成序列列 bay row tier flag 43 11 88 NA 43 11 90 NA 43 11 86 NA 43 9 88 NA 43 9 92 NA 13 4 88 89 13 4 90 NA 13 4 94 NA 11 4 88 89 11

浏览 3提问于2017-08-10得票数 2

回答已采纳

1回答

根据其他列中的值更改多个列的值，使用mutate()和with ()

r、dplyr

我希望将初始dataframe (df)的列a和b更改为dataframe df_new中的列。如果NAvar列是NA，我基本上只想将列a和b的值设置为"999“。这怎么可能与变异和跨越？ df <- data.frame(a =1:5, b = 6:10, NAvar = c(NA, 1, 12, 4, NA)) df %>% dplyr::filter(is.na(NAvar)) %>% select(colnames(df)) %>% mutate(across(c("a", "b"), EqualsT

浏览 12提问于2021-01-18得票数 1

回答已采纳

7回答

从很长的变量列表中记录

使用示例dataframe： df <- structure(list(KY27SCH1 = c(4, 4, 4, 4, NA, 5, 2, 4, 4, NA, 4, 5, 3, 5, 5), KY27SCH2 = c(5, 4, 4, 4, NA, 4, 1, 4, 4, NA, 4, 5, 4, 5, 5), KY27SCH3 = c(4, 4, 5, 4, NA, 4, 4, 4, 5, NA

浏览 7提问于2013-08-23得票数 3

回答已采纳

1回答

替换一行中前1%分位数的所有值

r、replace、quantile

我有一个数据帧，由395行和4973列组成，按月份排序。我的Dataframe测试看起来像这样： Date FirmA FirmB FirmC FirmD 01-2015 20 NA 100 1000 02-2015 21 502 2000 9378 03-2015 22 3 2 100 04-2015 24 7000 5 1000 我想用NA替换每行的前1%分位数。它看起来应该如下所示： Date FirmA FirmB FirmC FirmD 01-2015 20 NA 10

浏览 10提问于2017-02-24得票数 1

回答已采纳

1回答

获取数据帧中存在多个值的列的值。

如果我在R有这样的数据， 1 2 abc bh abd NA NA 2 3 abc NA NA NA NA 3 4 NA NA ad yu ae ................... 我希望在列1和列2中获得这些值，它们在列的其余部分中有多个值。例如，在这里，1 2有3个值，3 4也有3个值，2 3只有一个值，rest是NA。所以，我想要1 2和3 4。我怎么才能在R里做到呢？谢谢!

浏览 5提问于2014-10-04得票数 0

回答已采纳

2回答

R:删除行，但跳过NA

r、na

使用此代码，我假装删除了a列中包含单词"TRUE"的行。 DATA2 <- DATA[!DATA$a == "TRUE”] 但是，我有"TRUE"、"FALSE"和"NA"。当我运行这段代码时，R也会删除NA。我如何跳过这一步，只删除带有"TRUE“的行？我已经试过了，但是没有成功... DATA2 <- DATA[!DATA$a=='TRUE',na.rm= FALSE] 错误： Error in `[.data.frame`(DATA, !DATA$a == "TRUE&

浏览 8提问于2017-01-19得票数 1

回答已采纳

1回答

基于第一行值的熊猫DataFrame条件前向填充

python、pandas、conditional-statements、fillna、ffill

我有以下DataFrame： import pandas as pd df = pd.DataFrame({ 'col1':['A',pd.NA,pd.NA,pd.NA,pd.NA, 'B', pd.NA, pd.NA], 'col2':[9.5, 6,24,8, 30, 7, 6, 8], }) print(df) 给予： col1 col2 0 A 9.5 1 <NA> 6.0 2 <NA> 24.0 3 <NA> 8.0 4 &

浏览 3提问于2022-02-10得票数 2

回答已采纳

2回答

什么可以替代R中的嵌套循环？

r、nested-loops、lapply

我想通过运行给定两个变量output和y的多个场景，从R中的dataframe input创建dataframe input。列output是列value中存在xcol < x & ycol < y的所有值的总和。 input = xcol ycol value 1 5 4 2 6 9 3 7 8 4 9 7 5 14 8 和 output= x y results 2 5 0 2 10 4 2 15 35 ... 6 5 0 6 10 27 6 15 35 我的代码当前如下： for

浏览 6提问于2018-01-16得票数 0

回答已采纳

3回答

R:如何将重复的行连接到一个数据rows中

r、join、dataframe、duplicates

我有一个带有一些重复行的dataframe，我只想加入重复的行。举个例子如下： name b c d 1 yp 3 NA NA 2 yp 3 1 NA 3 IG NA 3 NA 4 OG 4 1 0 重复的行由同名行定义。因此，在本例中，行1和行2需要以某种方式连接，并将NA值替换为可能的数值。 name b c d 1 yp 3 1 NA 2 IG NA 3 NA 3 OG 4 1 0 假设:如果两行的名称相同，且它们的对应列不是NA

浏览 1提问于2015-11-23得票数 2

回答已采纳

1回答

Python为groupby创建的行分配新行名。

python、pandas

在我的数据集中，我使用groupby对各列的值进行求和，并将新的和值附加到原始数据帧，如下所示。 import pandas as pd data = {'Person':['A','B','C','D','E','F'], 'NY':[1, 1, 0, 3, 0, 0], 'LA':[0, 1, 1, 0, 1, 1], 'CHI':[2, 0, 1, 0, 0, 1], 'Gender

浏览 0提问于2020-05-27得票数 1

回答已采纳

1回答

比较两种数据，但不计算相关性

python、pandas

假设我有两个包含数百个cols和行的dataframe，我想根据相同的行和列(行和列)比较它们。例如, df1 = pd.DataFrame({ 'Place' : ['A', 'B', 'C','D'], 'Peter' : [4,5,1.2,7], 'John' : [1,0,3,5], }) df1_1 = df1.set_index('Place

浏览 1提问于2016-12-19得票数 0

回答已采纳

1回答

使用regex按行过滤pandas数据帧

python、regex、pandas、dataframe

我相信可能会有一个简单的解决方案，但我对Python还很陌生。我有一个包含字符串和NaN值的Pandas DataFrame。在这个Dataframe中，我想搜索字符串的特殊部分。这应该逐行完成，找到的字符串将被写入与数据帧相同行数的列表中(这意味着如果我正在查找的部分字符串不能在行中匹配，则列表中的条目应为'none')。我尝试过：result.loc[result[0].str.contains("hello", na=False)]，但这只返回了第一列包含单词hello的行…… 我正在考虑在每一行中使用正则表达式进行for循环搜索： row = df.i

浏览 2提问于2019-02-25得票数 0

2回答

如何根据上一行中的月份在行中增加一个月？

r、date、increment

我有一个dataframe，它有一个值列和“月份年”列。在第一行中，2018年8月是为月份年列编写的。在value列中有值的下列行是否有可能分别由下一个月自动填充？第二排是2018年9月，第三排是2018年10月，等等。实际结果： value month 645 Aug 2018 589 NA 465 NA 523 NA 632 NA 984 NA 预期成果： value month 645 Aug 2018 589 Sep 2018 465 Okt 2018 523 Nov 2018 632 Dez 2018 984

浏览 0提问于2019-01-04得票数 3

回答已采纳

2回答

用来自另一个表的数据连接和覆盖一个表中的数据

r、data.table、overwrite

如何连接和覆盖数据似乎是一个常见的请求，但我还没有找到一个适用于整个数据集的优雅解决方案。 (注意:为了简化数据，我将只对值和一小部分列使用1s和NAs，但实际上我有数百个具有不同值的列)。我有一个数据表(d1)，它在某些列和行中具有NA值。 library(data.table) d1 = fread( "r id v1 v2 v3 1 A 1 1 1 2 B 1 1 1 3 C 1 NA NA 4 D 1 1 NA 5 E 1 NA 1")[, r := NULL] 我还有另一个数据表(d2)，它包括其他列以及d1中现有列中缺少的数据点。

浏览 2提问于2017-10-15得票数 3

1回答

如何根据R中的多个条件定义一个新的数据框列？

r、dataframe

我在R中的数据框中有一些原始数据，我想要转换这些数据。基本上，我有一个很长的格式表，其中包含大约1000个观察值和4个变量，其中包括ID (个人身份)、问题编号(总共80多个)和答案，如图dataframe所示。在此格式中，每个人的问题都是重复的。 data <- data.frame( id = 1:10, Question = rep("Q1", 10), Answer = sample(5, 10, replace = TRUE) ) 我想创建一个仅基于选择的问题的新列，并根据答案的值为该列赋予不同的值。因此，例如，如果感兴趣的行的答案=

浏览 47提问于2021-05-11得票数 0

3回答

删除R中行中的后续值

r、row、repeat

我希望在dataframe的每一行中删除一个特定的重复值。让我们说： DF (3*5) # c1 c2 c3 c4 c5 1 A A B A NA 2 C C A A B 3 B A A NA NA 我想删除后续的A值。 so New_df: # c1 c2 c3 c4 c5 1 A B A NA NA 2 C C A B NA 3 B A NA NA NA 由于所有NA值，可以删除第5列(C5)。重点是只删除后续的'A‘值，其他后续值不应更改(例如，第二行有两个不应该删除的'C’)。我怎么才能在R里做到呢？

浏览 0提问于2018-04-18得票数 1

回答已采纳

2回答

如何将列转换为行？

python-3.x、pandas、numpy、dataframe、analytics

假设我有两行，其中大多数列的值是相同的，但不是所有列的值都相同。我想将这两行分组为一行，其中值相同，如果值不同，则创建一个额外的列，并将列名指定为“column1” 步骤1:这里假设我有在行'a'，'b'，'c‘中具有相同值的列，而具有不同值的列是'd'，'e'，'f’，因此我使用'a'，'b'，'c‘进行分组，然后对'd'，'e'，'f’进行拆分步骤2:然后我删除级别，然后将其重命名为'a'，'b'，

浏览 16提问于2019-08-20得票数 1

回答已采纳

1回答

当合并输出在R中同时创建"<NA>“和NA时，按NA设置

r、merge、dataframe、na

我将两个.csv文件导入到R中，既不包含任何空值或空值，也不包含任何"NA“字符串。 df1 <- read.csv("df1.csv") df2 <- read.csv("df2.csv") 它们看起来都有点像，同样的列名： > head(df1) Chrom Position Gene.Sym Target.ID Type Zygosity Genotype Ref 1 chr10 99219404 MMS19 MMS19_104345.9376 DEL Het TG/T TG 2 chr2 109411248 CCDC138 C

浏览 4提问于2014-04-24得票数 1

2回答

将R中的两个数据帧中的单个列合并，其中只有一些行匹配

我正在尝试将数据从一个数据帧中的一个列合并到另一个数据帧中的另一个列中，使用一个具有共享数据的列作为操作的关键。我已经尝试过关于如何在r中复制Excel的几个不同的教程，并且我尝试了这里提供的几种不同的合并方法(在stackoverflow...but上的答案中)，到目前为止，我没有尝试过做我想要做的事情，尽管它似乎是相当常见的函数。下面是我尝试do...to提供的一个非常简单的例子，假设这是dataframe1： ID RESULT 4 YES 1 YES 3 NO 2 YES 下面是dataframe2，其中的结果列完全由NAs

浏览 3提问于2015-02-10得票数 1

回答已采纳