如何更改R中foreach()中数据帧某些列的长度_清除列数据帧中的某些数据_如何在Pandas中更改MultiIndex数据帧列中某些行的值 - 腾讯云开发者社区

目前我在R中有两个列表，第一个列表有20个数据帧，每个数据帧有25列。第二个列表是20组25个字符，即列名。我想做的是让第一个数据框中的列名等于第二个列表中第一组字符的值，依此类推。任何见解都是非常感谢的！

浏览 3提问于2020-02-08得票数 1

回答已采纳

2回答

Spark Dataframes:如何更改Java/Scala中列的顺序？

java、scala、dataframe、spark-dataframe

在连接两个数据帧之后，我发现列的顺序改变了我的预期。例如:在b上连接具有列[b,c,d,e]和[a,b]的两个数据帧将产生[b,a,c,d,e]的列顺序。如何更改列的顺序(例如，[a,b,c,d,e])？我已经找到了在Python/R中做到这一点的方法，但没有找到Scala或Java。是否有任何方法允许交换或重新排序数据帧列？

浏览 1提问于2016-06-29得票数 4

1回答

如何在R中的for循环中分配列表

r、list、indexing

我正在试图找出为什么，在方法上，我下面的代码不起作用。 formatted_data是一个包含20个具有不同列的不同数据帧的列表。ff_demog_table是一个在formatted_data中格式化数据帧的函数。最后，formatted_tables应该是保存不同格式数据帧的列表。我想迭代formatted_data列表中的每个数据帧，然后遍历每个数据帧中的每一列。我似乎无法将formatted_tables直接赋值为[[i]][[j]]，但是如果我只使用formatted_tables[[i]]，它将显示最后一个格式化的列。例如，如果我试图运行下面的代码，下标就超出了范围。为什么？

浏览 3提问于2022-01-27得票数 2

回答已采纳

2回答

创建特定大小的pandas数据框

python、dataframe

在R中，我可以这样做： myvec <- seq(from = 5, to = 10)^2 mydf <- data.frame(matrix(data = myvec, ncol = 3,byrow = TRUE)) > mydf X1 X2 X3 1 25 36 49 2 64 81 100 请注意，我可以通过传入ncol参数来指定数据帧的形状。然后，我可以按行或按列(在本例中是按行)填充它。如果我用Python/Pandas复制这段代码，那么创建序列就足够简单了： myData = [x**2 for x in range(5,11) ] 然而，如何轻松地制

浏览 3提问于2017-08-03得票数 13

回答已采纳

2回答

搜索句子中的一个单词，并将其表示为新特征

我正在试着找出包含特定单词的句子(例如：高)，如果该词出现在数据帧的句子中，我想在该数据帧中添加另一列，表示1表示存在，0表示不存在。 Reviews: contains_awesome Today is an awesome day. 1 The book is good. 0 Awesome weather 1 我尝试了一个特别的评论，因为： grep("awesome", tolower(df$Reviews[1])) # returned output a

浏览 28提问于2020-01-05得票数 3

回答已采纳

1回答

在R中写入SAS XPORT文件，指定长度大于字符变量的最大实际值

r、sas

如何将R数据帧写入SAS xpt格式并指定每列的长度？例如，在一个文本变量列中，最长的字符串是157个字符，但是我希望字段长度属性有200个字符。包haven似乎没有这个选项，包SASxport的文档在这个问题上也不太清楚。

浏览 0提问于2018-01-22得票数 0

回答已采纳

5回答

如何将数据帧保存在由列分隔的txt或excel文件中

我有一个关于以txt或excel格式保存数据帧的问题。我在R中有一个数据帧，但是当我保存它时：首先，当我打开保存的数据帧(例如在Excel中)时，首先使用write.table()函数将所有列分组在一个列中，您必须分隔Excel中的列，这样就有丢失数据的风险。同样的情况发生在write.csv()函数中。在R中保存所有列分隔的数据帧是否正确。谢谢。

浏览 11提问于2013-08-29得票数 20

1回答

我可以使用R中的列表作为列数不相等的数据帧的代理吗？

list、r、data-structures

我对R中数据帧的理解是它必须是矩形的。不可能具有不相等列长度的数据帧。我可以使用R中的list%s来实现此目的吗？他这样做的利弊是什么？

浏览 1提问于2011-02-19得票数 1

回答已采纳

2回答

替换为字符串长度的NaN

python、pandas、dataframe、replace

我有一个包含多个字符串的列的数据帧。如果字符串长度小于8，如何检查每个单元格中的数据并将其全部删除？在示例中： df1 = pd.DataFrame([['123456789','0998733799','3245'], ['789793434','4','1221314234245']]) 如何删除“3245”和“4”，甚至替换为NaN？

浏览 14提问于2020-04-14得票数 1

回答已采纳

1回答

使用SparkR向Spark dataframes添加包含函数值的列

r、apache-spark、data-science、sparkr

我正在使用SparkR来处理一些在其技术堆栈中包含R和spark的项目。我必须使用从验证函数返回的布尔值创建新列。我可以使用spark数据帧和一个表达式轻松地完成这项工作： sdf1$result <- sdf1$value == sdf2$value 问题是当我必须比较两个不同长度的数据帧时。使用函数操作sdf1和sdf2数据帧并将值赋给sdf1的新列的最佳方式是什么？假设我想生成一个长度介于sdf1和sdf2之间的列。

浏览 3提问于2017-05-18得票数 0

2回答

将新列插入到数据帧中会给出'ValueError:值的长度(4)与索引的长度(6)不匹配‘

python、python-3.x、pandas、data-science

我用pandas库创建了一个数据帧。我想向dataframe中添加一列。然而，我得到了以下error.But，我想我必须输入与lines.How数量一样多的数据，我可以在我想要的行和列中输入信息吗？如果不输入数据，如何创建列？ import pandas as pd kd = pd.DataFrame(data) insertColumns = kd.insert(0, "Age", [21, 23, 24, 21],True ) print(kd) 错误： ValueError: Length of values (4) does not match length o

浏览 302提问于2020-10-10得票数 2

回答已采纳

1回答

如何在Python中使用SAS SWAT模块更改CASTable的数据类型

python-3.x、sas

我使用SWAT模块在Python中访问SAS数据。一个键列包含数据类型为"char“的类别。我有另一个数据帧，我导入为CASTable，如下所示： conn = swat.CAS(host, port, username, password) meta = conn.read_csv("file.csv") 元数据帧有一个类似的列，但它被导入为dtype："varchar“。当我尝试合并两个数据帧时，我得到一个错误，因为两个键列具有不同的数据类型(字符和变量字符)，但我无法弄清楚如何在CASTable中更改数据类型？我曾尝试通过添加dtype =

浏览 13提问于2021-02-16得票数 1

1回答

用中频条件逐帧乘数据帧

我正在对线性回归模型执行Box转换，但在R中实现这个转换有一些困难。我已经得到了Box-Cox的最优lambda值。我试图在R中执行以下操作 opt.lambda.test<- lapply(temp.list, function(x) with(x, x[which.max(y)])) 从Box-Cox中提取出最佳的lambda。temp.list是回归结果的列表。 opt.lambda.test [[1]] [1] 0.77 [[2]] [1] 3.46 然后我把它转化成一个向量： vec.lambda <- unlist(opt.lambda.test) 在本例中，我有一

浏览 1提问于2013-09-25得票数 2

回答已采纳

1回答

巨型以太网帧和超巨型帧的报头

networking、ethernet

可以将非常大的帧与一些以太网卡一起使用。一种情况是9k帧或巨型帧，另一种情况是超级巨型帧(据我所知，最高可达64k)。对于如此巨大的数据包，使用的帧格式是什么？据我所知，对于普通帧，有两种格式被广泛使用： Preamble Start_byte dest_mac src_mac Ethertype/length Payload CRC Interframe gap 10101010x7 10101011 6 bytes 6 bytes 2 bytes 46–1500 bytes 4 bytes 12 b

浏览 4提问于2011-10-28得票数 5

回答已采纳

1回答

是将我的工作区中所有数据文件的列重命名为R的一种方法

r、tidyverse、lapply、data-cleaning

我一直试图找到一种方法来重命名R中工作区中每个数据帧的所有列，它们只需要有相同的列名。下面的代码是两个数据帧(轿车和卡车)的示例，它们的列名为"1:10“。然而，我有那么多的数据帧，并想要自动做到这一点。 names(cars) <- c(1:10) names(trucks) <- c(1:10) 提前感谢！

浏览 4提问于2022-06-02得票数 0

回答已采纳

2回答

在数据框中应用log函数

r、function、vectorization、transformation、logarithm

我正在尝试通过应用对数转换来更改R中数据帧内的值。我的dataframe只由数值组成。当我应用此函数时 logFunct <- function(x) log10(x) dim(data.frame(logFunct(df)) 一切运行正常(即20列和20行的数据帧将作为20列和20行的新数据帧返回)。然而，当我试图用这个函数来说明零值时(我知道，它可能是一个丑陋的函数)： log4Zero <- function(x) ifelse(x!=0, log10(x+0.00000000001), log10(1)) dim(data.frame(log4Zero(df)) 我得到

浏览 0提问于2017-12-19得票数 2

4回答

删除数据文件中所有数据点中的额外字符

python、pandas、performance、dataframe

我有一个dataframe，它在每个字段中都有字段名： index name ngram field slop 0 index=1 name=unknown ngram=00 field=body slop=0 1 index=2 name=unknown ngram=01 field=body slop=0 2 index=3 name=unknown ngram=02 field=body slop=0 我希望删除数据帧中所有数据点上的额外字段名。其结果应该是： i

浏览 1提问于2018-10-18得票数 3

回答已采纳

1回答

R-使用名称创建多个数据帧。

我要创建100个带有名称的空数据帧 df1，df2，…，df100。每个数据帧将有2列我的数据框架dfi有列的名称为“一”和“十一”。例如，df5的列名将是y5和x5。第一列将是chracter，第二列将是数字。如何使用R创建这样的数据帧，我将非常乐意为您提供帮助。非常感谢。

浏览 2提问于2015-03-30得票数 1

回答已采纳

3回答

按组划分的观察值编号

r、sas

在R中，我有一个由几个值描述的观测值的数据帧，其中一个是因子。我已经按该因子对数据集进行了排序，并希望添加一个列，在该列中我将获得该因子的每个级别上的许多观察值。 factor obsnum a 1 a 2 a 3 b 1 b 2 b 3 b 4 c 1 c 2 ... 在SAS中，我是这样做的： data logs.full; set logs.full; count + 1; by cookie; if first.cookie

浏览 1提问于2011-11-21得票数 7

回答已采纳

1回答

如何在server 2008中的表的所有列中允许null？

sql-server-2008、sql-server-2008-r2

我有一个空表，其中所有列都设置为“NULL”。我希望在不重新创建表的情况下将其设置为允许NULL。我该怎么做？我正在使用server 2008 r2和management。编辑--我想将所有列设置为允许null，而不必知道列的数据类型。也就是说，将all设置为null，同时保持数据类型与前面相同。

浏览 0提问于2013-03-15得票数 0

回答已采纳

1回答

R数据帧中的最大值长度

r、db2、rodbc

我试图使用R中的RODBC包(myQuery<-sqlQuery(通道，paste0(“.”))对一个paste0数据库做一个简单的查询其中一列是长度为3000的Varchar。生成的数据框架显示该列中应有文本的"NA“。将其导出到csv也只显示"NA“。Access中的查询显示一个奇怪的字符编码(只在单击单元格之后)。R数据帧中的值是最大长度，还是可以使用RODBC提取的字段的最大长度？还是字段的编码导致了"NA“的出现？

浏览 3提问于2016-03-14得票数 1

回答已采纳

1回答

读取和绑定不同数量的文件

r、loops

我必须编写一个R脚本，在其中我想在不同的时间加载不同数量的文件。将文件加载到数据帧中，并提取数据帧的某些列。然后将这些列与cbind函数合并。我的问题是，我不知道如何适应不时加载的不同数量的文件，因为一次cbind可能有3个向量，另一次可能有5个向量。那么，我如何给cbind一些向量，使它在没有得到所有向量的情况下不会输出错误呢？当我给它一个固定的数字时，就会发生这种情况。 raw1 <- read.table() raw2 <- read.table() vec1 <- raw1[,2] vec2 <- raw2[,2] cbind(vec1,vec2,vec3) 我

浏览 2提问于2014-10-24得票数 0

回答已采纳

1回答

R-根据数据帧名称中的模式组合多个数据帧

r、dplyr、zip

我想在全局环境中根据数据帧名称中的模式组合数据帧，同时添加原始文件的名称。我的问题是，我最初有一个zip文件，在主文件夹和子文件夹中有20多个文本文件，主要观察两个不同的场景："test“和"train”。因此，我决定首先将所有的txt文件读取到R中，创建具有"test“或"train”模式的两个不同的df名称列表，并使用这些列表将数据帧合并为两个主要数据帧。现在，我需要根据列表中的名称组合这些数据帧，但rbind只是创建了它们的名称的另一个列表-如何让rbind将输入视为名称列表中的对象，而不是字符串？此外，rbind会在没有机会添加列名称的变量的情况下

浏览 9提问于2020-09-21得票数 2

回答已采纳

1回答

在使用聚集函数tidyverse之后，无法创建新的变量。

r、dplyr、tidyr、tidyverse

大家好，这就是我所面临的麻烦。我有一个数据帧，它的格式是错误的。就像这样。id | 1/3/2017| 1/4/2017 | a | 4 | 4 | b | 5 | 5 | c | 6 | 6 | d | 7 | 7 | 显然，我想要像这样整洁的格式，并添加一个包含00:00:00小时id | date | hour |data| a | 1/3/2017 |00:00:00 |4 | b | 1/3/2017 |00:00:00 |5 |

浏览 3提问于2017-08-18得票数 1

5回答

具有包含R中矩阵的列的data.frame

r、dataframe

我正在尝试将一些矩阵放入R中的数据帧中，如下所示： m <- matrix(c(1,2,3,4), nrow=2, ncol=2) df <- data.frame(id=1, mat=m) 但是当我这样做时，我得到的是2行3列的数据帧，而不是1行2列的数据帧。阅读文档时，我必须使用I()转义我的矩阵。 df <- data.frame(id=1, mat=I(m)) str(df) 'data.frame': 2 obs. of 2 variables: $ id : num 1 1 $ mat: AsIs [1:2, 1:2] 1 2 3

浏览 0提问于2011-05-27得票数 5

回答已采纳

1回答

如何在使用Spark Java向Kafka Producer写入Spark Dataframe时控制记录数

dataframe、apache-spark、apache-kafka、spark-streaming、kafka-producer-api

我有一个包含两列的spark数据帧，'keyCol‘列和'valCol’列。数据帧的大小非常巨大，接近1亿行。我想以小批量的方式向kafka主题写入/产生数据帧，即每分钟10000条记录。此spark作业将每天运行一次，从而创建此数据帧如何在下面的代码中实现每分钟10000条记录的小批量写入，或者请建议是否有更好/更有效的方法来实现这一点。 spark_df.foreachPartition(partitions ->{ Producer<String, String> producer= new KafkaProducer<

浏览 10提问于2020-04-27得票数 1

1回答

数据帧操作

r、dataframe、swap

我有以下名为stations 的数据帧。我还有<-1147 141 8和to<-147 141 8 17的两个向量。正如您在数据框中看到的那样，"from“和"to”列与向量不匹配。这会导致路线的经度和纬度列向后。例如，它不是从旧金山到波特兰，而是从波特兰到旧金山。为了解决这个问题，我必须颠倒与我的向量不匹配的数据框列的顺序。因此，我的数据帧应该从125行开始，然后转到116行，以便纠正路由。这将需要对数据帧中" from“和" to”列与from和to向量不匹配的所有列执行此操作。如果这不是最好的解释，我很抱歉，但这是一个很难解释的话题。编辑:这

浏览 0提问于2020-04-23得票数 0

1回答

如何在数据帧对象上实现

r、lapply

我对R非常陌生，尤其是对R apply族函数。我有一个数据框架： df <- data.frame(a=c(1,2,3),b=c(3,4,5)) 并尝试： lapply(df$a,sum) 但这并没有给出数据帧df的第一列之和。但是，这一行代码可以： lapply(df,sum) 我在这里做错什么了吗？

浏览 1提问于2020-05-28得票数 1

回答已采纳

2回答

dplyr: How to slice row1 of group1，row2 of group2，row3 of group3，…groupN的rowN

r、dplyr、slice

这个问题的灵感来自于这个问题：如何在尝试保留两列中的非重复值时对R中的数据框进行条件过滤我们如何在后续的组(1,2,3,4...n)中对相应的行(1，2，3，4...n)进行切片。在这个简化的示例中，第一个数据帧应该导致第二个数据帧： library(tidyverse) # tibble df <- tibble( group = c(1, 1, 1, 1, 2, 2, 2, 2, 2, 3, 3, 3, 3, 4, 4, 4, 4, 5, 5, 5, 5, 5), value = c(1, 2, 3, 4, 1, 2, 3, 4, 5, 1, 2, 3, 4, 1, 2

浏览 36提问于2021-03-02得票数 1

回答已采纳

2回答

根据R中表的列数筛选列表

r、dplyr、tidyverse

我有一个这样的数据帧列表：我想知道如何保留15列的数据帧，并在R中删除列表中的其他数据帧。

浏览 3提问于2021-10-03得票数 2

回答已采纳

7回答

如何在熊猫中填写重复数据的行？

python、pandas、dataframe

在R中，当向数据帧中添加不等长度的新数据时，值重复以填充数据帧： df <- data.frame(first=c(1,2,3,4,5,6)) df$second <- c(1,2,3) 屈服： first second 1 1 1 2 2 2 3 3 3 4 4 1 5 5 2 6 6 3 然而，熊猫需要相同的指数长度。我如何像在R中那样在熊猫中“填写”重复数据？

浏览 4提问于2014-01-11得票数 13

回答已采纳

1回答

在多列中搜索多个值

对于R来说，非常新的数据帧(即为了避免使用循环来提高效率)有很多列。我希望扫描多个列(ex SS1:ss1 15)，以寻找字符向量(ex c(‘9515’，‘8231’))。如果其中任何一个是true/match，我将尝试在数据框架中获得一个值为1的新列，如果该行中有值1，则为true，如果没有，则为0。我被困在如何开始做这件事上.

浏览 5提问于2017-11-14得票数 1

回答已采纳

2回答

如何在r中合并excel工作簿的多个工作表？

r、excel、dataframe、merge、google-sheets

假设我有一个名为report.xlsx的excel文件。这个文件有10个工作表，通过Sheet10方便地命名为Sheet1。在每张工作表上，第14行有列标题:序列号、RegistryNr、姓氏、FirstName、(空)、FatherName、MotherName、性别、(空)、道布。如何将每个工作表合并为一个数据集？我知道使用excel_sheets("report.xlsx")可以将所有的工作表名称放入一个向量中。我知道使用df <- read_excel("report.xlsx", 1, skip = 14)，我可以将一张表的所有数据放入数据帧

浏览 0提问于2016-11-11得票数 1

1回答

对数据包/帧的散列部分进行散列以识别重复的数据包

monitoring、packet-analysis

考虑一个应用程序(主要是TCP/UDP，但不是严格意义上的TCP/UDP)，其中数据包大小不同，而且可能很长。用例/问题陈述是为了识别在网络中的多个点收集的重复帧。(这意味着如果我们从路由器X收集一个帧，从路由器Y收集一个帧，我们如何以很高的概率确定这些帧是否是同一帧).进一步假设我们可以相对便宜地在帧的第一个NNN字节上创建一个(好的)散列。在我看来，我认为散列可以在前100到200个字节附近的某个地方生成。这当然足以获得{L2、IP、TCP\UDP}报头以及最常见的应用程序协议，其中这些报头直接位于L4报头(HTTP、VOIP、流视频等)之后。只要我们能得到头和至少一点点的有效载荷“数据”

浏览 0提问于2015-04-14得票数 2

1回答

在R中，如何使foreach循环中生成的每个数据帧在全局环境中可用

r、foreach、global、environment

在R中，如何使foreach循环中生成的每个数据帧在全局环境中作为单独的数据帧可用我只能将它们保存到一个列表(x)中，但该列表有3层；有超过40,000个数据帧，解包非常耗时。 x <- foreach(q=1:countq, .export = ls(globalenv())) %do% { foreach(p=1:countp, .export = ls(globalenv())) %do% { foreach(o=1:countero, .export = ls(globalenv())) %dopar% { n<

浏览 10提问于2019-07-10得票数 1

1回答

向dataframe中添加一个新列，其中的每一行都根据它所来自的dataframe的标题采用不同的值

python、pandas

因此，我有一个多个数据帧的列表，并将它们连接在一个大的数据帧中。现在，我想要向最后一个大型数据帧添加一列，但我希望该列的值根据每行首先所属的数据帧的名称而改变。这是一个示例： list_of_df = [march_01, march_02, march_03] big_df = pd.concat([march_01, march_02, march_03], ignore_index=True) big_df['new_column'] = # i want this column to adopt the value '01' for those ro

浏览 26提问于2021-03-17得票数 1

2回答

Oracle SQL Loader:数据文件中的填充字段超过最大长度

oracle、sql-loader

我需要通过SQL Loader将大量数据加载到Oracle数据库。操作系统: RHEL 甲骨文: 12c 这是我的控制文件： OPTIONS(SKIP=1) LOAD DATA CHARACTERSET UTF8 INFILE 'temp.dat' "STR '\",\"'" BADFILE 'bad.dat' TRUNCATE INTO TABLE MY_TABLE FIELDS TERMINATED BY ";" ( PERSONNEL_NO CHAR, emp_name_f_r

浏览 1提问于2019-12-30得票数 0

回答已采纳

3回答

将列的值拆分为不同的列

r、dataframe、split、multiple-columns

我在一个R数据帧中有一个变量，用这种格式，都有一个混合格式： 98 (56:78) 34 (45:67) 45 67 (34:98) 我希望将该列划分为3个值，并将每个值放入数据框架的新列中。 98 56 78 34 45 67 45 NA NA 67 34 98 我怎么能这么做？非常感谢!

浏览 3提问于2017-10-25得票数 0

回答已采纳

1回答

返回超过字符长度限制的列列表- pyspark/snowflake

pyspark、jupyter-notebook、snowflake-cloud-data-platform

我正面临一个问题，在使用pyspark将数据帧写入snowflake中的表时，我无法返回所有超过字符长度的列的列表。我如何一次返回列的列表，而不是更新每一列，重新运行命令，然后在另一列上面临相同的问题，并重复该过程，直到所有列的长度固定。 (df.write \ .format(SNOWFLAKE_SOURCE_NAME) .options(**sfWriteOptions) .option("schema",schemaname) .option("dbtable",targettable) .mode(&#

浏览 54提问于2020-04-29得票数 0

1回答

将具有相同列名的数据帧的s列组成一个矩阵

arrays、r、matrix

如何从初始数据帧(包含列p1到ps)生成包含s个变量的比例p1 to ps的矩阵P 这是一个R问题。我有一个数据帧，其中包括变量p1到ps以及其他变量。我想将变量p1到ps的值从数据帧转移到矩阵P中，以便在其他例程中使用。当我知道列数s(在下面提供的示例中，s=5)时，我可以使用下面的代码(对于一个5列的示例，测试数据在dataframe ALL_test中)。下面的代码读入示例数据帧ALL_test。 ALL_test <- data.frame( x = c(50,75,45), p1 = c(1, 0, 0), p2 = c(0, .4, .1), p3 = c(0, .2,

浏览 3提问于2016-01-27得票数 0

2回答

使用重新编码向数据框添加列

我正在学习dplyr上的一个DataCamp类。他们让我加载'hflights‘数据，然后让我创建一个名为'Carrier’的新列，用每个航空公司代码的实际名称替换它们。解决方案如下所示： hflights <- tbl_df(hflights) names <- c("AA" = "American", "AS" = "Alaska", "B6" = "JetBlue", "CO" = "Continental",

浏览 16提问于2016-07-28得票数 1

回答已采纳

1回答

在由lapply分配给数据帧的过程中发生了什么

r、dataframe、lapply

给定数据帧df和应用于df的函数f： df[] <- lapply(df，f) 用来自lapply的列表中的向量集合替换df中的列，R的魔力是什么？我看到lapply的结果是一个与dataframe df同名的向量列表。我假设已经完成了一些神奇的映射，将向量映射到df[]，这是df (methinks)中列的集合。就行了吗？试着更好地理解，这样我就能记住下一次要用什么。

浏览 14提问于2021-04-23得票数 0

回答已采纳

2回答

R迭代数据帧的效率

r、dataframe、tidyverse

我正在处理一个大型数据集，我们将其命名为data，并希望创建一个新列，基于某个列data$input，我们将其命名为data$results。结果是基于一些条件if/then逻辑，所以我最初的方法是这样的： for (rows in data) { data$results <- if(data$results == "1" | data$results== "2") { trueAnswer } else { falseAnswer } } 对于大数据帧，此过程可能需要几个小时才能运行。但是，如果我

浏览 1提问于2018-04-16得票数 1

4回答

比较R中的两个数据帧对象是否相等？

r、dataframe、compare、equality

如何检查两个对象(例如数据帧)在R中的值是否相等？所谓值相等，是指一个数据帧的每一列的每一行的值等于第二个数据帧中相应行和列的值。

浏览 3提问于2012-05-15得票数 57

回答已采纳

2回答

在pandas数据帧中使用数学符号命名列

python、pandas、dataframe

我想将我的参数的单位添加到每个参数旁边，作为我的数据框架中的列的名称。我还需要对一些列名使用统计符号，比如μ和σ2。我根据python中的数学符号r"$...$尝试了下面的代码，但它不适用于dataframe： P[r"Infiltration rate ($1/\h^-1$)"]=r['ACH_Base'] 为了给入渗速率参数(1/h^-1)个单位。在我的代码中，我已经创建了一个新的数据帧" P“，并且我正在将"r”数据帧中的ACH_Base列添加到P中。如何添加数学符号来命名数据帧中的列？谢谢！！

浏览 0提问于2018-04-09得票数 1

3回答

过滤掉在数据帧列表中没有列Z的所有数据帧？

r、dplyr、filter

我有一个由6个数据帧组成的列表，其中5/6的数据帧中有一列"Z“。为了继续我的脚本，我需要删除没有Z列的数据框架，所以我尝试了以下代码： for(i in 1:length(df)){ if(!("Z" %in% colnames(df[[i]]))) { df[[i]] = NULL } } 这似乎确实完成了这项工作(它从列表中删除了一个数据帧，其中没有列Z)，但是我仍然收到了一条消息“df[i]中的错误:下标超出界限”。为什么是这样，我怎样才能避免错误呢？

浏览 5提问于2022-06-01得票数 1

回答已采纳

1回答

根据R中的第一列绘制数据帧的列

r、dataframe

在R中，如何能够将数据帧的所有列与该数据帧的第一列相对应？如果数据帧有4列，则需要一幅3条覆盖线的单幅图。 plot(df)生成一个散点图矩阵，而 for(i in 1:ncol(df)) { plot(df$length, df[,i], type='l') } 只绘制最后一列相对于第一列。

浏览 0提问于2015-10-31得票数 2

回答已采纳

1回答

根据输入向帧中添加日期

我为R中的数据集提供了一个输入变量，用于评估工具列表。它看起来如下： type <- as.integer(readline(prompt="Enter a Barcode: ")) 我有两列，一列包含输入语句中找到的信息(一组条形码)，另一列包含将某一特定内容输入“tool”变量的日期。我理解如何使用函数Sys.Date，它对我来说很好，我只是很难让它在扫描某些内容时更新数据帧中的列，而不是将当前的日期输出到控制台中。这方面的理想输出将只是对条形码扫描的行中的数据帧列进行更新。例如： Barcode_Number, Date_Used 5698, 2018-07-07

浏览 1提问于2018-07-11得票数 0

回答已采纳

2回答

将一系列更改应用于R中的多个相似数据集

我有20个csv数据文件，它们的格式完全相同，大约有40列不同的数字，但每列中的值不同。我想对每个数据框应用一系列更改，以便从每个数据框中提取特定信息。具体地说，我想从每个数据帧中提取四列，找到每个数据帧中每列的最大值，然后将所有这些最大值相加，这样我就得到了每个数据帧的一个最终数字。如下所示： str(data) Extract<-data[c(1,2,3,4)] Max<-apply(Extract,2,max) Add<-Max[1] + Max[2] + Max[3] + Max[4] 我有上面写的代码，分别为每个数据帧执行所有这些步骤，但是否可以将此代码同

浏览 0提问于2017-08-02得票数 0