是否有一种R方法可以从单独数组中列出的数据帧中选择列_是否有一种方法可以替换R数据帧中多列中的NAs_是否有一种方法可以得到R中不同列的频率分布 - 腾讯云开发者社区

java、scala、dataframe、spark-dataframe

在连接两个数据帧之后，我发现列的顺序改变了我的预期。例如:在b上连接具有列[b,c,d,e]和[a,b]的两个数据帧将产生[b,a,c,d,e]的列顺序。如何更改列的顺序(例如，[a,b,c,d,e])？我已经找到了在Python/R中做到这一点的方法，但没有找到Scala或Java。是否有任何方法允许交换或重新排序数据帧列？

浏览 1提问于2016-06-29得票数 4

4回答

从R值之间的字符串中提取数据帧

r、string

浏览 7提问于2020-03-01得票数 2

回答已采纳

2回答

是否有一种R方法可以从单独数组中列出的数据帧中选择列

r、arrays、list、variables、select

我有一个超过100列的数据帧。在实现某些条件之后，我需要数据帧的一个子集，其中的列在一个单独的数组中列出。该数组有50个条目，共2列。第一列具有选定的变量名，第二列具有一些关联值。我希望使用单独数组的第一列中提到的变量来构建一个新的数据框架。你能告诉我该怎么做吗？

浏览 8提问于2021-07-19得票数 0

回答已采纳

1回答

从D3D11_MAPPED_SUBRESOURCE (桌面复制API)压缩桌面图像帧的原始资源数据

image、compression、directx-11、desktop-duplication

我需要通过网络传输桌面图像数据DXGI_FORMAT_B8G8R8A8_UNORM的帧，这些帧是用桌面复制API捕获的，但是有一个问题:原始帧数据的 size ，以FullHD格式表示，大约等于8MB<code>E 211</code>，太大了，特别是对于一个帧。是否有什么好的方法来压缩桌面图像的帧，从D3D11_MAPPED_SUBRESOURCE中获取数据，并至少在KB中获得大小？也许是从bmp到jpeg的转换？我已经使用LZ4_compress_default方法尝试过LZ4压缩，并获得了具有3.4MB大小的字节数组，这对于帧来说仍然太大了。

浏览 4提问于2019-11-17得票数 1

回答已采纳

3回答

在R中的数据中计算不同长度的列的行数

r、count

我有一个数据帧，有100列，长度从25行到500行不等。我试图计算几个特定列的行数。看起来就像这样： Col1 Col2 Col3 1 25 23 20 2 22 28 20 3 35 33 30 4 NA 40 41 5 NA NA 43 如果我用 rows = nrows (mydatafrom$col1) 它返回NA。 rows = NROWs (mydataframe) 返回最长列的行数。我还想知道，数据框中显示为NA的空白单元格是否导致了一些问题。

浏览 4提问于2014-07-10得票数 1

回答已采纳

3回答

循环多个列以查找数字列中的字符串？

python、pandas、numpy

下面的代码查找B列的任何字符串。是否可以循环遍历数据帧的多个列，输出包含每列字符串的单元格？ import pandas as pd for i in df: print(df[df['i'].str.contains(r'^[a-zA-Z]+$')]) 链接到https://stackoverflow.com/a/65410078/12801962上的代码

浏览 19提问于2020-12-23得票数 0

2回答

使python进程写入立即被调度回写，而不被标记为脏。

python、linux、numpy、linux-kernel

我们正在构建一个python框架，它通过cffi接口从framegrabber卡中捕获数据。经过一些操作后，我们尝试以大约120 MB/s的速率将原始映像(使用tofile方法的numpy数组)写入磁盘。我们所遇到的问题是丢弃帧，通常是整个秒的数据从框架抓取器输出中完全丢失。我们发现，当我们的Debian系统到达sysctl中的dirty_background_ratio集时，就会出现这些帧滴。该系统调用了同花顺背景团伙，这将堵塞帧抓取，并导致它跳过帧。毫不奇怪，将dirty_background_ratio设置为0%可以完全解决问题(值得注意的是，即使像1%和2%这样的小数字也会导致大约

浏览 1提问于2017-02-28得票数 2

回答已采纳

1回答

在R中，我们如何将表拆分成由第一列和其余每一列组成的多个数据帧？

r、loops、merge、split

我在x列的R列中有一个数据帧，其中第一列(C1)包含物种名称，并进一步列出每个样本的丰度。我想拆分数据帧，其中每个新拆分的数据帧都包括C1 + Cx。因此，如果有20列，则将有19个数据帧，其中包含C1+C2、C1+C3、C1+C4等。我可以使用lapply和split拆分不同的列，但我找不到一种方法来将列C1附加到每个拆分的框架上。有没有人有建议？谢谢!

浏览 0提问于2018-11-05得票数 1

1回答

如何优化R中的循环？我知道应用功能，但目前在应用上面临问题。

r、for-loop、apply

因此，基本上，我有一个标记向量，我想要在我的Transcript列(逐行)中找到它，如果我从我的Transcript字符串中的标记中找到任何单词，我想创建一个单独的列连接所有标记，如下面的示例所示(参见图)： tags=c("loan","deposit","quarter","morning") 因此，输出应该如下所示：目前，我可以通过使用两个for循环标记，即一个遍历标记向量，另一个逐个遍历数据帧的文本列。但是，我有一个大约500个单词的标签列表，数据帧有超过10万行。所以，我关心的是运行时间。是否有更好的方法来优化我的R

浏览 5提问于2020-11-10得票数 0

2回答

如何按列值在数据帧列表中选择行

我有一个包含四个数据帧的列表(Lfs01)，每个数据帧都有不同数量的列和行。我想通过一列中的值(如果是== 1)过滤所有数据帧中的行。变量在前两个数据帧中称为"a“，在最后两个数据帧中称为"A”。我以前看过类似的问题，但不幸的是，我没有找到解决办法。以下是我尝试过的一些事情： data<-lapply(lfs01, function(x) filter(x ,'a'==1)) data<-lapply(lfs01, function(x) filter(x ,'a'==1|'A' ==1)) 结果:列出4个0行

浏览 3提问于2019-12-01得票数 1

回答已采纳

2回答

根据R中表的列数筛选列表

r、dplyr、tidyverse

我有一个这样的数据帧列表：我想知道如何保留15列的数据帧，并在R中删除列表中的其他数据帧。

浏览 3提问于2021-10-03得票数 2

回答已采纳

2回答

如何在Pyspark中优化我的Reduce函数

pyspark

我正在尝试创建数据帧中的键之间的映射。我在pyspark数据帧中有一列R_ID、V1、V2、V3列。我需要输出数据帧来提供这些列之间的映射。我的结果应该是我已经使用Reduce做到了这一点，但是我在测试大数据时遇到了性能问题。有人能帮我一下吗？

浏览 0提问于2021-10-28得票数 0

1回答

Pandas数据帧多个数据库表

python、python-3.x、database、pandas、postgresql

我有一个API包装器，可以从特定的产品中提取数据。我面临着如何将json数据映射到数据库(postgresql)的问题。我已经阅读了Pandas dataframe，但我不确定这是不是正确的方法。我有几个问题需要帮助。 1)是否可以选择哪些行可以进入数据帧？ 2)数据帧内的每一行都需要插入到两个不同的数据库表中。我需要在TableA中插入10列，获得新插入行的id，然后在TableB中插入5列，包括返回的id。我该怎么做呢？ 3)是否可以为数据帧中的每一列指定数据类型？ 4)是否可以将列名称重命名为数据库字段名称？ 5)是否可以遍历特定的列并替换某些数据？对于我正在尝试实现的目标，有没有可以

浏览 14提问于2020-05-15得票数 1

回答已采纳

2回答

使用dplyr和for循环创建过滤数据

r、for-loop、dplyr、filter

我想使用for循环从R中的原始数据帧中创建几个数据帧。我想得到三个分离的数据帧为每种进行单独的分析。我尝试了以下代码，但它不起作用： data(iris) library(dplyr) for i in levels(iris$Species){ paste0(i,".data") <- data.frame(filter(iris, Species=="i")) } 我不一定需要dplyr，但这是我习惯的。

浏览 5提问于2022-03-22得票数 0

2回答

将pandas选定列转换为二维numpy数组

python、pandas、numpy

我有一个10列N行的pandas数据帧。我想从我的数据框中选择两列，并将它们放入一个维数为(N，2)的NumPy 2D数组中。如何做到这一点？

浏览 0提问于2020-06-08得票数 1

1回答

比较朱莉娅中的两个数据格式是否相同

julia

假设我有两个数据帧，它们来自两个数据库。这两个数据帧应该是完全相同的，它们都有字符串和数字。是否有一种方法来比较这两个数据帧是否相同，是否列出了不同的记录？

浏览 2提问于2021-01-27得票数 2

回答已采纳

2回答

Pandas信息:DataFrame()函数仅适用于一列

python、pandas

我有一个名为df_train的数据帧，有20列。有没有一种简单的方式，通过选择名称来只查看一列的信息。基本上，我尝试遍历df并提取一些唯一值并添加缺少的值。 print("\nUnique Values:") for col in df_train.columns: print(f'{col:<25}: {df_train[col].nunique()} unique values. \tMissing values: {} ')

浏览 20提问于2021-03-27得票数 0

回答已采纳

1回答

在数据框中搜索最接近的值

r、search、dataframe

我有一个关于从R中的数据框中搜索和查找值的问题。假设我有一个包含一大堆不同列的数据框，并且在该数据框中有一个部分，例如： Instrument | Time | Microsecond ------------------------------------------- .... | .... | .... ------------------------------------------- ABC | 10:32:40 | 420 ------------------------------------

浏览 11提问于2017-02-21得票数 0

1回答

为什么我指定为数字的R中的数据框列更改为字符？

r、dataframe、type-conversion

我用下面的代码在R中初始化一个数据帧： pcts <- data.frame(group=character(), bonus.type=character(), success.rate=double(), stringsAsFactors = FALSE) 然后，我使用以下命令向数据框中添加行： pcts[nrow(pcts)+1,] <- c(paste(varname,gname,sep="="), btype, pct) 但是，当我从函数返回pcts时，success.rate列是字符值的。

浏览 2提问于2017-02-09得票数 2

1回答

将R中的数据框导出到Excel中，同时将旧数据保留在excel文件中

r、excel、export-to-excel、export-to-csv

我使用write.xlsx命令将R中的数据帧导出到excel中。例如，write.xlsx(output, "C:/myfolder/output.xlsx)数据帧有4列。这些列中的数据每周更新一次。我想在不丢失前一周的旧数据的情况下，将R中的数据帧导出到excel文件中。基本上，将数据导出到excel文件应该有助于保持每周数据的日志。

浏览 2提问于2018-09-13得票数 0

1回答

如何在r中的列表中跨数据帧选择列

r、list、dataframe、lapply

在确信使用list管理R中的多个数据帧是最佳实践之后，我决定将具有相同列名的所有数据帧放入列表中。样本清单： #create sample df df_1 <- data.frame(item = c("a", "b", "c"), measure = c(1,2,3) ) df_2 <- data.frame(item = c("x", "y", "z"), meas

浏览 3提问于2022-03-30得票数 0

回答已采纳

1回答

如何在遍历数据帧时删除列？

r、dataframe

我有许多数据帧，它们都有一个同名的列；我想循环遍历所有的数据帧来删除该列。例如： > df1 a b 1 1 2 2 1 2 3 1 2 > df2 a c 1 1 3 2 1 3 3 1 3 我还列出了所有数据帧名称： > df.list [[1]] [1] "df1" [[2]] [1] "df2" 如果我执行df1$a<-NULL，将删除列a。我想删除两个dfs中的a列，这是我尝试过的： library(dplyr) make.null<-function(x) { x<-NULL

浏览 0提问于2018-11-07得票数 2

回答已采纳

2回答

H2O数据框中的列限制？

r、apache-spark、h2o

我正在使用R中的一个数据集，它包含42,457行和785列。第一列是二进制响应变量(称为label)，其余列是二进制特性。我尝试使用rsparkling (描述为)来拟合逻辑回归模型，但得到了错误。我跟踪到了将这个表的Spark版本转换为H2O数据帧的步骤。下面是我用来测试的函数。Spark实例sc已启动并运行，df是作为标准R数据帧的原始数据集： load_h2o <- function(df, rows = nrow(df), cols = ncol(df)) { df <- df[1:rows, 1:cols] copy_to(sc, df

浏览 15提问于2017-06-28得票数 1

1回答

向量化Python Pandas Dataframe

python、pandas、data-cleaning

我有csv文件，我正在将其读入Python Pandas Dataframe。我想对操作进行矢量化，以便使用针对某些列的一组用户定义函数对列运行数据清理，并将结果附加到数据帧中。我可以读取记录并逐个处理它们，但我想通过Pandas使用一个函数对1整列进行操作来向量化操作。输入数据帧 A B C D 0 a b c d 1 t f h e 2 j r y k 我想在列A, B and C上执行数据清理(DC*)。 A B C D DC1-A DC2-B DC3-D 0 a b c d

浏览 3提问于2019-11-01得票数 1

3回答

如何从pandas数据帧中提取值并将其放入numpy数组中？

python、pandas

我有多个pandas数据帧，我想写一个函数，它将取出数据帧每列中的值，并将它们放入自己的numpy数组中。示例数据帧 In [1]: df = pd.DataFrame([[1, 2], [1, 3], [4, 6]], columns=['A', 'B']) In [2]: df Out[2]: A B 0 1 2 1 1 3 2 4 6 如何从A列和B列的值中生成两个不同的numpy数组

浏览 1提问于2019-04-10得票数 0

2回答

R中使用列索引号而不是名称的聚合函数

r、aggregate

我希望使用R中的聚合函数--使用列索引号来标识正在聚合的数据帧列，而不是列名。下面是一个使用列名的示例： df = data.frame(A = c("a", "a", "b", "b", "c", "c"), B = 1:3, C = 1:3, D = 1:3) aggregate(cbind(B, C, D) ~ A, data = df, sum) 但是，与其在cbind中列出B、C和D，我希望指示它使用列2:4。

浏览 8提问于2021-06-26得票数 3

回答已采纳

3回答

如何将字符(例如，"[1，2，3]“)转换为列表(例如，[1，2，3])

r、string、list

是否有一种很好的方法将数据文件中的一列字符转换为R中的列表？例如：转换型chr "[1, 2, 3]" "[11, 24, 3]" "[1, 21, 3]" "[14, 2, 31]" 列出 [1, 2, 3] [11, 24, 3] [1, 21, 3] [14, 2, 31]

浏览 7提问于2022-04-13得票数 1

回答已采纳

2回答

整个数据帧可以用作预测变量吗？

r、xgboost、dataframe

我试图使用R中的XGBoost来训练一个模型，使用以前日期的所有数据以及当前日期的两个分类变量(Cat1和Cat2)来预测固定数量的目标变量。原始数据采用这种格式： ╔═════════╦═════════╦══════════╦══════╦══════╦══════╦══════╗ ║ Target1 ║ Target2 ║ Date ║ Cat1 ║ Cat2 ║ Var1 ║ Var2 ║ ╠═════════╬═════════╬══════════╬══════╬══════╬══════╬══════╣ ║ 1 ║ 2 ║ 01/01/20 ║ A

浏览 0提问于2020-02-06得票数 1

1回答

H2O Python -如何获得变量类型，getTypes等效

python、h2o

在R中，Python与getTypes的等价性是什么？我试图从H2O数据帧(枚举、字符串、int等)中提取每个列的变量类型。而且，从广义上讲，有人能给我发一个链接到一些文档，列出Python的数据框架的所有属性和函数吗？就像。df.nrow，df.shape等等，我真的很难找到如此清晰的来源。

浏览 2提问于2017-04-21得票数 5

回答已采纳

1回答

在logistic回归中作为自变量输入整个数据框架

r、dataframe、regression

可能重复：我有一个较大的数据框架(112个变量)，我想用R进行逐步logistic回归，我知道如何设置glm模型和stepAIC模型，但我不想输入所有的标题来输入自变量。是否有一种快速的方法将整个数据框架作为独立变量提供给glm模型，以便将每一列识别为模型中包含的x变量？我试过： ft<-glm(MFDUdep~MFDUind, family=binomial) 但是它不起作用(错误的数据类型)。MFDUdep和MFDUind都是数据帧，MFDUind包含111个'x‘变量，MFDUdep包含单个'y’。

浏览 3提问于2012-12-27得票数 0

回答已采纳

1回答

如何解析文件并生成数据帧

python、pandas

我有一个定制格式的文本文件。我还有一个解析器，可以从每行中提取相关的列。我想一次读入一行文件，并将它们添加到数据帧中。问题是向数据帧追加一行的速度很慢。这样做的正确方法是什么？

浏览 1提问于2016-09-30得票数 0

1回答

如何将pandas数据帧拆分成列？

python、pandas、dataframe、flask

? 我有一个数据帧，它将是100个项目的长度。我在网上找到的一个临时web模板上显示了这个数据帧(我不太了解html )。问题是，这个列表只会让你从1到100一直往下滚动，看起来非常糟糕。我希望有两列或三列并排(例如:一列中有33个项目，然后中间有33个项目，依此类推)这样数据帧就不会浪费太多空间。我不知道这是html的问题还是数据帧的问题，所以请原谅我。我正在使用Flask作为web框架。如果你需要我提供的html代码，我可以。 while counter < 50: e = str(elem[counter].get_attribute("href")) e

浏览 10提问于2018-12-27得票数 0

回答已采纳

1回答

求groupby函数后两列的最大乘积

python、pandas、group-by

我有一个数据帧，如下所示： item width length 0 X 4 1 1 F 15 4 2 R 6 3 3 X 3 10 4 F 10 19 对于每一项，我想列出最长项的宽度和长度。我尝试使用df.groupby("item").max()，但它给出了以下数据帧，这是错误的： item width length F 15 19 R

浏览 24提问于2021-02-07得票数 0

4回答

通过随机抽样其他列数据来创建新列

python、pandas

我想通过从剩余列中随机抽样数据来创建一个新列。考虑一个具有"N“列的数据帧，如下所示： |---------------------|------------------|---------------------| | Column 1 | Column 2 | Column N | |---------------------|------------------|---------------------| | 0.37 | 0.8 | 0.0

浏览 26提问于2019-04-10得票数 3

回答已采纳

2回答

如何从多个数据帧转换列的格式？

我有几个数据帧，其中一些列具有相同的名称。我试图想出一种方法，系统地从不同的数据帧中更改同名列的格式。以下是我想出的： data1=data.frame(a=seq(1:10),b=c("a","b")) data2=data.frame(a=seq(11:20),b=c("c","d")) temp = c("data1$a","data2$a") for (i in 1:length(temp)) { eval(parse(text=(temp)[i])) = as.character(

浏览 1提问于2016-05-16得票数 2

回答已采纳

1回答

将表示多对关系的NSSet绑定到NSArrayController选择

cocoa、data-binding、core-data、nsarraycontroller

这是一个场景。有两个CoreData模型对象，A和B，它们之间的关系是A有多个B，由属性setOfBs表示。我想显示两个表，一个列出了所有的A(表1)，另一个列出了所有的B(表2)。当用户选择表1中的项时，表2中的选择会发生变化，以反映表1中所选A的setOfBs值。表的内容不会改变，只有选择会改变。如果表1中的选择发生更改，则会更改setOfBs以反映这一点。这可以使用绑定来完成吗？或者是否需要自定义逻辑？

浏览 0提问于2011-12-19得票数 1

回答已采纳

2回答

查找R数据框中的值的单元格引用

我正在尝试找到一种在数据帧内进行搜索的方法，以返回多个条件的列和行引用。 #some data SalesData<-data.frame(Appliance=c("Radio", "Laptop", "TV", "Fridge"), ThisYear=c(5,25,5,8), LastYear=c(6,20,5,8)) #code to find which row column TV is in which correctly gives row 3, col 1 TVRef<-which(SalesDat

浏览 1提问于2019-10-30得票数 1

5回答

如何将数据帧保存在由列分隔的txt或excel文件中

我有一个关于以txt或excel格式保存数据帧的问题。我在R中有一个数据帧，但是当我保存它时：首先，当我打开保存的数据帧(例如在Excel中)时，首先使用write.table()函数将所有列分组在一个列中，您必须分隔Excel中的列，这样就有丢失数据的风险。同样的情况发生在write.csv()函数中。在R中保存所有列分隔的数据帧是否正确。谢谢。

浏览 11提问于2013-08-29得票数 20

1回答

使用存储在另一个数据帧中的值查找数据帧

r、list、dataframe

我有15个数据框架，其中包含了一组病人的病人访问信息。下面的例子。他们被命名为FA.OFC1，FA.OFC2等。 ID sex date age.yrs important.var etc... xx_111 F xx.xx.xxxx x.x x 我正在生成一个概要数据框架(sev.scores)，其中包含了关于患者在所有记录数据中的最严重发作的信息。我已经成功地使用了which.max函数来获得最严重的插曲，但现在需要更多关于该特定插曲的信息。我重新创建了数据框架的名称，需要在返回最大值后粘贴信息，以获得附加信息： max

浏览 1提问于2017-07-10得票数 2

回答已采纳

1回答

如何选择R中的列？

r、select、logistic-regression

我正在尝试在R中进行逻辑推理。假设我有从A到I (A，B，C，D，E，F，G，H，I)的列。现在我想将Z赋值给包含A，B，C，D，G，H列的数据帧，我该如何在R中做同样的事情呢？

浏览 0提问于2019-05-04得票数 0

2回答

Pandas数据帧到一维数组

python、pandas、numpy

我有一个有很多列的数据帧。首先，我只从r_i = df.iloc[:, i: i + 1]的数据帧中选择了一列然后，我想简单地通过np.array(r_i)将这个r_i转换成数组。我想要的结果是：array([-1, -2, -3])。换句话说，它应该是一个列表的数组。但是，它给我提供了一个由子列表组成的列表的数组：array([[-1], [-2], [-3]])。如何防止这种情况发生？谢谢。

浏览 0提问于2018-07-16得票数 2

2回答

如何找出某一列中的单词在另一列中出现的次数

r、dataframe、apply、gsub、grepl

我正在寻找R中的解决方案，以找出一列/多列中的单词在数据帧的另一列中出现的次数。我有一个DF有4列(页面，文本，野生动物和动物)。 df <- tibble::tibble(page=c(12,6,9,18,2), text=c("Dogs are related to wolves, but dogs are friendly", "I love pets", "I like goat and deer. Deer

浏览 0提问于2020-09-21得票数 1

1回答

来自uproot的pandas数据帧中的字符串

pandas、uproot

在使用输出.root文件的Geant4进行模拟时，我很高兴地发现了uproot包。我相信数据帧是完成特定分析任务的最佳选择，所以我使用uproot.pandas.df()将TTree中的内容读取到这样的数据帧中。不幸的是，这最终成为了一个瓶颈。虽然代码可以很好地处理所有数字输入，但处理字符串似乎是一个严重的问题。该文件非常大，生成的帧有2406703行。而这段代码(Egamma和z_eu都是数字)： df = uproot.open('rootFile.root')['seco_tuple;1].pandas.df( ['Egamma','

浏览 18提问于2019-11-19得票数 1

7回答

选择R中数据帧的最后n列

r、indexing、dataframe

有办法系统地选择数据帧的最后一列吗？我希望能够将最后一列移动为第一列，但在它们被移动时保持它们的顺序。我需要一种不使用子集( data，select =c(在新顺序中列出的所有列)列出所有列的方法)，因为我将使用许多不同的数据框架。下面是一个示例，我想将最后2列移到数据帧的前面。很管用，但很难看。 A = rep("A", 5) B = rep("B", 5) num1 = c(1:5) num2 = c(36:40) mydata2 = data.frame(num1, num2, A, B) # Move A and B to the front of

浏览 0提问于2015-01-19得票数 18

回答已采纳

1回答

在R中使用json文件读取数据帧

sql、r

我有一个SQL数据库，我想在其中选择JSONfiles的一列并将其转换为可读的R数据帧。我成功地从我的数据库创建了JSONfiles的数据帧，但是当我尝试使用fromJSON函数读取它们时，它并没有读取所有的JSONfiles。 JSON列是每一行都有一个data$products_json文件的列。 rs = dbSendQuery(mydb, "SELECT products_json FROM orders") data = fetch(rs, n=-1) library(rjson) jfile <- fromJSON(data$products_json)

浏览 7提问于2019-07-05得票数 0

回答已采纳

4回答

获取新数据帧中A列的每个值的B列的所有值

r、dataframe

我有一个有两列的数据框架。我想要创建一个新的数据框架，它列出了第一个数据帧中第一列的每个唯一值的第二列的所有值。我不想使用数据表。经过几次试验和错误之后，我想出了以下几点。我想知道是否有一种更简单(一步？)、更快或更理想的方法来实现这一点，因为我将要运行的实际数据帧非常大。 > df <- data.frame( a=c( 1, 1, 2, 2, 3 ), b=c( 6:10 ) ); > df a b 1 1 6 2 1 7 3 2 8 4 2 9 5 3 10 > df2 <- data.frame( a=unique( df$a ) ) &g

浏览 3提问于2018-08-20得票数 0

回答已采纳

2回答

使用正则表达式的r子集数据集

regex、r、subset

是否有办法使下面的R代码运行得更快(即矢量化以避免使用for循环)？我的示例包含两个数据帧。首先是维度n1*p。其中一个p列包含名称。第二数据帧是列向量(n2*1)。它也包含名字。我希望保留第一个数据帧的所有行，其中第二个数据帧的列向量中的名称的某些部分出现在相应的第一数据帧中。很抱歉做出了残酷的解释。示例(数据框架1)： x y Doggy 1 Hello 2 Hi Dog 3 Zebra 4 示例(数据帧2) z Hello Dog 所以在上面的例子中，我想保留行1,2,3，但不是4行，因为"Dog“出现在"Doggy”和&

浏览 5提问于2013-10-28得票数 4

回答已采纳

1回答

如何将数据帧拆分为具有特定报头组合的数据帧列表

我对R非常陌生，需要一些帮助。我试图将一个数据帧分割成一个数据帧列表，该列表由每一对可能的列1和随后的每一列组成。例如，考虑到以下数据： df <- data.frame ("Time" = c("Mon","TUE", "WED"), VarA = c(2,5,6), VarB = c(24,46,14)) 我想在一个列表中得到两个数据帧。第一个是列"Time“和"VarA"，第二个是列"Time”和"VarB“。理想情况下，创建此列表的函数对于数百个时间变量对来说是可伸缩的。

浏览 3提问于2018-09-13得票数 2

回答已采纳

1回答

有没有一种在连接后只选择一个dataframe列的快捷方式？

scala、dataframe、azure-databricks

我在scala中使用一个数据帧，但该数据帧有大约60列。在Databricks管道中，我们拆分出几个列和一个标识列来验证一些数据，从而产生一个“参考”数据帧。我希望将它连接回主要的大型数据框架，并将经过验证的数据插入到原始列中。为了简单起见，我希望结果数据帧与原始数据帧的模式相匹配，因此没有引用列。在小范围内，这并不太难： myDF = myDF .join(refDF, myDF("Identity") === refDF("RefIdentity"), "inner") .withColumn

浏览 23提问于2021-08-27得票数 1

回答已采纳

1回答