根据来自另一个数据帧的行中的匹配值排除数据帧中的行_根据单独数据帧中的值删除行_根据另一个数据帧的匹配行和列填充数据帧中的值 - 腾讯云开发者社区

、、

我无法比较两个不同数据帧的列值。第一个数据集有500行，第二个数据集有128行。我提到的是数据集的几行。第一个数据集： Country_name Weather President USA 16 Trump China 19 Xi 第2个数据集 Country_name Weather Currency North Korea 26 NKT China 19 Yaun 我想要比较country_name列，因为我在dataset 1

浏览 0提问于2021-01-06得票数 0

1回答

具有部分字符串匹配的两个Pandas数据帧之间的映射/压缩

、、、、

我有两个数据帧，每个数据帧大小约为1,000,000行。两者共享一个公共的'Address‘列，我用它来连接数据帧。使用这个连接，我希望将信息从dataframe1移动到dataframe2，我称之为“details”。 df2.details = df2.Address.map(dict(zip(df1.Address,df1.details))) 然而，address列并不表现出完全的通用性。我尽了最大努力清理，但仍然只能移动大约40%的数据。有没有办法修改上面的代码以允许部分匹配？这一次我完全被难住了。数据非常简单，如所述。两个小数据帧。虚构的样本数据如下： df1 Addr

浏览 1提问于2019-04-02得票数 0

1回答

使用for语句从dataframe追加列表

、、、、

在学校学习Python。在一个项目中工作，我想从一个数据帧中删除特定的行，并将其转换为另一个数据帧。我有一个372个动物的列表，如果它们的名字出现在数据帧中(它有1288行，每行是不同的动物)，我想删除该行。因此，我找到了一个删除行的解决方案： ess_aza = [] for i in aza_names: if True: ess_aza.append(ess_clean.loc[ess_clean['scientific_name'] == i]) else: return 打印出来的列表是这样的： [Empty Dat

浏览 20提问于2020-10-25得票数 2

回答已采纳

1回答

删除R中不包含特定字符串的所有行

我仍然在学习如何使用R的许多东西，但是我面临着一个问题，我还没有找到任何答案。在我的数据框("data")中，行是针对每个参与者的，也是针对每个参与者在给定任务上的试验。这些列包含有关这些参与者的不同信息。它看起来有点像这样： Participant Age Sex Trial.Type correct P01 26 0 test 1 P01 26 0 test 0 P01 26

浏览 0提问于2018-01-30得票数 8

回答已采纳

1回答

如何匹配ID号以合并两个数据帧

、

我有两个数据帧，这两个数据帧的列的ID号应该匹配。然而，这两个数据帧的ID数量不同。一个有118个ID，另一个有103个ID。具有118个ID的数据帧有全部103个ID，但有一些额外的ID。我想从118行数据帧中提取两列，并根据ID号将它们与103行数据帧中匹配的ID合并。我不知道解决这个问题的最简单的方法。

浏览 2提问于2019-02-07得票数 3

回答已采纳

2回答

如何在不获取额外行的情况下合并两个数据帧？

、

基本上，我有两个数据帧，第一个看起来像这样： ? 第二个是这样的： ? 我想要获取第二个数据帧的"lat“和"lnt”列，并仅当两个数据帧中的城市名称匹配时才添加到第一个数据帧中。我尝试使用pd.merge()，但它创建了具有重复值的新行。如果可能，我希望在没有任何匹配的行中放置一个NaN，但我不想删除或添加行到原始数据帧。

浏览 19提问于2021-08-12得票数 0

回答已采纳

1回答

过滤文件范围中的特定行元素

、、

我正在处理一组文件，并希望从所有文件中过滤特定的行元素。首先，我阅读了所有的文件并创建了一个很大的列表。 library(tidyverse) library(fs) file_path <- fs::dir_ls("User/Low Carbon London/daily_dataset") df <- file_path%>% map(function(path){ read_csv(path) }) 每个文件都命名为block_^，其中^是一个整数。df中的每个文件都有如下所示的列： id mean max a 1 2

浏览 16提问于2021-07-17得票数 0

回答已采纳

1回答

Dataframe - Python中的Upsert函数

、、

我正在尝试使用与第一列相关的另一个数据帧来更新一个数据帧。如果第二个数据帧中有额外的行，则应将其插入第一个数据帧中。如果有一行在第一列中具有相同的数据，但在其他列中具有不同的数据，则应该更新该行。此外，应该删除第一列中没有值的行。使用的代码- df = df_1.combine_first(df_2)\ .reset_index()\ .reindex(columns=df_1.columns) df = df.drop_duplicates(subset='A', keep= 'last', inpl

浏览 0提问于2019-05-17得票数 0

2回答

在另一个dataframe行中的dataframe行中查找单词

、、

我想检查一个数据帧B行中的单词是否存在于另一个数据帧A行中，并检索数据帧A的LineNumber。数据帧A示例 LineNumber Description 2539 5401845 Either the well was very deep, or she fell very slowly, 4546 5409117 for she had plenty of time as she went down to look about her, 4368 5408517 and to wonder what was going to hap

浏览 0提问于2019-11-09得票数 3

1回答

Pandas合并具有多列和容差的数据帧

、、、

我有两个数据帧，我想使用两个列作为键来合并它们，并创建另一个合并的数据帧。这里，Column1是String，Columns2是float数据类型。我想把.01的容忍度放在column2上，这样来自dataframe1的(John，1.12)和来自dataframe2的(John，1.13)应该在同一行。我怎样才能做到这一点呢？例如:2个数据帧： df1 = pd.DataFrame({"Name":["John","Millon"], "MarketVal":[1.12,2.11], "Left_Product"

浏览 0提问于2020-07-30得票数 3

2回答

rbind数据帧，重复行名问题

、、、、

虽然在matrix中允许重复的行(和列)名称，但在data.frame中不允许。尝试rbind()一些具有共同行名的数据帧会突出这个问题。考虑下面的两个数据帧： foo = data.frame(a=1:3, b=5:7) rownames(foo)=c("w","x","y") bar = data.frame(a=c(2,4), b=c(6,8)) rownames(bar)=c("x","z") # foo bar # a b a b # w 1 5

浏览 0提问于2012-10-24得票数 4

回答已采纳

1回答

使用rsync更新并从源文件夹中删除

、、、

我想要rsync内容从/local/path到server:/remote/path。文件以由4位数字组成的扩展名结束。如果远程路径中不存在文件，请将文件复制到远程并从本地删除。如果文件存在于远程路径中且大小不小于本地路径，请不要将该文件复制到远程并从本地删除它。我试过了 rsync -avmhP --include='*.[0-9][0-9][0-9][0-9]' --include='*/' --exclude='*' --size-only --remove-source-files /local/path se

浏览 4提问于2016-06-08得票数 1

回答已采纳

1回答

将结果从一个数据帧移动到数据集

我正在使用两个不同的数据集，我希望将数据从一个数据集移动到另一个数据集。我是这样想的:一个包含结果，与正确的因子(HTm)配对，我想把它们分散到另一个帧上。这是第一帧： head(five) Week Game.ID VTm VPts HTm HPts HDifferential VDifferential 1 1 NFL_20050908_OAK@NE OAK 20 NE 30 10 -10 2 1 NFL_20050911_ARI@NYG ARI 19 NYG 42 23

浏览 9提问于2012-05-11得票数 0

2回答

将频带矩阵转换为帧并省略某些行？

、

我之前得到了很多帮助，但我刚刚遇到了另一个问题，我想知道是否有人会有任何见解。在中，我写了一个数据集(它实际上大约有50行)，让我们称它为“Times”： > Times <- read.csv(“Times.csv”, stringsAsFactors=FALSE, header=TRUE) > Times Num Start End 1 00:09:41 00:25:025 2 00:11:21 00:41:32 3 00:34:39 00:58:01 然后，为了找到重叠的时间间隔，有人建议我创建一个带

浏览 2提问于2013-07-18得票数 1

1回答

将数据插入到enum生成的字段mysql时出错

、、

我正在将数据从一个服务器上的一个数据库导出到另一个服务器上的另一个数据库。我正在导出一个csv文件，并在MYSQL工作台上使用导入函数。我为什么要用这种方式？这是因为访问问题。有一个字段被定义为， `isTest` enum('TRUE','FALSE') CHARACTER SET utf8mb4 COLLATE utf8mb4_0900_ai_ci GENERATED ALWAYS AS ((case when ((`Fixed` = _utf8mb4'FIXED') and ((`Type` is null) or (`Type` = _

浏览 3提问于2021-02-14得票数 0

回答已采纳

1回答

子集数据帧，其中值大于另一个数据帧

假设我有一个数据框架，包含3列数据(a，b，c)和1列类别，每个类别(类)有多个实例。 set.seed(273) a <- floor(runif(20,0,100)) b <- floor(runif(20,0,100)) c <- floor(runif(20,0,100)) class <- floor(runif(20,0,6)) df1 <- data.frame(a,b,c,class) print(df1) a b c class 1 31 73 28 3 2 44 33 57 3 3 19 35 53

浏览 3提问于2017-09-27得票数 3

1回答

根据模式排除Dataframe中的行(Regex?)

、、、

我有一个列在一个数据帧与全球定位系统纬度坐标。我希望排除以某种方式格式化坐标的行。正确： [39, 16, 1031971/156250] 我希望排除格式如下的行(行)： [39, 8050139/500000, 0] 我尝试了一些使用正则表达式的方法，但没有得到任何结果。有什么想法吗？有时斜杠前后的数字数会相差1或2。例如，某些行中的8050139/500000和8050156/4000。该列的标题为GPS GPSLatitude。

浏览 2提问于2021-07-09得票数 0

回答已采纳

4回答

如何在动物园格式中删除一定的时间段

、、、

我有一个zoo格式的时间序列数据和另一个POSIXct格式的2个变量数据帧，记录了7对凝视和结束时间，它们代表了应该删除的时间范围。下图以图形形式说明了这些问题。突出显示的区域是我已经确定的区域，预计将被移除。我知道window函数可以用于提取这些区域，但是是否有一种简单地删除该区域中的数据的优雅方法？简单地说，有什么方法可以删除时间序列中的几个句点，比如使用减号(-)来删除数据帧中的列或行？辅助所识别的周期位于数据框架中，如下所示(以POSIXct格式) 时间序列数据采用标准动物园格式。

浏览 10提问于2016-09-19得票数 1

2回答

在不同数据报中的列中查找一列的值

、

我有两个数据帧，一个是大约450万行，另一个是1200行。我希望在较大数据帧的列中找到较小数据帧的值，并根据true/false最终删除这些记录。 df1 ={‘id’：‘1234’，‘4566’，‘6789’，‘Name’：‘Sara’，‘Iris’，‘Jeff’，‘Age’：10，12，47} df2 ={‘id’：‘1234’，‘4566’，‘1080’} 我写的函数： def find_match(row): if (row.column in df1.column.values) == (row.column in df2.column.values): retur

浏览 3提问于2022-09-18得票数 0

2回答

R:排除数据框中具有预设值列表的行

、、、、

我有一个非常大的数据框，但非常类似于这个： df <- data.frame(Group = rep(c('A', 'B', 'C', 'D'), 50), Number = sample(1:100, 200, replace = T)) Group Number A 52 B 74 C 22 D 90 A 7 B 93 C 50 D 10 A 31 B 19 我有另一个名为"remove“的数据框，它看起来像这样： >remov

浏览 0提问于2013-11-07得票数 0

1回答

循环数据帧列表，并使用变量名称从每次迭代中创建新的数据帧

、、、

在我的生命周期中，我无法找出我的for循环中的简单错误在哪里，以便对多个数据帧执行相同的分析，并使用与额外字符串一起使用的变量来识别新的数据帧，并输出每次迭代的新数据帧。这是我的代码： john和jane是许多数据帧中的两个，我希望循环并与bcm进行比较，以便在行中找到重复的结果。 x <- list(john,jane) for (i in x) { test <- rbind(bcm,i) test$dups <- duplicated(test$Full.Name,fromLast=T) test$dups2 <- duplicated(test$

浏览 1提问于2016-07-13得票数 0

回答已采纳

1回答

R-合并两个数据帧

、、

我想要合并的两个数据帧一直存在问题。一个比另一个大，但它们共享共同的列名和行名。我想要做的是通过它们在每行和每列中的特定元素来合并它们。例如，我有一个数据帧：row.names-US Bond,US Stock,EU Bond,EU Stock,Asia Bond,Asia Stock,col.names-Price Risk,Credit Risk,Market Risk; 另一个数据帧：row.names-US Bond,US Stock;col.names-Price Risk; 理想情况下，我希望通过唯一的行名和列名合并这两个数据集。示例： dat1<-matrix(

浏览 0提问于2014-03-11得票数 0

1回答

比较r中两个矩阵的坐标与输出相同矩阵的坐标

、、、

我有两个数据帧，每个都是由各行协调组成的，即x，y，z。这些数据帧具有不同的长度。我希望能够使用一个数据帧作为参考，并搜索与所有3位置匹配的任何坐标。然后，我希望将这些坐标写入另一个数据帧。即数据框架一： [1,] 1 2 3 [2,] 2 3 3 [3,] 1 2 4 [4,] 4 2 5 数据框架二： [1,] 3 2 3 [2,] 1 1 2 [3,] 2 3 3 [4,] 1 2 3 我希望这个能回来 [1,] 2 3 3 [2,] 1 2 3 相配的也就是说，我希望它不只是检查相同数目的行，而是检查数据帧中的所

浏览 1提问于2014-10-20得票数 0

回答已采纳

5回答

R中的快速子集

、

我有一个大小为30000 x 50的数据帧。我还有一个单独的列表，它包含指向此数据帧中的行分组的指针，例如， rows <- list(c("34", "36", "39"), c("45", "46")) 这表示具有行名(不是数字行索引，而是字符行名(Dat)) "34“、"36”、"39“的dataframe行构成一个分组，而"45”、"46“构成另一个分组。现在，我想将分组从数据帧中拉出到一个并行列表中，但是我的代码(如下所示)非常非常慢。我怎么才能加快速度呢？

浏览 0提问于2012-01-20得票数 7

回答已采纳

1回答

比较两个数据帧R的列

、

我有两个数据帧： c1 <- c("chr1:981994","chr1:1025751","chr2:6614300", "chr2:6784300") c2 <- c("G/A","C/T","A/T", "T/G") df1 <- data.frame(c1,c2) a <- c("chr1:981994","chr1:1000000","chr2:6614300", "chr2

浏览 2提问于2016-10-10得票数 3

回答已采纳

1回答

如何解析文件并生成数据帧

、

我有一个定制格式的文本文件。我还有一个解析器，可以从每行中提取相关的列。我想一次读入一行文件，并将它们添加到数据帧中。问题是向数据帧追加一行的速度很慢。这样做的正确方法是什么？

浏览 1提问于2016-09-30得票数 0

2回答

将列表中的多个数据帧按不同的列合并到另一个数据帧

在我的代码中，我使用了多个left_join将不同的数据帧合并到我在dplyr链中处理的数据帧中。我将我想要与另一个合并到一个列表中的数据帧导入到一个列表中，然后直接在该列表上使用lapply进行一些操作，以便为合并做好准备。到目前为止，我已经使用list2env(list, envir = .GlobalEnv)从列表中创建了独立的数据帧，然后使用left_join对每个数据帧分别进行合并，每个数据帧的列都是唯一的，如下所示：测试数据：列表： structure(list(df2 = structure(list(x = structure(c(2L, 1L, 3L ), .Label

浏览 0提问于2018-05-18得票数 1

回答已采纳

4回答

基于python拆分Dataframe的第一次出现

、

你好，我正在尝试将一个数据帧拆分为2个:第一个数据帧应该有所有的行首先出现，并保留所有出现在另一个表中。请看下面我正在寻找的输入数据框和输出数据框示例:我将在拆分之前按组和编号对数据进行排序输入数据： Group number Short 1 Short 2 Moderate 55 Moderate 31 Tall 24 Tall 11 yellow 101 数据帧1 Grou

浏览 40提问于2018-06-14得票数 1

回答已采纳

1回答

R中矩阵行的多到多比较

、、、、

我试图用R将两个大数据帧的数据关联起来。数据是这样组织的：第一数据帧包括~5M行。每一行都需要与第二数据帧中的几行(通常超过1行)进行比较。第二个数据帧约为100,000行，每一行也对应于数据帧1中的多个条目。我尝试使用merge()连接这两个数据帧，并对新数据帧的每一行执行关联，但这会导致内存分配问题。生成的数据帧可能大于50m行，这太大了，无法处理。您是否有任何建议，在没有生成一个连接的数据框架的情况下，对多个比较进行比较？我看了一下apply衍生品，但找不到我想要的。

浏览 3提问于2014-11-17得票数 0

回答已采纳

1回答

从R中另一个数据帧中删除基于多列的数据帧中的行

、、

我希望删除具有与另一个数据帧中值匹配的列的特定值的行。 a<-c(1,1,2,2,2,4,5,5,5,5) b<-c(10,10,22,30,30,30,40,40,40,40) c<-c(1,2,1,2,2,2,2,1,1,2) d<-rnorm(1:10) data<-data.frame(a,b,c,d) a<-c(2,5) b<-c(30,40) c<-c(2,1) x<-data.frame(a,b,c) 这样你就可以变成： a b c d 1 10 1 -0.2509255 1 10 2 0.414

浏览 1提问于2015-08-11得票数 4

回答已采纳

1回答

用R中旧向量中的字符串创建一个新向量

、

在R演播室中处理数据帧。有一列名为PODMap的专栏有这样的句子：“在我的房产里，有一座38.1234,123.1234的房子，还有一辆车。”我想要创建新的列，一个用于纬度，另一个用于经度。 Fvalue是数据框架。到目前为止我已经 matches <- regmatches(fvalue[,"PODMap"], regexpr("..\\.....", fvalue[,"PODMap"], perl = TRUE)) 因为文本中唯一的句点是经度和纬度，所以返回每个字符串中列出的第一个lat或lat(仍然在寻找一个正则表达式以从纬度后面获取

浏览 0提问于2018-09-24得票数 0

回答已采纳

1回答

计算符合某一标准的人的平均数

、

我只想计算特定记录的平均值例如，我们有一个名为FurthestSlide的字段。此字段将包含数字。我们有另一个领域叫做SlideCount。这也是一个数字字段。我只希望它计算FurthestSlide不等于SlideCount数的记录的平均值。我想找的是那些没有看到整个消息的人的平均FurthestSlide号码。我不希望那些完成信息的人在数据中进行计算。样本数据： SlideCount=40 FurthestSlide=(30,20,40,40,40) 答案应该出现在25上。(30+20)/2

浏览 2提问于2014-03-20得票数 1

1回答

Pandas:如何从两个数据帧的联合中获取虚拟变量列？

、、、、

我有两个数据帧，每个数据帧都有相同的变量和行长，但分类变量(对象列)有时在一个和另一个中有不同的实现。这就是我的意思。 Frame 1 | categorical_1 | categorical_2 ||| Frame 2 | categorical_1 | categorical_2 row 1 | blue | flakes ||| row 1 | blue | flakes row 2 | red | cheerios ||| row 2 | red | flak

浏览 11提问于2019-01-13得票数 0

回答已采纳

1回答

在R中合并会产生比其中一个数据框更多的行

、、、

我有两个数据帧，第一个包含9994行，第二个包含60431行。我想合并两个数据帧，以便合并后的数据帧包含两个数据帧的组合列，但只包含9994行。然而，我在合并时得到了超过9994行。我如何确保这种情况不会发生？ df1 = readRDS('data1.RDS') nrow(df1) # [1] 9994 df2 = readRDS('data2.RDS') nrow(df2) # [1] 60431 df = merge(df1,df2,by=c("col1","col2")) nrow(df) # [1] 10057

浏览 2提问于2015-05-23得票数 7

1回答

使用模糊合并合并两个数据帧

、

我有两个数据帧，我必须合并。在两个数据帧中都有一列，我希望在该列上合并两个数据帧。但这两列中的数据并不相似。这两个数据帧中的关键列的长度为12位，另一个数据帧的长度为5 -6位。我想合并的基础上类似的5-6位从第二个数据帧。我的数据框： df1 = data.frame(CustomerId = c(987689000000,786581000000,765909000000,565400000000,746541000000,516890000000), Product = c(rep("Toaster", 3), rep("Radio", 3)))

浏览 11提问于2017-07-13得票数 1

回答已采纳

1回答

使用Pyspark从原始数据帧中删除行子集

、、、

浏览 0提问于2021-10-04得票数 0

3回答

将熊猫字符串列拆分为一个数组，并将该数组与另一个数组匹配。

、、

我有一个Pandas dataframe，看起来像这样： var1 var2 0 A_B_C_D 123 1 E_F_G_H 456 2 I_J_K_L 789 我希望通过在'_‘上拆分var1来查询数据帧，然后将其与我定义的另一个数组进行匹配。假设这个数组是array_to_match_to = ['A', 'B', 'C', 'D']，那么我想过滤数据帧，只得到行0。此外，我想匹配，无论顺序，所以匹配'D'，'A'，'B

浏览 4提问于2017-06-09得票数 2

回答已采纳

1回答

从MPEG-2传输流(H.264 -附件B)字节流中提取原始I帧图像数据

、、、、

上下文我试图从一个带有H.264附件B编解码器的MPEG-2传输流中提取每个i帧的原始图像数据。这段视频每隔2秒就包含I帧.我读过，在NALu启动代码之后，可以找到一个i帧，其类型为5(例如，IDR图片的编码片段)。这些NALu的字节有效负载包含构建完整帧所需的所有数据。虽然，我的理解是，以H.264编码格式。我想构建一个解决方案，从传入的字节流中提取这些i帧，方法是找到包含i帧的NALu，保存有效载荷，将有效负载解码成一些无处不在的原始图像格式来访问像素数据等等。注意:如果可能的话，我想避免使用、ffmpeg、等文件系统依赖二进制文件，更重要的是，如果可行的话！ PoC 到目前为止，

浏览 2提问于2020-03-05得票数 3

回答已采纳

1回答

独立的数值变量和范畴变量

、、、

我有一个数据集(42000，10)，其中包含7个分类特征和3个数字。我想把数字和分类特征分成两个不同的数据帧，即两个数据帧，其中一个只包含数字数据(42000，3)，另一个只包含分类数据(42000，7)，对它们执行一些预处理，最后将它们连接到一个数据框架中。那么，我的问题是如何根据数字和分类数据将我的初始数据分解为2呢？

浏览 0提问于2021-07-21得票数 0

回答已采纳

1回答

根据另一个数据帧替换数据帧中的字符串

、、

我有一个200k行的数据帧，其中有一个名为"departament_name“的字符列，该列中的一些值包含一个特定的字符："?”。例如："GENERAL SAN MART?N“、”UNI?N“等。我想使用另一个750k行的数据帧替换这些值，该数据帧包含一个也名为"departament_name”的列，但此列中的值是正确的。按照这个例子，它将是："GENERAL SAN MARTIN"，"UNION"，等等。我是否可以使用模式识别自动完成此操作，而无需创建字典(此问题有几个值)。我的目标是拥有一个统一的数据集，其中包含两个数据帧

浏览 3提问于2021-09-04得票数 0

3回答

筛选R数据帧以仅包括两个字符串之间有空格的行

我有一个数据帧，看起来像这样： v1 <- c('abies balsamifera','some trees','pizza','i like tacos','pinus taeda') v2 <- c(1,2,3,4,5) data <- data.frame(v1,v2) v1 v2 1 abies balsamifera 1 2 some trees 2 3 pizza 3 4 i like tacos

浏览 11提问于2017-02-23得票数 2

回答已采纳

2回答

2个pandas数据帧中的计数匹配

、、、

我有2个数据帧，每一行都包含文本作为列表。这个叫做df。 Datum File File_type Text Datum 2000-01-27 2000-01-27 0864820040_000127_04.txt _04 [business, date, jan, heineken, starts, integr.. 我有另一个，df_lm，看起来像这样 List_type Words 0 LM_cnstrain. [abide, abiding

浏览 0提问于2018-11-21得票数 1

2回答

将所有值字符串列数据帧与其他数据帧字符串列进行匹配

、

我有两个熊猫数据帧：数据帧1： ITEM ID TEXT 1 some random words 2 another word 3 blah 4 random words 数据帧2： INDEX INFO 1 random 3 blah 我想要将( dataframe 2的) INFO列的值与dataframe 1的TEXT列进行匹配。如果匹配，我希望看到一个新的列带有"1“。如下所示： ITEM ID TEXT MATCH 1 some random words

浏览 8提问于2020-03-11得票数 1

回答已采纳

2回答

如何包含父.gitignore排除的文件夹？

、

我有两个项目有单独的.gitignore文件。因此，项目结构如下： child-project- | images .gitignore main-project- | some source code images- .gitignore 现在，在父.gitignore中，我有一个行，比如images/，它排除位于父目录中的名为images的目录。但是，我有另一个名为images的文件夹，位于child-project目录中，我希望将它包括在内。我如何启用它？

浏览 3提问于2018-11-25得票数 3

回答已采纳

1回答

如何使用Python比较太大而无法放入内存的数据帧？

、、、

我有可能很大的数据帧，大约有10列和1e6行，具有不同的维度。假设行在两个数据帧中都是唯一的。由于这些数据帧不能加载到内存中，我如何找到一个数据帧中存在于另一个数据帧中的所有行？我目前只处理较小的数据帧，但我很快就会弄清楚这一点。我非常喜欢使用pandas，但我愿意使用不同的包(xarray?)如果有显著的好处。如果您推荐一个不同的包，请提供一些代码来进行比较。下面是我如何与内存中适合的pandas数据帧进行比较： import pandas as pd def row_intersection(df1, df2): noNA = df2.fillna(0) retur

浏览 23提问于2021-09-02得票数 0

回答已采纳

2回答

通过匹配r中的值和列名将数据帧的值合并到另一个数据帧

、、、

我有两个数据帧。 Var1 Freq 1 Cafeteria 1 2 Department 3 16 3 Lobby(TT) 2 X__1 Department1 Department2 Department3 Cafeteria Lobby(TT) Lobby(Music Band) 1 Joe 0 0 0 0 0 0 2 Oliver0 0 0

浏览 4提问于2017-12-25得票数 2

回答已采纳

2回答

列数不确定的特定列后面的求和行

假设我想在几个数据帧中求和行的值。我想从第2列开始，把每一个值加起来，这是在该列之后的。但是，不同的数据帧可能有不同的列数。我想它可以和 rowSums(df[2:X])。我只是不知道，用什么代替X。还是有一种完全不同的方法？问候

浏览 3提问于2020-05-07得票数 0

回答已采纳

1回答

在列"a“中查找两个不同数据集在列"b”中具有不同值的值

数据包含多列和3000行相同的OrderNo但不同的Ordertype。我想要得到两个数据帧中Ordertype不同的所有OrderNo。我已经从两个数据帧中分离出两列，并将它们设置为升序。然后，我尝试使用函数cbind来组合这两列，并查找其中一列中缺少的值。 xxx <- data.frame( orderNo = c(1:10), Ordertype = c("a", "b", "c", "d", "a", "b", "c", "d", "e

浏览 10提问于2019-09-30得票数 0

回答已采纳

1回答

合并替换pandas数据帧中的NAN

、、、

不确定是否有人问过这个问题。但我希望通过将数据帧与另一个数据帧合并来替换数据帧中的NaN值。数据框在某些列中包含NaN值。我根据id列中的值对这些列进行了分组。换句话说，就是col1，col2，col3中所有值的和乘以一个id数。 df_group1 = df.groupby('id')[['col1']].sum() df_group2 = df.groupby('id')[['col2']].sum() df_group3 = df.groupby('id')[['col3']].sum()

浏览 15提问于2020-06-22得票数 0

回答已采纳

3回答

在R中的Dataframe列中搜索多个元素

我有一个数据帧，我有一个ID列表，我想要搜索它们，以检查它们是否在该数据帧中。此数据帧如下所示： dput(bed,"mybed.bed") sample <- c("13874.p1", "13609.p1","12736.p1", "11970.p1","12025.p1","12189.p1","12529.p1","11522.p1","11716.p1","13684.p1") 我想返回数据帧中包含sam

浏览 4提问于2017-02-19得票数 1