如何从列表中删除空数据帧？

从列表中删除空数据帧可以通过以下步骤实现：

遍历列表中的每个数据帧。
检查每个数据帧是否为空。可以通过判断数据帧的长度或特定字段是否为空来确定。
如果数据帧为空，则将其从列表中删除。
继续遍历列表中的下一个数据帧，直到遍历完所有数据帧。

删除空数据帧的好处包括减少数据处理的复杂性和提高数据质量。删除空数据帧可以避免在后续处理过程中出现错误或异常情况。

以下是腾讯云相关产品和产品介绍链接地址，可以用于处理云计算中的数据帧：

腾讯云云服务器（Elastic Cloud Server，ECS）：提供可扩展的计算能力，用于部署和运行应用程序。产品介绍链接：https://cloud.tencent.com/product/cvm
腾讯云云数据库MySQL版：提供高性能、可扩展的关系型数据库服务，适用于存储和管理数据。产品介绍链接：https://cloud.tencent.com/product/cdb_mysql
腾讯云云原生容器服务（Tencent Kubernetes Engine，TKE）：提供高度可扩展的容器化应用程序管理平台，用于部署和管理容器化应用。产品介绍链接：https://cloud.tencent.com/product/tke

请注意，以上仅为示例产品，实际选择产品应根据具体需求和场景进行评估和选择。

如果不面对序列的真值是不明确的错误，我如何使用数据帧的子集？

我有一个列表，其中包含大约45个8列的数据帧。现在，我想根据特定列中出现的特定值来设置数据帧的子集。代码： for z in list_dataframes: if(z['Segmentation']=="FAST"): list_fast.append(z) 给我一个错误，说明一个级数的真值是模棱两可的。有人能告诉我怎么解决这个问题吗？附注:另一个完全不同的问题是如何从包含空和非空数据帧的数据帧列表中删除空数据帧。

浏览 23提问于2019-05-16得票数 0

1回答

通过分配空值从数据框中删除行

、、

我们可以使用空值赋值从列表中删除元素： someList<-list(1,2,3) someList[2]<-NULL 对于数据框列也是可能的，因为它是列表对象： someDf<-data.frame(a=1:4,b=2:5) someDf$a<-NULL 是否可以对数据帧或矩阵的行执行相同的操作？(我正在寻找一些快速的方法来消除行，由于我的算法的性质，我不能向量化，其中重要的部分包括行删除，我不能复制数据，因为那里的大小)

浏览 7提问于2014-06-16得票数 4

2回答

保留一个变量删除另一个列表中的R列表中的元素

、

我有一个包含149个元素的列表。这个列表的每个元素都是一个列表。这个列表中的每一个都有一个数据帧。每个数据帧有11列。每列有366个值。我如何保留这些变量和它们的结构，只擦除最后336个值？我尝试将空值与最后一个值关联，但收到错误消息 for (i in 1:149){ for (j in 1:11){ x[[i]][[1]][[j]][[366]] <- NULL } } 我希望它可以工作，但它没有: x[...] <- m中的错误:替换的长度为零

浏览 0提问于2019-10-19得票数 3

1回答

如何使用lapply从数据文件列表中删除空行？

、、

我有一个数据帧的列表。我的列表中有28个数据帧。一些数据帧有空行，但不是全部。如何使用lapply或类似的函数从列表中的所有数据帧中删除空行？下面是我从修改的尝试。不幸的是，这只返回那些空行。 #Get list of all files that will be analyzed filenames = list.files(pattern = ".csv") #read in all files in filenames mydata_run1 = lapply(filenames, read.csv, header = TRUE, quote = ""

浏览 2提问于2017-03-02得票数 2

回答已采纳

1回答

如何从(空)向量构建数据帧？

、、、

下面的代码片段将一对向量转换为数据帧，在一列中填充以指示出处(“状态”)，而另一列则表示类型(“成分”)。 overflow <- setdiff(c(21, 23, 27), c(21, 23)) underflow <- setdiff(c(11, 13, 17), c(17)) dfo <- data.frame("State"="over", Value=overflow) dfu <- data.frame("State"="under", Value=underflow) df <-

浏览 1提问于2018-08-16得票数 1

回答已采纳

1回答

对文件列表中的每个文件使用函数

我需要编写一个函数，该函数将从数百个数据帧中清除NA值，然后返回一个列表，其中包含每个数据帧中完整的行数。到目前为止，我有以下几点： complete_rows <- function(directory, id=1:332){ # reads directory of files file_list <- list.files(path = directory) # subsets the files the id argument calls for id_files <- file_list[id] # r

浏览 18提问于2020-09-05得票数 0

回答已采纳

4回答

如何从列表中删除空数据框？

我有几十个列表，每个列表都是11个数据帧的集合。一些数据框是空的(另一个脚本没有输出任何数据，不是bug)。我需要通过一个函数来推送每个列表，但是当它看到一个空的数据帧时，它就会卡住。那么我该如何编写一个函数，它将接受一个列表，对每个元素(即数据帧)执行dim操作，如果它是0，则跳到下一个元素。我尝试了这样的东西： empties <- function (mlist) { for(i in 1:length(mlist)) { if(dim(mlist[[i]])[1]!=0) return (mlist[[i]]) } } 但很明显，这并不管用。我会在这一

浏览 0提问于2010-07-16得票数 25

回答已采纳

2回答

删除pandas 0.23+中的空列

、

在早期版本的pandas中，您只需使用以下命令即可删除空列： df.dropna(axis='columns') 然而，dropna在后来的构建中已经被贬低了。现在如何从数据帧中删除多个(而不是专门索引)空列？

浏览 1提问于2018-08-11得票数 15

回答已采纳

3回答

删除数据文件列表中的NA值

、、、

我相信有一个很简单的答案，但我找不到。在另一篇文章中，我看过从数据帧列表中删除一个空数据帧。但是，如果列表中的某一项不是数据框架而只是NA值，那么如何才能做到这一点呢？稍微修改上述问题的参数，您可以： M1 <- data.frame(matrix(1:4, nrow = 2, ncol = 2)) M2 <- NA M3 <- data.frame(matrix(9:12, nrow = 2, ncol = 2)) mlist <- list(M1, M2, M3) 我想在这个实例中删除M2，但是我有几个这些空数据帧的示例，所以我想要一个同时删除它们的函数。我尝试

浏览 1提问于2018-11-07得票数 0

回答已采纳

2回答

空的pandas数据帧填充了随机值，如何让它全部NaN？

、、、、

我试图用python中的pandas和numpy创建一个空的数据帧，因此一个充满NaN的数据帧，但每次它似乎都充满了值。为什么会发生这种情况，我如何创建一个空的？这是我已经尝试过的： data_class_b = pd.DataFrame(np.NaN, index=range(len(df)), columns=[0,1]) data_class_b = pd.DataFrame(np.empty((len(df),2))) 我使用的方法是基于对有关制作空数据帧的问题的回答，在这些问题中，他们声明它们应该起作用。但是我没有得到想要的结果。那么如何创建一个空的数据帧呢？

浏览 0提问于2020-11-19得票数 0

1回答

R:如何在列表中找到空的dfs？

、

我想在我的列表中找到空数据帧。这里是一个基本的例子： lst <- list("111.2012"=data.frame("Area"=1, "Value"=2), "112.2012"=data.frame("Area"=c(1:5), "Value"=c(6:10))) lst <- lapply(lst, function(x) x[-1,]) 如何在lst中使用lapply找到我的空df，因为列表中有超过1500个dfs？我需要与示例中的元素名称类似的元素

浏览 0提问于2015-12-26得票数 0

回答已采纳

1回答

如何从Scala中的数据帧序列中删除空数据帧

、、、

如何从数据帧序列中删除空数据帧？在下面的代码片段中，twoColDF中有许多空的数据帧。下面的for循环的另一个问题是，有没有一种方法可以让它更有效？我试着将它重写到下面的代码行，但是不起作用 //finalDF2 = (1 until colCount).flatMap(j => groupCount(j).map( y=> finalDF.map(a=>a.filter(df(cols(j)) === y)))).toSeq.flatten var twoColDF: Seq[Seq[DataFrame]] = null if (colCount == 2 )

浏览 0提问于2016-11-29得票数 0

1回答

R:如何从这个列表中的所有数据帧中删除行？

假设我有一些像这样的数据 n <- 3 K <- 4 dat <- expand.grid(var1=1:n, var2=1:K) dat看起来是这样的： var1 var2 1 1 1 2 2 1 3 3 1 4 1 2 5 2 2 6 3 2 7 1 3 8 2 3 9 3 3 10 1 4 11 2 4 12 3 4 我想同时从列表中的两个数据帧中

浏览 2提问于2015-10-17得票数 2

回答已采纳

3回答

根据行号过滤列表中存储的数据帧

、、

我有以下问题。我在列表环境中存储多个数据帧。我编写了一个循环，用于遍历列表中的数据帧并删除过短的数据帧。但不知何故，从列表中删除数据帧并不成功。 datalist # a list containing data frames for (i in 1:length(datalist)) { datset <- datalist[i] if (nrow(datset) < 25) { sub_name <- names(datset) datalist <- datalist[-sub_name] } } 我感谢每一个人的帮助。

浏览 28提问于2021-02-05得票数 0

回答已采纳

1回答

pyspark中的RDD到DataFrame (来自rdd的第一个元素的列)

、、、、

我已经从csv文件创建了rdd，第一行是该csv文件的标题行。现在，我希望从该rdd创建数据帧，并保留rdd的第一个元素中的列。问题是我可以从rdd.first()中创建数据帧和列，但是创建的数据帧的第一行本身就是头。如何去除它？ lines = sc.textFile('/path/data.csv') rdd = lines.map(lambda x: x.split('#####')) ###multiple char sep can be there #### or #@# , so can't directly read csv to a

浏览 1提问于2016-10-26得票数 4

回答已采纳

3回答

如何从内存中删除多个pandas (python)数据帧以节省内存？

、、、、

我已经创建了很多数据帧作为预处理的一部分。由于我限制了6 6GB的内存，我想从内存中删除所有不必要的数据帧，以避免在scikit-learn中运行GRIDSEARCHCV时耗尽内存。 1)是否有一个函数可以只列出当前加载到内存中的所有数据帧？我尝试了dir()，但它提供了许多数据帧以外的其他对象。 2)我创建了一个要删除的数据帧列表 del_df=[Gender_dummies, capsule_trans, col, concat_df_list, coup_CAPSULE_dummies] 范围(&R) for i in del_df: del (i) 但它不会删

浏览 1提问于2015-08-27得票数 52

1回答

如何在R中使用lapply对包含多个数据帧的列表进行采样？

、、

我在数据帧上使用split创建了以下数据列表： dat_discharge = split(dat2,dat2$discharge_id) 我正试图通过采样从该数据列表中创建训练和测试集，以便考虑在数据中根本不均匀分布的放电id组。我正在尝试使用lapply来完成此操作，因为我不希望对列表中的每个组进行单独采样。 trainlist<-lapply(dat_discharge,function(x) sample(nrow(x),0.75*nrow(x))) trainL = dat_discharge[(dat_discharge %in% trainlist)] testL

浏览 24提问于2021-03-03得票数 0

回答已采纳

2回答

翻转dataframe中的Python追加行

、、

我将一个数据集从CSV文件导入到Python中的dataframe。我想从这个dataframe中删除一些特定的行，并将它们附加到一个空的dataframe。到目前为止，我已经尝试从名为df的“大”数据帧中删除第1行和第0行，并使用以下代码将它们放入dff中： dff = pd.DataFrame() #Create empty dataframe for x in range(0, 2): dff = dff.append(df.iloc[x]) #Append the first 2 rows from df to dff #How to remove appended

浏览 32提问于2020-11-17得票数 0

1回答

删除并释放单个pandas数据帧的内存

、、

我在pandas中运行了一个很长的ETL管道。我必须创建不同的pandas数据帧，并且我想为一些数据帧释放内存。我一直在阅读如何释放内存，我发现运行此命令不会释放内存： del dataframe 下面是这个链接：How to delete multiple pandas (python) dataframes from memory to save RAM?，其中一个答案说del语句并不删除实例，它只是删除了一个名称。在答案中，他们说将数据帧放在列表中，然后删除列表： lst = [pd.DataFrame(), pd.DataFrame(), pd.DataFrame()] del

浏览 171提问于2020-10-15得票数 2

回答已采纳

1回答

删除数据帧列表中的部分名称-R

、、、

在这个数据帧的虚拟列表中，所有列名都有前缀和下划线。列表中的每个数据帧都有不同的前缀，但它们都包含一个下划线。如何删除列表中所有数据帧的列名中的下划线和前面的文本？我可以单独做，但我真正的列表包含了更多的数据帧。谢谢 #add diferent prefixes to all col names colnames(iris)<-paste('iris_',colnames(iris), sep='') colnames(mtcars)<-paste('mt_',colnames(mtcars), sep='')

浏览 0提问于2018-07-18得票数 2

回答已采纳

2回答

在使用bind_rows()之前，如何删除列表中的空数据？

我有一个混合了数据、数据和空列表的列表。在应用bind_rows来追加其他数据帧之前，如何删除tibble和空列表？我尝试使用delete.NULLs函数，但出现了一个错误：错误:找不到函数"delete.NULLs“

浏览 0提问于2019-04-19得票数 3

回答已采纳

1回答

R:我如何将数据帧附加到列表中？

、、、、

我有一个for循环，它读取.csv文件的列表，清理它们，并将输出导出为一个新的.csv文件。在输出.csv文件之前，我希望将干净的数据帧添加到某种类型的列表中，以便在进程结束时(在for循环中我正在清理的大约36个.csv文件)，我可以将所有清理过的数据帧合并到一个大数据帧中，然后作为一个.csv导出。下面是我在代码开头(在循环之前)初始化的空列表的一个示例： csv_list <- vector(mode = "list", length = 36) 当我运行循环时，数据帧不会按预期的方式追加。列表不是添加到现有的列(数据具有相同的行名和列名，只是不同的值)，而是简单

浏览 4提问于2020-06-10得票数 2

回答已采纳

1回答

如何在R中绑定忽略为空值的数据帧列表

、、

我有一个数据帧列表，我想使用bind_rows()来组合所有的数据帧。但是，其中一个数据帧是空的(没有值，只有列名)。当我尝试使用bind_rows(list)时，我得到一个错误“无法将字符组合成逻辑。我能够组合它们的唯一方法是手动设置空的dataframes = NULL。然而，这是一个非常重复的工作，因为我需要找到空数据帧的索引，然后将它们设置为null。我想知道bind_rows()中是否有一个参数可以忽略空的数据帧，只合并有值的数据帧。

浏览 12提问于2021-08-24得票数 1

回答已采纳

1回答

SQL SELECT WHERE meta_keywords =‘[’]‘

、、、

我在查询表中的'['']'时遇到了问题。数据是从具有数据类型对象的pandas数据帧中插入的(如果重要的话)。 ? 我想做一个没有空列表的视图。我尝试过用'['']'，'["''"]'等不同的方式来写空列表，但是我不能让它工作。ex where meta_keywords <> '['']'

浏览 21提问于2021-05-06得票数 0

回答已采纳

1回答

使用for循环遍历列表中的数据帧

、、、

我是pandas/python的新手。所以我正在读取一个.xlsx文件，在其中我创建了一堆数据帧，准确地说是16个，一个主数据帧是空的。现在，我想使用for循环将所有这16个数据帧逐个附加到主数据帧。 1个我想过要迭代列表的方法。但是，这些df_1、df_2等是否可以存储在一个列表中，然后我们可以遍历它们。假设我有一个csv文件， df1 = pd.read_csv('---.csv') df2 = pd.read_csv('---.csv') 然后我创建了一个列表， filenames = ['---.csv','---.csv

浏览 4提问于2018-02-26得票数 0

1回答

使用.concat创建pandas数据帧时包含空序列

、、、

更新:至少从pandas 0.18.1版本开始，这不再是一个问题。连接空序列不再丢弃它们，所以这个问题已经过时了。我想使用.concat从系列列表中创建一个pandas数据帧。问题是，当其中一个序列为空时，它不会包含在结果数据帧中，但是当我随后尝试用多索引重命名它的列时，这会使数据帧成为错误的维度。更新:这里有一个例子... import pandas as pd sers1 = pd.Series() sers2 = pd.Series(['a', 'b', 'c']) df1 = pd.concat([sers1, sers2], axi

浏览 2提问于2015-05-29得票数 6

回答已采纳

2回答

我可以用空单元格“展平”一列吗？

、、

例如，下面有一个包含多列和多行的数据帧，其中最后一列只包含一些行的数据。如何获取最后一列并将其写入到新数据帧中，同时删除如果只复制整个列就会保留的空单元格？ Part Number Count Miles 2345125 14 543 5432545 12 6543654 6 112 6754356 22 5643545 6 7657656 8 23 7654567 11 231 3455434 34

浏览 1提问于2020-06-05得票数 0

1回答

函数来保持0行数据帧的输出。

、、、

我有一个数据帧df_list列表，我想将其转换为单个数据帧out_df。对于函数rbindlist来说，这很简单，但我这里唯一的问题是，只有非空的数据文件才会保存在输出数据中。我知道填充选项使用NAs填充缺失的列，方法是： out_df<- rbindlist(df_list, fill=TRUE) 但是，我还想做的是从输入列表中保留和填充丢失的行。怎样才能做到这一点？提前谢谢。

浏览 5提问于2022-10-10得票数 -2

1回答

如何从数据帧列表中创建测试数据框架列表并对其进行训练

我正在尝试从列表中的多个数据帧创建多个测试和训练数据集。因此，我得到了“1:nrow(df)：长度为0的参数中的错误”，并且不知道如何解决它。我已经手动更新了列表，没有for循环，而且它工作得很好。但是，由于某种原因，当我试图使用for循环重复这个过程时，就会得到错误。我首先从虹膜数据集创建了一个3帧迷你数据帧。 x <- 3; # split the data into 3 mini data frames set.seed(1) df_list<- split( as.data.frame(iris), sample(x,nrow(iris),replace=TRUE)) 而

浏览 4提问于2015-09-11得票数 0

回答已采纳

0回答

按行值过滤pandas数据框时出现问题？

、、

我有以下熊猫数据框架： Col 0 [] 1 [] 2 [(foo, bar), (foo, bar)] 3 [] 4 [] 5 [] 6 [] 7 [(foo, bar), (foo, bar)] 我想删除所有的空列表(*)： Col 2 [(foo, bar), (foo, bar)] 7 [(foo, bar), (foo, bar)] 为了实现上述目标，我尝试了： df = df.loc[df.Col != '[]'] df 和 df.pipe(lambda d: d[d['Col'] !=

浏览 5提问于2017-01-05得票数 2

回答已采纳

1回答

如何在pyspark中设置setCheckpoint

、

我不太了解火花。在我拥有的代码的顶部 from pysaprk.sql import SparkSession import pyspark.sql.function as f spark = SparkSession.bulder.appName(‘abc’).getOrCreate() H = sqlContext.read.parquet(‘path to hdfs file’) H大约有3000万条记录，将在循环中使用。所以我写了 H.persist().count() 我有一个包含50个字符串L = [s1,s2,…,s50]的列表，每个字符串都用来从H构建一个小的数据帧，这些数据

浏览 6提问于2019-02-17得票数 2

3回答

从dataframe中删除空行

、、

我有一个数据帧，在行中包含空值 ? 如何删除这些空值？我已经尝试了data.replace('', np.nan, inplace=True)和data.dropna()，但这并没有改变任何事情。还有什么其他方法可以从数据帧中删除空行？

浏览 67提问于2021-03-31得票数 0

回答已采纳

1回答

Python追加只留下dataframe中的最后一项

、

我已经创建了一个通过DB系统连接的函数，然后传递下图中的值：接下来，我使用了我的函数并遍历了下面的代码： df_tmp = pd.DataFrame([]) df_master = [] #Convert this to a list instead of a PD Dataframe for i in PI_tags: df_tmp = df_tmp.append(ReadPiValues(i, interval, start_date, end_date)) df_master.append(df_tmp) 我的理解是，根据append的工作原理，它不应该重写

浏览 29提问于2018-07-10得票数 1

1回答

在R中，对数据帧中的行进行足够的采样，使所有列都不为空

、、、

我在R中有一个很大的数据帧df，它有很多列和多个NAs，但是没有一个列是完全NA的。我对这些列的特定列表col_list感兴趣。我想要一个数据帧样本，以便每列至少表示一次。我的想法是通过map_dfr对列的列表进行“迭代”，过滤df到每一列不是NA的地方，然后从那里采样一行，如下所示。 library(tidyverse) col_list %>% map_dfr(function(name){ df %>% filter(!is.na(name)) %>% sample_n(1) }) %>% select(a

浏览 24提问于2021-09-01得票数 1

回答已采纳

1回答

R:从数据帧列表中的每个数据帧中抽取随机行。

我似乎很难从我的数据帧列表中的每个数据帧中抽取一个随机行。下面是用于复制列表的代码： output <- list() iterations <- 5 for(i in 1:iterations){ output[[i]] <- mtcars <- mtcars[sample(nrow(mtcars), size = 15, replace = FALSE), ] } 在获得数据帧列表之后，我的目标是从每个数据帧中获取一个随机行，然后将抽样行添加到一个编号列表中，每个行作为数据帧。我想我可能不得不使用"map“函数，但我不知道如何做到这一点。任何

浏览 7提问于2022-02-23得票数 1

回答已采纳

1回答

删除熊猫数据框架中的空列

、、、

如何删除熊猫数据帧中的空列。但是，这些空列没有任何NaN值。在运行dataframe之后，我获得了这种类型的输出。我想移除这些空列，这些列附在图像中。在我的dataframe中，没有NaN或NA值，只有空条目。

浏览 1提问于2022-03-28得票数 0

回答已采纳

1回答

删除字典中的空数据帧

、

我有一个名为frames的字典，里面有数据帧，它根据不同的因素总结了我的数据源。其中一些组合返回空摘要，这些数据帧也是空的。我的问题是如何从我的字典中删除这些空的数据帧？我尝试了下面的方法，但它们仍然存在。 new_frames = {k:v for (k,v) in frames.items() if v is not None} 谢谢

浏览 11提问于2019-11-23得票数 0

回答已采纳

3回答

对R中列表中的数据帧进行排序

假设我的数据帧名为df1 to df20。这些数据帧在列表中。列表中数据名气的顺序是"df1“、"df10”、"df11“、"df12"，如何才能使其成为"df1”、"df2“、"df3”、"df4“？

浏览 5提问于2021-02-10得票数 2

回答已采纳

1回答

如何根据从['Seen_A']列中挑选2的随机列表，将数据帧分割为训练和验证数据集(如下图所示)

、

如何基于从列中挑选2个的随机列表将数据帧分割为训练和验证数据集(如下图所示)。即通过在数据帧列中随机选取几个列表来将其分割成两个数据帧 ?

浏览 14提问于2021-10-21得票数 0

2回答

如何将数据帧列表保存到csv

、、、、

我有一个重新洗牌的数据帧列表，然后我想将输出保存为csv。为此，我尝试将此列表附加到一个空数据框中： l1=[year1, year2,..., year30] shuffle (l1) columns=['year', 'day', 'tmin', 'tmax', 'pcp'] index=np.arange(10957) df2=pd.DataFrame(columns=columns, index=index) l1.append(df2) 这会导致具有一堆Nans的空数据帧。我不一定需要将重新洗牌的列表附加

浏览 0提问于2016-04-27得票数 0

回答已采纳

1回答

R中两个数据帧之间的统计运算

、、

我有两个大的数据帧，一个是模拟数据，另一个是观测数据。列表示要比较的点，行表示小时数。 dim(SIM) [1] 400 1000 dim(OBS) [1] 400 1000 400是小时数，1000是我想要比较的点。观测数据帧也包含大量的NA值。因此，当我尝试在两个数据帧上应用该函数时： BIAS <- function(x, y) { x <- na.omit(x) y <- na.omit(y) res <- mean(x - y) } NA值从观测数据帧中删除，该数据帧最后为空，因为每行至少有一个NA。我如何重新定义它，以便执行

浏览 0提问于2013-06-24得票数 1

回答已采纳

1回答

如何在R中压缩多个数据帧的全局环境？

我有一个超过30个数据帧的全球环境，随着我写的更多，这个环境会变得更满。我需要使用每个变量中的数据为观察值创建单独的数据帧(几乎就像它们是单独的组一样)。这就是为什么它这么大的原因。数据帧都具有相同的数据和列名： ID VOne VTwo VThree VFour 123 2 1 1 1 101 3 1 1 1 ID VOne VTwo VThree VFour 140 1 3 1 1 112 1 3 1 1 11

浏览 1提问于2021-01-05得票数 0

1回答

pyspark:可以向空的dataframe或rdd添加行吗？

、

我有一个dataframe (从hive表创建)。我已经将数据帧转换为RDD，并且正在逐行检索。在每一行上，我解析每个列值，如果某个特定的列无效，则使用列名和值添加到字典中。然后我检查字典是否为空。如果不为空，我想将该行添加到数据帧中。同样，在下一行上继续进行相同的解析。我已经使用表模式创建了一个空的数据帧。是否可以将行添加到空的数据帧中，以便在结束时可以将数据帧保存到error_log_table。另外，如果你有更好的方法，请提出建议。我正在考虑向原始数据帧中添加一个新列，如果该行无效，请将该行的列值修改为“T”。通过这个，我可以过滤掉无效的行。我不确定如何单独更新该特定无效行的新列值

浏览 0提问于2016-06-30得票数 1

1回答

访问pandas数据帧的列中列表中的字典的值

、

我在pandas dataframe中有一个列，其中每一行都是一个列表，其中包含一个字典，如下所示： urls --------------------------------------------------------- [{'url': http://t.co, 'expanded_url':http://nytimes.com}] [{'url': http://t.co, 'expanded_url':http://time.com}] [] 某些行只有一个空列表。因此，我尝试仅提取expanded_url的值，当我

浏览 6提问于2016-09-19得票数 2

回答已采纳

1回答

Pandas:在迭代中连接数据帧

、

我想用pandas.concat在一个循环中连接数据帧。它们具有相同的列，但不同的索引和值，并且它们是在循环中生成的。这样，输出数据帧将在从空数据帧开始的迭代中“增长”。对于列表，它将如下所示： a = [] for i in range(10): a.append(i**2) 然而，我发现将数据框设为空是不可取的。唯一的解决方案是在循环之前获得第一个数据帧，并在循环中连接第二个，第三个，...数据帧？ Jarek

浏览 1提问于2021-09-23得票数 1

1回答

Pyspark 'for‘循环没有使用.filter()正确过滤pyspark-sql数据帧。

、、、、

我正在尝试创建一个for循环，首先:过滤一个pyspark sql数据帧，然后将过滤后的数据帧转换为pandas，对其应用一个函数，并将结果添加到一个名为results的列表中。我的列表包含一个字符串序列(这将是dataframe中的某种id )；我希望for循环在每次迭代中从列表中获取一个字符串，并过滤dataframe中id为该字符串的所有行。示例代码： results = [] for x in list: aux = df.filter("id='x'") final= function(aux,"value")

浏览 21提问于2020-12-16得票数 1

回答已采纳

1回答

将A列数据帧A中的值与数据帧B中的云B进行匹配，并使用pandas从数据帧A中创建无匹配列表

、、

正在尝试从数据帧A中的列A获取值ID的列表，该列表与数据帧B中列B的值ID不匹配。数据帧A，列A将只有一个值实例-其中，作为数据帧B，列B可以有多个值实例。我想要得到一个数据帧，它包含数据帧A中的所有行，其中的值在数据帧B中不匹配。这就是我得到的--但它有很多匹配。 def get_hours_id(labor_excel, people_excel): df = pd.read_excel(labor_excel) df1 = pd.read_excel(people_excel) internal_id_people_list = df1['ID'

浏览 5提问于2019-11-27得票数 0

回答已采纳

1回答

排除列表中的一个数据帧

、、

我使用下面的代码将所有数据帧合并到列表中。 dflist <- Filter(is.data.frame, as.list(.GlobalEnv)) 但希望将一个数据帧排除在列表中。就像在10个数据帧中一样，我需要将9个数据帧添加到列表中，另一个需要被排除在外。

浏览 0提问于2018-02-01得票数 0

回答已采纳

1回答

计数和收集操作在空的spark数据帧上占用了大量时间

、

我用spark.createDataFrame([]，schema)创建了一个空的spark数据框，然后从列表中添加行，但是访问数据框( count-collect)花费了太多的时间，而不是在这个数据框上。对于从Csv文件创建的数据框上的1000行，函数dataframe.count()耗时300ms，但对于从模式创建的空数据框，则需要4秒。这里的差异是从哪里来的？ schema = StructType([StructField('Average_Power',FloatType(),True), StructField('Average_Temperature&

浏览 28提问于2019-07-02得票数 0

回答已采纳

1回答

如何使用rest调用将一个数据帧的模式应用到另一个空数据帧

、、

我有两个数据集: df1和df2，df1有带模式的数据。 df2是未应用架构的空数据帧。使用数据代理，我能够从df1中提取模式 { "foundrySchema": { "fieldSchemaList": [ {... } ], "primaryKey": null, "dataFrameReaderClass": "n/a", "customMetadata": {} }, "rows": [] } 如何通过

浏览 40提问于2021-05-04得票数 2

回答已采纳