包含多个值和pandas数据帧的缺失值的单个列表

缺失值是指在数据集中某些位置上缺少数值或者包含空值的情况。在处理包含多个值和pandas数据帧的缺失值的单个列表时，可以采取以下方法：

检测缺失值：使用pandas库中的isnull()函数可以检测数据集中的缺失值。该函数返回一个布尔类型的数据集，其中缺失值对应的位置为True，非缺失值对应的位置为False。
处理缺失值：可以使用pandas库中的dropna()函数来删除包含缺失值的行或列。该函数可以根据需求指定删除行或列的方式，并返回一个新的数据集。
填充缺失值：使用pandas库中的fillna()函数可以填充缺失值。该函数可以根据需求指定填充的方式，如使用均值、中位数、众数等进行填充。
插值缺失值：使用pandas库中的interpolate()函数可以进行缺失值的插值。该函数可以根据缺失值前后的数值进行线性插值或者其他插值方式。
处理缺失值的应用场景：在数据分析和机器学习领域，处理缺失值是非常重要的一步。缺失值的存在可能会导致数据分析结果的偏差或者机器学习模型的不准确性。因此，在进行数据分析和机器学习任务时，需要对缺失值进行适当的处理。

推荐的腾讯云相关产品和产品介绍链接地址：

腾讯云数据分析平台：https://cloud.tencent.com/product/dla
腾讯云机器学习平台：https://cloud.tencent.com/product/tiia
腾讯云大数据平台：https://cloud.tencent.com/product/emr
腾讯云人工智能平台：https://cloud.tencent.com/product/ai

获取pandas数据帧列表条目中的数字条目

、、

我有一个包含多个列的pandas数据帧，其中一个是我使用split命令拆分成列表的字符串： import Pandas as pd csvRead = pd.read_csv('../data/Data.csv') df = pd.DataFrame(csvRead) df['split_string'] = df['string'].str.split(r'[ ]') idx = 0 for i in df['split_string']: d

浏览 24提问于2018-12-13得票数 2

回答已采纳

1回答

将多值字典转换为pandas数据帧

、、、、

我想把这个dict转换成一个pandas dataframe，其中每个键变成一列，列表中的值变成行： my_dict： {'Last updated': ['2021-05-18T15:24:19.000Z', '2021-05-18T15:24:19.000Z'], 'Symbol': ['BTC', 'BNB', 'XRP', 'ADA', 'BUSD'], 'Name': ['Bitcoin', 'Bi

浏览 8提问于2021-05-18得票数 1

回答已采纳

1回答

从稀疏数据集中删除列和行

、

我有一个包含许多空值的稀疏Pandas数据帧，我希望对其进行过滤，以便在最终数据集中只保留具有超过10个浮点型条目的行和列。我尝试使用现有的代码片段，但似乎不起作用： df.drop([col for col, val = df.count(axis=1, numeric_only='float') if val < 10], axis=1, inplace=True) 谁能告诉我在我的数据帧中删除稀疏列的最好方法是什么？

浏览 16提问于2020-06-29得票数 3

1回答

在Pandas中将分类要素转换为数值要素时出错

、、

我的数据帧包含一个分类特征'Street‘，它可以接受两个可能的值'Grvl’或'Pave‘中的一个。我正在尝试在拟合ML算法之前将这个分类特征转换为数值。我的代码如下所示 dataset['Street']=dataset['Street'].map({'Grvl':0,'Pave':1}).astype(int) 我已经用数据帧中出现次数最多的值填充了缺少的值 dataset['Street'].isnull().sum() 我收到以下错误 ValueError

浏览 6提问于2017-07-25得票数 1

1回答

使用pandas重新排列数据帧

、

我得到了以下数据帧： import pandas as pd test = pd.DataFrame([["Bugatti","Veyron"], ["Bugatti","Chiron"], ["VW","Golf"], ["VW","Passat"], ["VW","Polo&

浏览 7提问于2019-11-28得票数 0

回答已采纳

1回答

使用concat作为字典我得到错误:第一个参数必须是可迭代的pandas对象，你传递了一个"DataFrame“类型的对象

、、、

我有一个包含数据帧的字典，看起来像这样： dataframes = {'Df_20100101': DataFrame, 'Df_20100102': DataFrame, 'Df_20100103': DataFrame} 所有数据帧都有相同的变量(价格、数量和日期)和相同的索引。我想把所有不同的数据帧放入一个数据帧中。我使用以下代码： df = pd.concat([pd.concat(v,ignore_index=True) for k,v in dataframes.items()]) 但是，我得到一个错误：the first argum

浏览 10提问于2019-10-23得票数 0

回答已采纳

2回答

将空字符串替换为列的模式

、

我有以下pandas数据帧： df = pd.DataFrame([["hitesh","","HAIK"],["hitesh","red","ll"],["haikent","red","tt"],["","","HAIK"]]) 我正在尝试将数据帧的空字符串替换为每列的相应模式。我在努力 df= df.replace("" , df.mode()[0]) 但这只是用第一列模式替换了数

浏览 9提问于2017-03-10得票数 2

回答已采纳

1回答

使用tpot的分类数据

、

我正在尝试将tpot与我在pandas数据帧中的输入一起使用。我一直收到错误： TypeError:输入类型不支持ufunc 'isnan‘，根据转换规则''safe'’，无法将输入安全地强制转换为任何支持的类型我相信这个错误是因为isnan无法处理我的数据结构，但我不确定如何以不同的方式格式化它。我有分类输入和连续输入以及连续输出的组合。下面是一个包含相似数据的代码示例： train_x=[[1,2,3],['test1','test2','test3'],[56.2,4.5,3.4]] train_y=[[3

浏览 8提问于2018-04-14得票数 4

1回答

组合一个数据文件列表

、、、

我有一个有几个..csv文件的文件夹。每个包含数据的时间，高，低，开放，Volumefrom，Volumeto，加密货币关闭。我成功地将.csvs加载到一个数据文件列表中，并删除了列Open、High、Low、Volumefrom、Volumeto，这是我不需要的，给我留下了时间，并关闭了每个数据帧。现在我想把数据列表组合成一个数据，索引以最小的硬币的时间戳开始，在这个例子中是iota。这是我到目前为止编写的代码： import pandas as pd import os # Path to my folder PATH_COINS = r"C:\Users\...\C

浏览 1提问于2018-09-25得票数 0

2回答

如何在pandas dataframe中使用列表作为值？

、、、、

我有一个数据帧，它要求列的子集具有具有多个值的条目。下面是一个包含“runtime”列的dataframe，其中包含程序在各种条件下的运行时： df = [{"condition": "a", "runtimes": [1,1.5,2]}, {"condition": "b", "runtimes": [0.5,0.75,1]}] df = pandas.DataFrame(df) 这就形成了一个数据帧： condition runtimes 0 a [1,

浏览 0提问于2014-11-08得票数 8

回答已采纳

1回答

如何使用Python检查Pandas值为null或零

、

我用Pandas创建了一个包含数字的数据框架。我需要检查从这个数据帧中提取的值是空值还是零值。因此，我尝试以下几点： a = df.ix[[0], ['Column Title']].values if a != 0 or not math.isnan(float(a)): print "It is neither a zero nor null" 虽然它看起来确实有效，但有时我会遇到以下错误： TypeError: don't know how to convert scalar number to float 我做错了什么？

浏览 1提问于2017-07-25得票数 1

回答已采纳

2回答

使用Pandas进行条件切片(优雅的方式)

、

我需要根据一些标准拆分整个数据帧(Pandas)。例如： import pandas as pd import numpy as np a = np.random.random(size=(1,10)) b = np.random.randint(100,size=a.shape) df = pd.DataFrame(array((a,b)).T,columns=['a','b']) 现在，如果我想将数据帧分成两部分，其中df'a‘>= 30和df'a’< 30 df_two = [df[df['a'] < 3

浏览 4提问于2017-02-28得票数 2

回答已采纳

2回答

追加在for循环中生成的pandas数据帧

、

我在for循环中访问一系列Excel文件。然后，我将excel文件中的数据读取到pandas数据帧中。我想不出如何将这些数据帧附加在一起，然后将数据帧(现在包含所有文件中的数据)保存为新的Excel文件。这是我尝试过的： for infile in glob.glob("*.xlsx"): data = pandas.read_excel(infile) appended_data = pandas.DataFrame.append(data) # requires at least two arguments appended_data.to_excel(&

浏览 2提问于2015-02-23得票数 111

回答已采纳

2回答

Python -数据帧的维度

、

Python新手。在R中，可以使用dim(...)获得矩阵的维数。Python Pandas中对应的数据帧函数是什么？

浏览 6提问于2012-12-18得票数 94

回答已采纳

2回答

如何在同一个Pandas dataframe单元格的列表元素之间换行？

、

浏览 199提问于2019-09-28得票数 0

回答已采纳

1回答

如何在Pandas合并函数中传递关键字参数

、

我有以下数据帧列表： import pandas as pd rep1 = pd.DataFrame.from_items([('Probe', ['x', 'y', 'z']), ('Gene', ['foo', 'bar', 'qux']), ('RP1',[1.00,23.22,11.12])], orient='columns') rep2 = pd.DataFrame.from_items([('Probe',

浏览 3提问于2015-02-10得票数 2

回答已采纳

2回答

Pandas:解释列表数据类型列表？

、、

从文件中读取分隔数据时，pandas库能够解释数据列的类型。当向pandas数据帧传递通过pandas之外的某个过程组装的字符串列表时，pandas会将内部列表类型保留为字符串： data = [ ['1','2'],['3','4'] ] cols = ['foo', 'biz'] df = DataFrame(columns=cols, data=data) print(numpy.sum(df.values)) $: <literal sum of the strings>

浏览 12提问于2020-07-22得票数 2

回答已采纳

3回答

任务:我正在尝试从字典列表中创建一个pandas数据帧。问题:这会为每个字典项创建一个数据帧

、、、

我正在尝试从三个列表创建一个dataframe，这三个列表是我使用网络抓取的数据生成的。但是，当我尝试将这些列表转换为字典，然后使用它们来构建我的pandas数据帧时，它会为每个字典项(行)输出一个数据帧，而不是将所有这些项都作为行包含在数据帧中的一个数据帧。我认为问题出在我用来网络抓取数据的for循环中。我知道在这个问题上也有人问过类似的问题，包括这里的Pandas DataFrame created for each row和这里的Take multiple lists into dataframe，但我已经尝试了这些解决方案，但没有任何乐趣。我相信网络刮擦循环增加了一个细微的差别，使

浏览 24提问于2020-08-19得票数 0

1回答

通过对包含另一列中字符串值的子集的字典进行映射来创建dataframe列。作为它的关键

、、、

我有一个字典商店，它将outlet的名称作为键，将outlet的种类作为其值 stores = {'McDonalds':'Fast food','African and Eastern Beverage':'Alcohol','Baskin Robbins': 'ice Cream'} 我有一个pandas数据帧，其中包含插座的名称和分支位置(在Merchant列中)，其中一些包含MerchantType的NaN值我需要使用商店字典填充那些具有NaN值并匹配商家类型的行的MerchantTyp

浏览 13提问于2019-02-11得票数 1

回答已采纳

1回答

对pandas数据帧中的时间序列数据进行着色

、、、

我有两个Pandas数据帧: svt_data和asp_data。第一个是时间序列数据，第二个是该序列中的特定时间。我可以使用svt_data.plot()绘制时间序列数据。然后，我想对第二个数据帧中的特定时间进行着色。在过去，我通过迭代列表的元素并使用matplotlib的plt.axvline函数实现了这一点，不是使用pandas数据帧，而是原生python列表。但是，当我迭代dataframe元素并使用此函数时，它会生成两个图形，而不是一个。它对一个图上的第二个数据帧中的特定时间进行了着色，并在另一个图上给出了时间序列。我如何才能让它们出现在同一张图上？ from numpy

浏览 2提问于2019-07-19得票数 2

2回答

在pandas中堆叠与Pandas / SFrame等效的列表数组

、

在pandas数据帧中是否有SFrame堆栈的等价物？Pandas自己的堆栈只适用于级别，而我正在寻找在包含列表的其他列的同一级别上扩展单个列。 Input Dataframe:在实际数据框中还有一些像user这样的列 +-------+------------------+ | user | friends | +-------+------------------+ | 1 | [2, 3, 4] | | 2 | [5, 6] | | 3 | [4, 5, 10, None] | +----- -+-------

浏览 5提问于2017-08-19得票数 1

回答已采纳

3回答

如何根据条件从多列中选择值

、、

我有一个数据框架，其中包含了在不同账户中有余额的人的信息。它看起来像下面这样。 import pandas as pd import numpy as np df = pd.DataFrame({'name':['John', 'Jacob', 'Mary', 'Sue', 'Harry', 'Clara'], 'accnt_1':[2, np.nan, 13, np.nan, np.nan, np.nan],

浏览 4提问于2020-09-15得票数 0

1回答

Pandas:单元格列表的每个值都要小写

、、

我有一个这样的数据帧 # initialize list of lists data = [[1, ['ABC', 'pqr']], [2, ['abc', 'XY']], [3, np.nan]] # Create the pandas DataFrame data = pd.DataFrame(data, columns = ['Name', 'Val']) data Name Val 0 1 [ABC, pqr] 1 2 [abc, XY] 2

浏览 13提问于2020-05-05得票数 0

回答已采纳

2回答

测试Pandas dataframe单元格是否包含空值

、、

我有一个Pandas dataframe，其中包含两列，这两列包含项目列表或NaN值。可以使用以下命令生成说明性示例： import numpy as np import pandas as pd df = pd.DataFrame({'colA':['ab','abc','de','def','ghi','jkl','mno','pqr','stw','stu'], &

浏览 59提问于2020-01-02得票数 1

回答已采纳

1回答

合并具有非均匀时间序列数据的数据帧

、、

我有两个包含时间序列数据的数据帧，它们的值是一个列表。我想将它们合并到一个数据帧中，从而导致两个列表的连接。棘手的部分是一个数据帧比另一个包含更多的数据点。当我对两个数据帧求和时，对于不重叠的日期，值将显示为NaN，而不是保留原始值。举个例子，df1包含以下内容： 2021-09-16 [AAA,BBB] 2021-09-17 [CCC] 2021-09-18 [DDD] df2包含以下内容： 2021-09-16 [EEE] 2021-09-17 [FFF] 2021-09-18 [] 2021-09-19 [GGG] 2021-09-20 [HHH,III

浏览 11提问于2021-09-26得票数 1

回答已采纳

1回答

火花数据帧

、、

星火数据帧和Pandas数据帧的区别是什么？我的理解是，Pandas数据框架主要用于将CSV数据读入DF，在DF中，Spark数据帧用于将弹性分布式数据( RDD )加载到数据帧中，并且可以操作数据帧。请分享你的反馈

浏览 6提问于2020-09-01得票数 0

回答已采纳

4回答

在pandas数据框单元格中插入列表

、、、、

我有一个字典，其中每个键都有一个值列表。与每个键关联的列表长度不同。我想把字典转换成一个包含两列'Key‘和'Values’的pandas数据帧。每一行在“key”列中具有一个字典键，并且在“values”列中具有与其相关联的值列表。数据帧将如下所示： mapping_dict = {'A':['a', 'b', 'c', 'd'], 'B':['aa', 'bb', 'cc']} df = Key Value 0

浏览 79提问于2017-12-02得票数 2

回答已采纳

1回答

python pandas为列I group by提供了一个键错误，即使布尔表达式显示该列是数据帧的一部分

、、、、

我似乎无法打印以下行：summarydata["Name"].groupby(["Tag"]).size() 不会得到错误： File "C:\Users\rspatel\untitled0.py", line 76, in <module> print(summarydata["Name"].groupby(["Tag"]).size()) File "C:\Users\rspatel\Anaconda3\lib\site-packages\pandas\core\serie

浏览 0提问于2021-09-20得票数 2

3回答

在基于时间序列的负荷预测问题中，如何处理缺失值

、、、

我正在分析包含http请求日志的aws日志文件，我需要预测下一分钟的预期负载(请求数量)。然而，我发现有些时间跨度没有任何日志。在这种情况下，我是假设这些时间内的负载仅为0，还是需要进行某种插值？ time load ----------------------------------- 2018-11-07 09:45:00 40 2018-11-07 09:46:00 45 2018-11-07 09:47:00 34 2018-11-07 09:48:00 56 然后在接下来的两个小时内没有日志，然后再一次：

浏览 3提问于2019-02-02得票数 0

2回答

Pandas惯用的将json列表映射到dataframe的方式

、、

我有一个从json输入派生的数据集，我希望将其映射到pandas dataframe。假设对应于表的各个行的json如下所示： popo = {'foo': 3.14, 'bar': [1, 2, 3]} 也就是说，与我的表中所需列之一对应的键本身是一个固定长度的列表。使用pandas.DataFrame.from_dict或pandas.io.json.json_normalize加载这类字典的列表，会产生一个包含两列的数据帧: foo和bar。在这两种情况下，bar都是object类型，这些对象是python列表。 df = pd.DataFrame.f

浏览 46提问于2019-03-04得票数 2

1回答

根据一列中定义的字符串列表过滤pandas数据帧

、

我需要根据可能出现在其中一列(在其他字符串中)的字符串列表来过滤cars pandas数据帧。所以我有这样的国家/地区列表： filterLocation = ['Germany','Austria','Slovenia'] 我想过滤掉pandas dataframe的Location列中包含这些单词的所有行。我有这个： carsresult = cars.loc[~cars['adCarLocation'].isin(filterLocation)] 但由于某种原因，这不起作用..

浏览 3提问于2020-02-25得票数 0

3回答

从一列中的唯一值创建Pandas DataFrames

、

我有一个包含1000行的Pandas数据帧。并且它的Names列包含客户名称及其记录。我希望根据每个客户的唯一名称为其创建单独的数据帧。我把独一无二的名字写进了名单 customerNames = DataFrame['customer name'].unique().tolist()这将提供以下数组 ['Name1', 'Name2', 'Name3, 'Name4'] 我尝试了一个循环，方法是捕获上面列表中的唯一名称，为每个名称创建数据帧，并将数据帧分配给客户名称。因此，例如，当我编写Name3时，它应该将Name3的

浏览 2提问于2017-06-23得票数 3

回答已采纳

2回答

如何根据两个数据帧中的ID信息查找值？

、、、、

包含订单信息的第一数据帧。一个销售线索订单可以有多个订单may。另一个数据帧有一个OrderID列表，并且想要使用dataframe1作为查找LeadOrderID的引用，我如何使用python (Pandas)来查找LeadOrderID？谢谢你的帮助。真的很感谢。

浏览 9提问于2018-09-06得票数 0

1回答

如何获取pandas数据框中列的子集？

、、

我得到了一个具有多列的pandas数据帧和一个具有列索引(0，1，...，n)的列表，该列表索引数据帧的列的子集。如何创建恰好包含这个列子集的新数据框？

浏览 3提问于2021-11-30得票数 0

1回答

提高非常大的数据帧上的迭代性能

、、、、

我有一个pandas数据帧，它由300万行和50列组成，所有列都包含整数(正数或负数)。我想创建一个名为'feature‘的新列，它从现有的50列中提取最大的负数。例如，如果对于给定行，50列包含以下值 -25,-24,-23,...,-1,1,...,23,24,25 “feature”列应返回-1。因为我的数据帧太大了，所以我尝试的解决方案花费的时间太长了。例如，我尝试过使用列表理解，但是因为我求助于iterrows()，所以它太慢了(itertuples()的性能并没有明显的提高)： import numpy as np import pandas as pd from tq

浏览 3提问于2019-07-17得票数 1

回答已采纳

1回答

如何在Pandas中将多个地块文件附加到一个数据框中

、、、

我正在用Spark和Pandas解压snappy.parquet文件。我有180个文件(我的Jupyter笔记本中有7 7GB的数据)。在我的理解中，我需要创建一个循环来抓取所有的文件-用Spark解压它们并附加到Pandas表中？以下是代码 findspark.init() import pyspark from pyspark.sql import SparkSession spark = SparkSession.builder.getOrCreate() parquetFile = spark.read.parquet("file_name.snappy.parque

浏览 27提问于2019-12-04得票数 0

回答已采纳

2回答

在pandas中基于groupby在dataframe中添加和填充日期行

、、、、

我有一个可以通过以下方式生成的数据帧： import pandas as pd data = [['tom', 10, '20190202',5], ['nick', 15,'20190202',7], ['juli', 16,'20190203',8], ['tom', 17,'20190204',6], ['tom', 10,'20190204',9], ['nick', 15,'20190

浏览 47提问于2020-01-07得票数 1

回答已采纳

1回答

为什么networkx在添加边后会减少节点数量

、、、、

首先，我需要说明我的代码运行时没有任何错误消息，但是我不理解一些结果。我在networkx中从一个pandas数据帧创建了一个图，它有398595个整数ID。 # Create Graph G = nx.Graph() G.name = "Graph from Pandas" # Add Nodes to Graph G.add_nodes_from(test_df['ID'].tolist()) print(nx.info(G)) nx.info(G)的输出如下所示，这也是正确的，这是我所期望的： Type: Graph Number of nodes:

浏览 0提问于2020-09-28得票数 0

2回答

如何在pandas中迭代合并数据帧？

、、

给定一个数据帧列表，我希望迭代地合并它们并返回单个数据帧。输入：frames (熊猫数据框列表)和on_columns (包含要合并的列名的字符串或字符串列表)。如何使用df.merge完成此操作？“给定数据帧列表，以迭代方式合并它们并返回单个数据帧 """HINT: Use slice on frames when iterating and merging. Arguments: frames {list} -- a list of pandas DataFrames on_columns {string or list} -- a string

浏览 4提问于2018-10-11得票数 1

2回答

如何确保从csv文件加载的dataframe中的列被格式化为整数(不含小数字符)

、、、

我使用的是Python 3.7 我需要从两个不同的源(都是csv)加载数据，并确定一个源中的哪些行不在第二个源中。我使用pandas数据帧加载数据，并在两个数据源之间进行比较。我从csv文件中加载了数据，在data-frame列中，类似2010392的值变成了2010392.0。我读过很多关于格式化数据帧列的文章；不幸的是，大多数都是关于日期和时间转换的。我在上偶然看到一篇文章《在Python pandas中格式化整数列数据框》，这篇文章并没有解决我的问题基于上面提到的文章，我尝试了以下几种方法： pd.to_numeric(data02['IDDLECT'], do

浏览 30提问于2019-07-09得票数 0

回答已采纳

2回答

将2个不同列数的Pandas数据帧相乘

、、

我有2个具有不同列数的pandas数据帧。df1包含40行x 23320列，而df2包含40行x 1列。必须用df2对df1的所有列进行多重排序。但我的结果只包含NaN值或未更改的df1 (取决于我尝试的内容)。我没有得到一个错误。这是python 2.7，我必须使用它。这是两个数据帧的图片。 ? 我尝试了以下代码： hnklnTnk = df7.mul(lndf) 或 hnklnTnk = df7 * lndf 我怀疑dfs可能出了什么问题，因为如果我尝试df7.round(2)，它会保持不变。

浏览 32提问于2021-07-04得票数 0

1回答

从数据中包含元组列表的每个单元格中检索最大值。

、、、

我有一个包含整数和字符串的熊猫数据列表，它有以下格式： 0 [(a,b,89), (a,y,992), (a,t, 99), (a,m, 1028)] 1 [(b,u,855), (b,tt,934), (b, g, 69)] 2 [(c,k, 546),(c,gf,134), (c, dd, 569)] 3 [(d,zv, 546),(d,gyr,8834), (d, dds, 5693), (d, ddd, 3459)] 实际上，a、b、tt等字符较长，并使用计算出的hamming距离，我想得到的是每行的最大值，并将其写入dfmax。 0 [1028] 1 [934] 2 [569] 3

浏览 2提问于2017-03-25得票数 1

回答已采纳

2回答

如何将几行附加到现有的pandas数据框中，其中的行数取决于理解列表

、、、

我试图通过一次添加几行来填充pandas中的现有数据帧，行数取决于一个理解列表，因此它是可变的。初始数据帧按如下方式填充： import pandas as pd import portion as P columns = ['chr', 'Start', 'End', 'type'] x = pd.DataFrame(columns=columns) RANGE = [(212, 222),(866, 888),(152, 158)] INTERVAL= P.Interval(*[P.closed(x, y) for x

浏览 31提问于2021-08-06得票数 0

2回答

Pandas:带条件的drop_duplicates

、、

有没有办法把drop_duplicates和conditions一起使用？例如，让我们以以下数据帧为例： import pandas as pd df = pd.DataFrame({ 'Customer_Name': ['Carl', 'Carl', 'Mark', 'Joe', 'Joe'], 'Customer_Id': [1000,None,None,None,50000] }) 基于此数据帧，我想为Customer_Id和Customer_Name派生出一个具有不同行的数据

浏览 1提问于2013-11-19得票数 2

1回答

如何将Pandas列切片转置并插入行切片？

、、、、

尝试从一个Pandas数据帧中提取列的切片，转置该切片，并将其插入到不同数据帧中类似大小的行切片中。两个数据帧中的标签和索引不同。对于大型数据帧，我目前正在运行for循环，逐个单元格地复制每个值，但效率非常低。除了for循环，我已经尝试了.loc，.iloc，与转置，但没有成功。pivot，pivot_table，melt在这里似乎不适用，否则我无法理解如何将它们应用于这个看似简单的问题。 # Two dataframes here import pandas as pd import numpy as np numRng = np.arange(20).reshape((5, 4)) df

浏览 15提问于2019-07-10得票数 1

回答已采纳

1回答

我正在尝试查找多个文件的每个数据帧中非na观察值的数量

、

我在一个文件夹中有多个csv文件，其中包含硫酸盐和硝酸盐的PM值的数据。数据帧有NA值，我正在尝试找出有多少个观测值是完整的，即每一行没有NA值。我尝试在数据帧上使用!is.na()并将其相加，但它告诉我有多少值是非NA值。这是代码- complete<-function(directory,id=1:332) { temp<-list.files(pattern='*.csv') myfiles<-do.call(rbind, lapply(temp, function(x) read.csv(x))) v<-numeric(len

浏览 0提问于2020-06-04得票数 0

1回答

搜索和删除数据帧列表中的项

、、

假设我通过以下方式创建了一个数据帧列表： import pandas as pd lDfs = [] for i in range(0, 3): lDfs.append(pd.read_csv('SomeTable.csv') 然后我有一个包含3个数据帧的列表： lDfs[0] lDfs[1] lDfs[2] 假设每个数据帧具有以下结构： Date,Open,High,Low,Close,Volume 0 2020-03-02,3355.330078,3406.399902,3257.989990,3338.830078,90017600 1

浏览 18提问于2020-04-16得票数 0

1回答

如何合并两个不同行大小的数据帧？

、、

因此，当我尝试放置不同大小的dataframe时，总是导致错误。 import pandas as pd from pandas import Series,DataFrame import numpy as np # For reading stock data from yahoo import pandas_datareader as web # For time stamps from datetime import datetime closing_df = web.DataReader(['AAPL','GOOG','MSFT'

浏览 11提问于2019-11-27得票数 1

回答已采纳

2回答

带有空列表值的dict中的熊猫数据

、

我试图用两个键在字典中阅读，第一个键有一个字符串值，第二个键有一个字符串值列表。包含列表的值可以(而且通常是)为空。例如： {'number': '50', 'box': []} 然而，当我尝试使用DataFrame.from_dict时，它给了我一个空的DataFrame。我注意到，如果“box”列表包含多个元素，DataFrame.from_dict将为我提供一个包含多行的DataFrame，每个值对应于框列表中的每个值。这似乎是一种跨产品行为。是否有一种方法可以抑制这种行为，以便从上面的示例中生成一个DataFrame，其中"num

浏览 3提问于2015-09-10得票数 2

回答已采纳