如何在Pandas中更改MultiIndex数据帧列中某些行的值_如何在pandas数据帧中向某些列添加不带值的行_基于pandas dataframe MultiIndex中的多个列值选择行 - 腾讯云开发者社区

python、python-3.x、pandas

这是输入的csv和4个标题行成为最后4列的标题，但我希望1个标题成为前4列的标题(客户，DII，FII和Pro)。同样，pandas数据帧中CSV格式的另外4列的第二个标题：- 如何创建4个标题行，使其占据4个单元格？

浏览 1提问于2020-06-12得票数 2

1回答

Pandas，将所有数据框转换为唯一的分类值

pandas、dataframe、categorical-data

我是Pandas和python的新手，我正在尝试了解如何将Pandas Dataframe的所有内容(所有字段都是字符串)转换为分类内容。在将行和列中的所有值转换为分类数字之前，必须将它们作为一个大型的唯一数据集处理。到目前为止，我已经能够编写以下代码 for col_name in X.columns: if(X[col_name].dtype == 'object'): X[col_name]= X[col_name].astype('category') X[col_name] = X[col_name].ca

浏览 16提问于2019-05-14得票数 1

回答已采纳

1回答

如何使用pandas数据框在下一行将列名细分为两个新列

python、pandas、dataframe

我已经读取了excel输入文件，并将其转换为pandas数据帧格式，如下所示。它有三列办公室编号、日小时数、日费率和两行数值[(101，8，60)，102，8，60)输入： OFFICE NO DAY HOURS DAY RATES 101 8 60 102 8 60 我的最终输出在文本文件中只需要两列在一线办公室没有，白天的工作。第二行将需要两个划分的小时，费率列下的“白天工作”主列名称。输出： OFFICE NO DAY JOB HOURS RATES 101 8

浏览 27提问于2021-08-05得票数 1

回答已采纳

1回答

使用Pandas将两个字符串行合并为一个字符串行

python、pandas、csv

我有一个csv，它有这样的行： Year 1Year 1Year 1Year 1Month 1Month 2Month 3Month 4 我希望将前两列合并为一列，如下所示： |Year1 1-Month1|Year1 1-Month2|依此类推。我正在使用pandas数据帧读取csv。所有关于堆栈溢出的答案都结合了两列，而不是行。请帮帮忙。

浏览 90提问于2021-02-22得票数 1

回答已采纳

1回答

如何将pandas数据帧中的多行连接成1行

python、pandas、dataframe

我需要将pandas数据帧中的几行(最多10行)连接到一行。例如:我有这样的数据帧 a b 0 1 3 1 2 4 转换为 a_0 b_0 a_1 b_1 0 1 3 2 4 逐行合并是愚蠢的，但我不知道如何继续。

浏览 9提问于2020-02-25得票数 1

回答已采纳

2回答

对多变量索引数据的操作

python、pandas、multi-index

我想将列添加到Pandas多索引数据帧中，其中将包含对其他列执行的操作的结果。我有一个和这个类似的数据： first bar baz second one two one two A 5 2 9 2 B 6 4 7 6 C 5 4 5 1 现在，对于dataframe中的每个组，我想添加一个列“3”，它等于列“1”减去“2”： first bar baz second one two three one two three A

浏览 1提问于2018-10-29得票数 1

回答已采纳

1回答

如何使用pandas添加列来将多行合并为单行？

python、pandas

我需要使用pandas将多行合并为一行，这取决于列“hash”。我的数据帧视图： hash a b 0 1 1 6 1 1 2 7 2 1 3 8 3 2 4 9 4 2 5 10 我希望将数据帧转换为如下形式： hash a a1 a3 b b1 b2 0 1 1 2 3 6 7 8 1

浏览 12提问于2019-04-15得票数 0

1回答

Pandas展平和合并多头数据帧和concat标头名称

python、pandas

我有一个pandas数据帧，它有两行作为标题，第一行是主列名称(a，b，c)，第二行是次要列名(a1，b1，b2等)： | a | b | | c | | |----|----|----|----|----| | a1 | b1 | b2 | b1 | b2 | |----|----|----|----|----| | | | | | | | | | | | | | | | | | | | | | | | | 有没有一种方法可以将这样的数据帧扁平化成一个只

浏览 19提问于2021-10-12得票数 0

回答已采纳

1回答

我如何基于一个公共的列，研究站点“名称”来组合2个熊猫数据帧？

python、pandas

我是Python和一般编程的新手。我正在尝试用python自动化一些地下水模型输出数据的处理。一个pandas数据帧测量了具有不同类型的多个列的数据流(左)，另一个对数据流进行了建模(右)。我尝试在列"Name“上使用pd.merge，以便将正确的建模输出值链接到相应的测量站点值。当我使用下面的脚本时，我得到相应的错误： left = measured_df right = modeled_df combined_df = pd.merge(left, right, on= 'Name') ValueError:列标签'Name‘不是唯一的。对于多索引，标签

浏览 8提问于2020-03-31得票数 2

回答已采纳

1回答

MultiIndex熊猫数据过滤后解堆时的界外误差

pandas、dataframe、multiple-columns

我有一个多索引熊猫DataFrame，我执行一些操作(包括删除带有空值的列)，然后尝试将.但是，这会导致索引错误。有办法解决这个问题吗？代码如下： ds = ds.unstack(level='Symbol') ds.columns = ds.columns.swaplevel(0, 1) ds = ds[start:end] ds = ds[equities] ds = ds.stack(level='Symbol') ds.dropna(axis=1, inplace=True) # this line breaks the code ds = ds.uns

浏览 2提问于2018-04-02得票数 3

回答已采纳

1回答

使用pandas连接多索引列

python、pandas、concatenation、multi-index

如何连接两个pandas数据帧，其中一个数据帧具有多个索引列？我需要在最终的数据帧中保留多索引。 import numpy as np import pandas as pd df1_cols = ["a", "b"] df1_vals = np.random.randint(1, 10, [2, 2]) df1 = pd.DataFrame(data=df1_vals, columns=df1_cols) df2_cols = pd.MultiIndex.from_tuples([("c", "1"), ("c&#

浏览 15提问于2021-07-14得票数 1

回答已采纳

2回答

熊猫-合并两个具有不同索引名称但列数相同的数据框架

python、pandas、dataframe、merge、concatenation

我试图将两个Pandas数据帧合并在一起，但无法获得所需的结果。有一个数据框架已被转置，因此我认为有一个包含列索引的标题行。另一个有带有列名的标题行，但是每个行的列数相同。数据帧1 (DF1)： +-----------------------------------------------------+ | NAME RD1 RD2 RD3 RD4 RD5 | +-----------------------------------------------------+ | 0 Tom 4 2

浏览 2提问于2022-02-16得票数 1

回答已采纳

1回答

为数据帧创建多-Column索引

pandas、dataframe、multiple-columns、multi-index

是否可以将单级列数据帧更改为多列数据帧？如果我们有这样的数据帧， import pandas as pd df = pd.DataFrame({ 'a': [0, 1, 2, 3], 'b': [4, 5, 6, 7], 'c': [3, 5, 6, 2], 'd': [1, 5, 7, 0], }) 我们可以像下面这样更改它的列名吗？所以，简单地说，我尝试做的是在不改变数据帧的值的情况下拥有2级的列索引。 A B a b c d 0 0

浏览 10提问于2021-02-03得票数 0

回答已采纳

1回答

向现有数据框添加已分组的列标题

python-3.x、pandas

我们如何在现有的Pandas数据帧中添加两个子列标题之上的补充行上的列标题？搜索结果如下： ? 这是当前的代码，它添加了大写标题，但没有正确定位它。 import pandas as pd OWNER = 'OWNER' CAPITAL = 'CAPITAL' USD = 'USD' CHF = 'CHF' YIELD = 'YIELD AMT' df = pd.DataFrame({ OWNER: 2*['JOE']+3*['ROB'], USD: [

浏览 10提问于2021-04-13得票数 0

1回答

如何将Matlab中的多维数组导出到MultiIndex中的数据？

matlab、python-3.x、multidimensional-array、dataframe、multi-index

假设我在Matlab中有一个多维元素 M=rand(5,4,3) 其中5行代表客户的姓氏，4列代表他们的{年龄、体重、活动、幸福水平}，而其他3列代表年份{1999,2003,2009}。我正在尝试将其转换为Pandas中的多索引数据帧。有人能帮帮我吗？

浏览 5提问于2017-04-19得票数 0

回答已采纳

1回答

多级柱与规则柱的混合

python、pandas

使用如下所示的多级列创建Pandas数据格式非常简单： import numpy as np import pandas as pd dat = np.random.randn(5, 4) header = pd.MultiIndex.from_product([['Truck','Car'], ['Speed','Position']], names=['','

浏览 3提问于2021-06-08得票数 1

回答已采纳

1回答

如何在一个图形中绘制多个数据帧？

python、pandas、dataframe、matplotlib、exec

我有一个程序，输出1-4个熊猫数据帧，每个数据帧的结构如下： a b time 2008 11.61 11.99 2009 12.54 10.66 2010 13.64 12.34 2011 14.02 13.20 在每种情况下，如果我添加年份，行可能会增加，如果添加城市，列可能会增加，但在四个数据格式中的每一个数据中，不同的数据库都会返回相同年份和相同城市的结果。我正在尝试编写一个函数，该函数可以自动完成将所有数据帧组合在一起的步骤，并创建一个表示所有数据帧的大型图形。 To do it with 2 dataframes,

浏览 4提问于2022-11-05得票数 1

1回答

python pandas df合并多索引的一部分

python、pandas、dataframe、merge、data-science

我正在使用Python3和pandas。我有两个数据帧，有多个索引，一个索引由列a，b组成，另一个由列a，b，c组成。为了这篇文章，我们称数据帧为ab和abc。我想像这样使用左合并熊猫 abc.merge(ab，how="left")并使用索引创建合并。当然，我在索引中只需要a，b，因为c不在ab中，我如何在不删除级别和没有reset_index的情况下创建这个合并？使用多索引的简单而有效的解决方案是首选。谢谢

浏览 10提问于2019-08-15得票数 1

2回答

在Pandas中将多行转换为列

pandas

我正在尝试将pandas中的行转换为列，我的示例数据框如下所示 Scode Pname Town State Cycle Sqty Fqty 6000 Naro Hyd TS Feb/Mar 10 20 6000 Naro Vij TS Apr/May 10 20 6000 Naro Blore KR Feb/Mar 100 200 6000 Naro Cochin KR Apr/May 100

浏览 17提问于2019-08-23得票数 0

1回答

通过匹配numpy数组和pandas数据帧创建新的pandas df

python、pandas、numpy

我有下面的3x3x3 (3行，3列，每个单元格中有3个元素) numpy数组... [[[1, 1, 19], [2, 2, 29], [3, 3, 39]], [[4, 4, 49], [1, 1, 19], [2, 2, 29]], [[3, 3, 39], [9, 9, 99], [8, 8, 89]]] 和下面的熊猫数据帧。 col0 col1 col2 col3 1 1 19 10 2 2 29 20 3 3 39 30 4 4 49 40 8 8 89 80 9

浏览 4提问于2018-02-14得票数 0

回答已采纳

1回答

选择多个标题会沿轴1移动值

python、pandas

我有一个excel文件，里面有一堆关于电视节目的数据。在尝试将此数据读入到pandas数据帧时，我遇到了一个问题。它目前有两个头文件，但是当我这样做的时候 data = pd.read_excel("Book2.xlsx", skiprows=[0], header=[0,1]) 数据似乎移动了1列，第一列变成了索引。所以现在所有的东西都没有原始的引用了。输入数据： Kids (10-15) Males (21-30) Females (21-30) Date Time

浏览 0提问于2019-09-16得票数 0

1回答

将列中的值拆分为多个列

python、pandas

我有一个pandas数据帧，我希望将列C的数字相加在一起，并创建一个新列D。例如 ? ? 提前谢谢。

浏览 10提问于2021-01-05得票数 0

2回答

Python中的面板回归

python、pandas、statsmodels

我正在尝试对pandas Dataframe运行一个面板回归：目前，我有两个数据帧，每个数据帧包含52行(日期)*99列(99个股票) : 运行时： est=sm.OLS(Stockslist,averages).fit() est.summary() 我得到形状:ValueError ( 52 , 99 )和(52,99)未对齐:99(尺寸1) != 52(尺寸0) 有人能指出我哪里做错了吗？模型简单地是y(i，t)=x(i，t)+误差项，所以没有截距。然而，我想在未来添加时间效果。致以亲切的问候，杰伦

浏览 0提问于2016-04-18得票数 7

1回答

如何在python中合并pandas中的两列pivot_table？

python、pandas

我使用pd.pivot_table获得了一个数据帧，如下所示： foo bar Cond1 60 65 60 65 Cond2 50 200 210 16.7 15.2 100 200 210 14.9 13.5 我需要通过合并foo和bar列来获得如下所示的输出： foo(bar) Cond1 60 65 Cond2 50

浏览 89提问于2021-11-15得票数 0

回答已采纳

1回答

Pandas分组选择整个列

pandas

我使用pandas groupby方法来获取以下数据帧。如何从这个数据框中选择整列，比如名为EventID或Value的列。 df' Value‘返回整个dataFrame，而不仅仅是值列。 Value Realization Occurrence EventID 1 207 2023378 20 213 2012388 25 291

浏览 0提问于2014-02-11得票数 0

2回答

在没有循环的情况下从多级pandas数据帧中删除行列表

python、pandas

如果不使用for循环，则无法确定如何从具有3个以上级别的pandas数据帧中删除多级行的列表。在显式定义索引中的所有值时，这样做效果很好，答案是：Pandas Multiindex dataframe remove rows 例如： mask = dfmi.index.isin(( ('A0','B0', 'C0'), ('A2','B3', 'C4') )) dfmi.loc[~mask,:] 然而，当一个人想要接受所有可能的第三级时： dfmi.index.isin(( ('A0&#

浏览 11提问于2019-06-20得票数 4

回答已采纳

1回答

Python Pandas中的交叉表分析

python、pandas、crosstab

所以我要做的是创建一个网页，用户可以在导入的数据文件的选定行和列上运行交叉制表分析。我将文件转换为pandas数据帧，然后使用pandas.crosstab对其进行处理。然而，因为交叉表输出一个“堆叠的”或多索引的表格，所以我必须旋转它，以便更容易地使用和输出回网页。我一直在尝试使用pandas的pivot函数，但是很难找到一个好的、动态的例子。一些我一直在看的pandas中旋转的文档，但它没有显示一个列和行标签是动态的示例。现在我的交叉表函数是： cross_tab = pd.crosstab([dataframe[row] for row in selected_rows], [dat

浏览 5提问于2018-02-06得票数 1

回答已采纳

1回答

为什么在简单的数学运算中，熊猫比numpy快？

python、pandas、performance、numpy

最近，我观察到熊猫的乘法速度更快。我在下面的示例中向您展示了这一点。在如此简单的操作上，这怎么可能呢？这怎么可能呢？pandas数据帧中的底层数据容器是numpy数组。测量我使用带形状(10k，10k)的数组/数据帧。 import numpy as np import pandas as pd a = np.random.randn(10000, 10000) d = pd.DataFrame(a.copy()) a.shape (10000, 10000) d.shape (10000, 10000) %%timeit d * d 53.2 ms ± 333 µs per loop

浏览 1提问于2020-06-17得票数 2

2回答

从非分层索引的数据帧中创建具有分层索引和额外列的数据帧

python、pandas、hierarchical-data

考虑一个简单的数据帧： import numpy as np import pandas as pd x = pd.DataFrame(np.arange(10).reshape(5,2)) print(x) 0 1 0 0 1 1 2 3 2 4 5 3 6 7 4 8 9 我想创建一个具有以下形式的分层索引数据框架： 0 1 a b a b 0 0 NaN 1 NaN 1 2 NaN 3 NaN 2 4 NaN 5 NaN 3 6 NaN 7

浏览 16提问于2021-05-15得票数 0

回答已采纳

3回答

如何在不使用列名的情况下操作数据框的值

python、dataframe

我有一个数据帧，它的列如下所示： MultiIndex([('Longitude', 'Field1'), ('Latitude', 'Field1'), ('Name with Name Text', 'Field1'), ('Name with Name Text', 'Field2'), ('IsPresent', 'Field1')

浏览 7提问于2020-08-18得票数 0

1回答

Pandas是将一系列值分配到特定位置的最有效方法

python、pandas

我有一个空的pandas数据帧(df)、一个(索引、列)对列表(pair_list)和一个相应值列表(value_list)。我想根据pair_list将value_list中的值赋给df中的相应位置。下面的代码是我目前使用的代码，但速度很慢。有没有更快的方法呢？ import pandas as pd import numpy as np df = pd.DataFrame(index=[0,1,2,3], columns=['a', 'b','c','d']) pair_list = [(0,'a'),(1,

浏览 13提问于2019-10-22得票数 1

回答已采纳

1回答

如何在连接不同的df时制作熊猫的3级多色

pandas

我有两个主要的模块来构建pandas数据框架。一个块非常简单，而另一个块是由几个熊猫数据帧构建的，这些数据帧都是一样的。在最后，我想将它们连接起来，并有一个三个多色级别的标题。让我添加一个示例 import pandas as pd df_1 = pd.DataFrame(data=[["v1", "v2", "v3"], ["v4", "v5", "v6"]], columns=["c1", "c2", "c3"], index=["ID1

浏览 7提问于2020-04-16得票数 1

回答已采纳

2回答

转换(展平)多个标题Pandas数据帧

python、pandas、dataframe

我从一个Excel文件中获取了以下熊猫数据帧我想使用Pandas通过将当前标题(前两行)转换为数据帧列来展平Excel表。这就是我想要达到的目标： segment unit category sub_category value seg1 kg cat01 sub_cat_1.1 1 seg2 kg cat01 sub_cat_1.1 2 seg1 kg cat01 sub_cat_1.2 3 seg2 kg cat01 sub_cat_1

浏览 14提问于2021-06-11得票数 0

回答已采纳

1回答

当对多列使用groupby时，如何不删除未观察到的列组合

python、pandas

假设我有一个pandas数据框架，如下所示： df = pandas.DataFrame([[1,'A', 'First'], [3,'A', 'Second'], [2,'A', 'Third'], [5,'B', 'Second'], [4,'B', 'T

浏览 0提问于2015-12-17得票数 0

回答已采纳

2回答

在pandas数据框中创建多索引列

python、pandas

我有一个熊猫数据帧，结构如下： import numpy as np import pandas as pd df = pd.DataFrame(np.arange(32).reshape((4,8)), index = pd.date_range('2016-01-01', periods=4), columns=['male ; 0', 'male ; 1','male ; 2','male ; 4','female ; 0','fem

浏览 0提问于2016-03-03得票数 11

回答已采纳

1回答

从pandas多索引数据透视表中选择数据

pandas、pivot-table、multi-index

我有一个包含1703行的多索引数据帧(透视表)，如下所示： Local code Ex Code ... Value 159605 FR1xx ... 30 159973 FR1xx ... 50 ... ZZC923HDV906 XYxx ... 20 既有数字本地代码(例如159973)，也有由字符和字符串组成的本地代码(例如ZZC923HDV906)我想按第一个索引列(本地代码)选择数据。这对于使用以下代码的字符串字符很有效 pv_comb[(pv_

浏览 6提问于2017-01-10得票数 0

回答已采纳

1回答

Pandas重塑数据帧，每行一个单元格，包含列名和索引

python、pandas

假设我有一个数据帧，它可以表示为： pd.DataFrame(columns=['X', 'Y'],index=['A','B']) X Y A 1 2 B 3 4 然后，我想对每个单元格应用函数，以获得每个行的数据帧、具有列名和索引的单元格的值，如下所示： Col1 Col2 Value 1 X A 1 2 Y A 2 3 X B 3 4 Y B 4 我知道我可以循环它来得到结果，但我希望有一个更好的像

浏览 9提问于2019-05-19得票数 1

回答已采纳

1回答

使用柱状Pandas数据帧数据格式生成分层树结构

python、pandas、algorithm、dataframe、data-structures

浏览 13提问于2021-03-06得票数 0

1回答

pandas将列添加到时间序列上的数据帧聚合

python、pandas-groupby

我做了一个数据帧聚合，我想添加一个新列，如果行中2020年有一个> 0的值，它将放入1，否则为0。这是我的代码和dataframe的头 df['year'] = pd.DatetimeIndex(df['TxnDate']).year # add column year df['client'] = df['Customer'].str.split(' ').str[:3].str.join(' ') # add colum with 3 first word Datedebut = d

浏览 6提问于2020-06-28得票数 2

回答已采纳

2回答

如何在pandas中读取带有分隔符的文件？

python、pandas、csv、fixed-width

我正在使用pandas库，如何根据逗号分隔将给定的数据帧拆分为行和列。因为如果我尝试，它会给出错误，它不能分离，并抛出以下错误。 6.1101,17.592 5.5277,9.1302 8.5186,13.662 7.0032,11.854 5.8598,6.8233 8.3829,11.886 上面给出的行组成了我的数据集。代码是： import pandas as pd from sklearn import linear_model import matplotlib.pyplot as plt dataframe = pd.read_fwf("challenge_dataset

浏览 1提问于2017-06-25得票数 0

回答已采纳

1回答

使用Pandas Python为数据框指定标题并设置列样式

python、pandas、database、numpy、format

我想给dict_val数据帧一个标题，这个标题放在中间的title中。我还试图在Numbers列上用逗号分隔每个3位数字，我如何才能给数据帧一个标题并这样设置列的样式，并在下面得到预期的输出呢？ import pandas as pd import numpy as np title = 'Number and Numbers 2 Comparison' numbers = np.array([123242737.4923,679754672.3849]) numbers2 = np.array([123523,467895]) dict_val = pd.DataF

浏览 106提问于2021-11-17得票数 1

回答已采纳

1回答

序列[]和.loc[]有时返回单个值，有时意外地返回包含相同值的单个元素序列

python、pandas、dataframe、series

在下面的代码中，我试图在DataFrame列中找到最长的字符串。根据列的长度，下面的函数(maxstr)为短列返回一个值(如预期的那样)，为长列返回单个元素序列(我没想到这一点)。如有任何指示，将不胜感激。我使用了在中讨论的方法 import numpy as np import pandas as pd 由于数据很大，所以在进行过程中，我需要显示数据和序列上的信息。从剪贴板读取数据 df = pd.read_clipboard(sep='\t', index_col=[0, 1, 2, 3, 4], na_values='') print(f'

浏览 3提问于2021-12-23得票数 2

回答已采纳

1回答

如何从单个数据中分割和创建多个熊猫数据

python、python-3.x、pandas、dataframe

我正在用熊猫阅读一个excel文件。我想从原始数据帧创建多个数据帧。每个数据帧名都应该是第1行标题。此外，如何跳过每个事务之间的一列。预期结果： transaction_1: name id available capacity completed all transaction_2: name id available capacity completed all transaction_3: name id available capacity completed all 我试过的是： import pandas as pd import pprint as pp pd.option

浏览 1提问于2020-11-12得票数 0

回答已采纳

1回答

作为嵌套json的pandas数据帧

python、json、pandas

我有一个脚本，它将嵌套的JSON作为pandas数据帧读取，并向其中添加一个新列，然后将其保存为JSON。 import numpy as np from pandas.io.json import json_normalize sample_json = { "name": { "emails": [{"address": "clark.kent@example.com"}], "countries": [{"country": "US"

浏览 18提问于2019-06-06得票数 1

1回答

KeyError:当尝试选择dask数据框上的列时：“没有[索引([‘’，'']，dtype='object')]在[列]中”

pandas、dask

我正在使用from_pandas()函数从熊猫数据帧创建一个dask数据帧。当我尝试使用方括号[ ]从dask dataframe中选择两列时，我得到了一个KeyError。根据dask文档，dask dataframe支持像pandas dataframe一样的方括号列选择。 # data is a pandas dataframe dask_df = ddf.from_pandas(data, 30) data = data[dask_df[['length', 'country']].apply( lambda x: myfun

浏览 67提问于2019-10-04得票数 1

3回答

如何在pandas dataframe中添加新列的值？

python、pandas、dataframe

我想在Pandas数据帧中创建一个新的命名列，在其中插入第一个值，然后向同一列中添加另一个值：类似于： import pandas df = pandas.DataFrame() df['New column'].append('a') df['New column'].append('b') df['New column'].append('c') etc. 我该怎么做？

浏览 1提问于2018-07-24得票数 3

回答已采纳

1回答

我可以在pandas dataframe的列标签上添加一个标题/标题行并将其输出到HTML吗？

python、html、pandas

根据下面的示例，我正在将数据帧输出到电子邮件的正文中。是否可以在列标签行的上方添加标题行或标题行？最好是一个单元格的行，数据帧的长度，包含一个字符串？ import pandas as pd import numpy as np from IPython.core.display import display, HTML dates = pd.date_range('20130101',periods=3) df = pd.DataFrame(np.random.randn(3,4),index=dates,columns=list('ABCD')) st

浏览 65提问于2019-09-29得票数 2

回答已采纳

3回答

如何在python中找到dataframe中最常用的两列组合？

python、pandas

我在pandas数据框中的数据如下： df = pd.DataFrame({'a':[1,2,3,3,4,4,4], 'b':[2,3,4,4,5,5,5]}) 所以数据帧看起来是这样的： a b 0 1 2 1 2 3 2 3 4 3 3 4 4 4 5 5 4 5 6 4 5 这里的列'a'，'b‘的组合是: 12(1)，23(1)，34(2)，45(3)。我尝试选择4和5并将它们打印出来，因为它们的组合出现次数最多(3次)。我的代码是： counts = df.groupby(['a&#

浏览 1提问于2018-10-29得票数 6

1回答

在Pandas中，如何使用多索引过滤其他数据帧

python-3.x、pandas、filter

我有两个数据帧。第一个(df1)有一个多索引A，B。第二个(df2)有这些字段A和B作为列。如何筛选大型数据集的df2 (每个数据集有200万行)，以便仅获取df2中A和B不在df1的多索引中的行 import pandas as pd df1 = pd.DataFrame([(1,2,3),(1,2,4),(1,2,4),(2,3,4),(2,3,1)], columns=('A','B','C')).set_index(['A','B']) df2 = pd.D

浏览 12提问于2019-01-23得票数 1

2回答

如何在pyspark dataframe中返回空值的行？

python、pyspark、apache-spark-sql

我正在尝试从pyspark dataframe中获取空值的行。在pandas中，我可以在数据帧上使用isnull()来实现这一点： df = df[df.isnull().any(axis=1)] 但在PySpark的情况下，当我运行以下命令时，它显示Attributeerror： df.filter(df.isNull()) AttributeError：'DataFrame‘对象没有属性'isNull’。如何在不对每一列进行检查的情况下获取具有空值的行？

浏览 25提问于2018-11-27得票数 5