pandas dataframe添加一个列，计算第一行的中位数_Pandas将计算行添加到dataframe的底部_我无法为pandas dataframe中的所有行添加列 - 腾讯云开发者社区

python、pandas、indexing、axis、median

如果我有一个Pandas DataFrame，并且想要计算每一列的中位数，那么参数axis=1似乎应该按列给出中位数(根据文档)。但在实践中，axis=0给出了列的中值。下面是一个简单的可复制示例： import pandas as pd my_data = [[1.1, 2.2, 3.3], [1.2, 2.3, 3.4], [1.3, 2.4, 3.5]] df = pd.DataFrame(my_data) print(df.head()) print("\nTry to calculate median with axis=1\n") print(df.media

浏览 21提问于2018-12-17得票数 1

回答已采纳

3回答

pandas数据框列的中位数

python、r、numpy、pandas

我有一台DataFrame df name count aaaa 2000 bbbb 1900 cccc 900 dddd 500 eeee 100 我想看看离count列的中位数在10的范围内的行。我尝试了df['count'].median()，得到了中位数。但不知道如何继续下去。你能建议我如何使用pandas/numpy来做这件事吗？预期输出： name count distance from median aaaa 2000 ***** 我可以使用任何度量作为与中位数的距离(与中位数的绝对

浏览 0提问于2015-04-22得票数 12

回答已采纳

1回答

使用pandas中的滚动窗口跨多行和多列计算中位数

python、pandas、rolling-computation

有一个5行3列的数据集。索引在2秒时重新采样。所以我想计算频率=2的滚动中位数。因此，在计算频率为2的中位数时，它应该查找前2行和所有3列，如B、c和d，以得出中位数。类似地，第二个窗口应该考虑两行和所有3列B、c和d，以得出中位数。 df = pd.DataFrame({'B': [0, 1, 2, np.nan, 4],'c': [2,4,7,8,9],'d': [2,8,7,5,9]}, index = [pd.Timestamp('20130101 09:00:00'),

浏览 3提问于2019-08-22得票数 2

1回答

平均数据和中值数据的DataFrame构造

python、pandas

我对DataFrames和Pandas完全陌生。我有这样的数据： {"_kaats"：{“中位数”：15.783333333333333，“平均数”：613.08480293921173}，"ryanleslie"：{“中位数”：3921.4666666666667，“平均数”：7279.5321839080461} 我正试图将其转换为DataFrame，这样平均和中间值是行，名称是列。我目前的尝试如下： import pandas as pd df = pd.DataFrame(result_dict) print df 但它产生了不同的输出。有人能

浏览 0提问于2019-08-13得票数 0

回答已采纳

1回答

某些列的pandas DataFrame中值

python、pandas、median

试图弄清楚如何计算pandas DataFrame中某些列的中位数。例如，假设我有一个7列200行的DataFrame，我想提取索引1-3 (包括)的列中包含的数字，并计算所有行的总和的中位数；对于3行，它将是(x+y+z) + (x+y+z) + (x+y+z)的中位数。我试过了： df["median"] = df.apply(lambda x : median(x), df[2:4]) 但它会引发错误： `TypeError: 'DataFrame' objects are mutable, thus they cannot be hashed 我也尝

浏览 22提问于2020-07-06得票数 1

2回答

在Pandas中使用自定义函数(中位数绝对偏差)` `transform()`

python-3.x、pandas、dataframe、pandas-groupby

我有一个pandas数据框架，我想要计算每个集群的中位数绝对偏差。我假设pandas方法mad是中位数绝对偏差，但它似乎是平均绝对偏差。我所写的代码行是 df['MAD PPGamp'] = df.groupby('Cluster')['PPGamp'].transform('mad') 我试着写一个我自己的小函数来计算中位数绝对偏差 def myMAD(x): med = np.median(x) x = abs(x-med) MAD = np.median(x) return MAD 并将

浏览 61提问于2020-04-26得票数 4

2回答

熊猫群后的中位数计算

python、pandas、dataframe

我试图回答下面的问题作为快照的Dataframe。我试着按照代码返回错误，如下所示。如果我删除了群中的一列。代码不会返回错误。请给我建议。 df.loc[df.age_group == pd.Interval(left=30, right=40)].groupby(df[['Gender','Education']]).DMDHHSIZ.median() ValueError: Grouper for '<class 'pandas.core.frame.DataFrame'>' not 1-dimensional 问

浏览 1提问于2021-01-14得票数 0

2回答

在Dask数据框中跨多列查找中间值

python、pandas、dask

我有一个Dask dataframe，它有三列:宽度、高度和长度。我需要创建第四列，它是三列的中位数。我用普通的pandas df编写的代码不能工作，因为median不是Dask中的函数。 columns_to_sum = ['weight', 'height', 'length'] df['median'] = df[columns_to_sum].median(axis=1) 如有任何帮助，我们不胜感激！

浏览 14提问于2020-05-14得票数 1

1回答

如何计算pandas多索引DataFrame中的分位数？

python、pandas

我有一个pandas多索引DataFrame，我想计算它在特定索引级别上的分位数。最好用一个例子来解释。首先，让我们创建DataFrame： import itertools import pandas as pd import numpy as np item = ('A', 'B') item_type = (0, 1, 2) location = range(5) idx = pd.MultiIndex.from_tuples(list(itertools.product(item, item_type, location)),names=('

浏览 5提问于2016-04-07得票数 5

1回答

遍历每一排熊猫的简单计算

python、pandas

如何使用计算过的列创建一个新的dataframe bigdf，该列迭代来自另一个df的每一行？我在新的dataframe bigdf中接收空行。 # Import pandas library import pandas as pd import numpy as np # DataFrame data = [['tom', 10], ['nick', 15], ['juli', 14]] df = pd.DataFrame(data, columns = ['Name', 'Age']) 遍历每一行，计算每

浏览 1提问于2021-06-16得票数 0

回答已采纳

1回答

pandas dataframe添加一个列，计算第一行的中位数

python、pandas

我有一个dataframe，它的列中充满了浮点数。我想添加一个列，用于计算从第一行到当前行的中位数。我不想计算滚动中位数，而是每一步都知道所有信息的中位数。

浏览 30提问于2021-11-18得票数 0

回答已采纳

2回答

熊猫corr()与corrwith()

python、pandas

Pandas提供两个不同的相关函数的原因是什么？ DataFrame.corrwith(other，axis=0，drop=False)：两个DataFrame objectsCompute的行或列之间的关联与 ( DataFrame.corr(method='pearson'，min_periods=1)：计算列的成对相关性，不包括NA/null值 (取自大熊猫0.20.3文件)

浏览 19提问于2017-09-04得票数 17

回答已采纳

1回答

如何使用随机值和Python中的random()方法生成两列21行的文件

python、random

我需要使用Python中的文件操作和随机方法生成一个具有随机值的两列21行文件。示例 Num0 0.283740 Num1 0.394882 Num3 0.384844 读取文件，按升序输出两列随机值，确定值的最小值、最大值、中位数、平均值必须使用random.random()方法到目前为止，我已经做到了： import numpy as np import pandas as pd mylist = pd.DataFrame(np.random.randomint(0,100,size=21,1)), columns=list(' ')) mylist

浏览 17提问于2020-03-10得票数 0

1回答

`pandas.DataFrame.groupby`的非聚合更新

python、pandas、group-by、pandas-groupby

考虑一个按列分组的数据帧。 example = pandas.DataFrame({ 'A': numpy.arange(100) // 10, 'B': numpy.nan }) 现在，我希望通过对每个组进行一些计算来更新一个列。结果是一个序列，而不是像平均值或中位数那样的单个聚合数。一种解决方案是： for a, rows in example.groupby('A'): # Some update that is performed per group some_update = numpy.arange(

浏览 16提问于2020-08-31得票数 1

2回答

从每一列中扣除中位数

python、numpy、pandas

我有一个带有数字的dataframe，df，如下所示： 1 1 1 2 1 1 2 1 3 我想从每一列中减去中位数，使每一列的中位数变为0。 -1 0 0 0 0 0 0 0 2 我该怎么用吡喃的方式来做这件事？我猜这是可能的，不需要迭代的值，计算中位数，然后扣除。我想做的很简单，大概是这样的： from numpy import median df -= median(df) #does not work, deducts median for whole dataframe

浏览 2提问于2014-06-17得票数 0

回答已采纳

1回答

使用R，如何在我现有的dataframe中用列的中值创建一个新的数据集？

r、dataframe、graph、data-manipulation、median

我是R的新手，我希望从我的dataframe中获得一个新的数据集，其中包括一个新列，该列表示dataframe现有列(称为Total )中值的median。后者包括大约5,000项个人意见。我有点困惑如何继续这项工作，因为中位数需要根据以下标准计算:房产、月份、年份和市场目前，我的dataframe (让我们称之为mydata1)如下(前5行所示)： Property Date Month Year Market TotalExtras ZIL 1-Jan-15 1 2015 UK 450.00 ZI

浏览 3提问于2017-04-15得票数 0

回答已采纳

1回答

如何在pandas中按组计算一组行的模式

python、python-3.x、pandas

我有一个数据帧，看起来像这样： import pandas as pd foo = pd.DataFrame({'var_name': ['r1','r2','r3','var', 'r1','r2','r3','var'], 'group': ['a','a','a','a','b','b',

浏览 6提问于2020-04-09得票数 1

回答已采纳

2回答

如何找到两个日期之间的中位数月份？

python、pandas、numpy、datetime

我需要找到日期框中两个日期之间的中位数月值。我通过展示四个例子来简化这个案例。 import pandas as pd import numpy as np import datetime df=pd.DataFrame([["1/31/2016","3/1/2016"], ["6/15/2016","7/14/2016"], ["7/14/2016","8/15/2016"], ["8

浏览 20提问于2019-01-30得票数 1

回答已采纳

1回答

熊猫斧头

python、pandas

我正在尝试理解python pandas中的pandas参数。我知道它类似于numpy轴，但下面的示例仍然让我感到困惑： a = pd.DataFrame([[0, 1, 4], [1, 2, 3]]) print a 0 1 2 0 0 1 4 1 1 2 3 根据，axis=0沿着行(固定列)运行，而axis=1沿着列(固定行)运行。运行print a.drop(1, axis=1)产量 0 2 0 0 4 1 1 3 这将导致删除列，而print a.drop(1, axis=0)则会删除一行。为什么？这在我看来是向后看的。

浏览 4提问于2015-12-14得票数 1

回答已采纳

1回答

根据Spark DataFrame列的95%和5%值对其进行裁剪

apache-spark、pyspark、apache-spark-sql、pyspark-sql

我正在尝试使用PySpark &Spark2.2为我的模型制作一个自定义的变压器。我想获取一个DataFrame，并基于列top 95%和5%创建一个饱和值(最大值和最小值)。(与中位数类似，但为0.95 & 0.05) 例如，我想要这个DataFrame： col_0 col_1 0 1 11 1 2 12 2 3 13 3 4 14 4 5 15 ............... ............... 95 96 106 96 97 107

浏览 48提问于2019-03-20得票数 0

1回答

使用Python查找均值、模式和中值

python、python-3.x、pandas

我正在尝试计算数据帧中2列的平均值、模式和中位数。我想按COL1分组，并计算COL2的均值、模式和中位数。有许多列和行，但下面显示了我希望使用的2个示例 COL1 COL2 1 (0-9) 64 2 (10-19) 74 3 (20-29) 64 4 (0-9) 62 我一直在尝试下面的代码，但不断收到错误： data.groupby('COL1')['COL2'].mean() 如果我只使用COL1进行groupby，这将返回其他两个列的平均值(和中位数，但不是模式)，但不是

浏览 25提问于2021-01-09得票数 0

1回答

Pandas median的奇怪行为

python、pandas、dataframe

考虑以下数据帧： b c d e f g h 0 6.25 2018-04-01 True NaN 7 54.0 64.0 1 32.50 2018-04-01 True NaN 7 54.0 64.0 2 16.75 2018-04-01 True NaN 7 54.0 64.0 3 29.25 2018-04-01 True NaN 7 54.0 64.0 4 21.75 2018-04-01 True NaN 7 54.0 64.0 5

浏览 13提问于2019-02-19得票数 17

1回答

如何在vaex数据帧中访问特定的单元？

python、vaex

vaex是一个类似于pandas的库，它提供了一个dataframe类，我正在寻找一种按行和列访问特定单元格的方法例如： import vaex df = vaex.from_dict({'a': [1,2,3], 'b': [4,5,6]}) df.a[0] # this works in pandas but not in vaex

浏览 25提问于2019-05-08得票数 0

回答已采纳

1回答

对大型数据的特定行进行算术计算

python、pandas、performance、dataframe、bigdata

假设我们有一个高行数的数据帧(df) (1600000X4)。另外，我们有一个列表，如这个列表： inx = [[1,2],[4,5], [8,9,10], [15,16]] 我们需要计算这个数据的第一列和第三列的平均值-- inx中每个列表的第二列和第四列的中位数。例如，对于inx的第一个列表，我们应该对第一行和第二行这样做，并将所有这些行替换为包含这些计算输出的新行。最快的方法是什么？ import numpy as np import pandas as pd df = pd.DataFrame(np.array([[1, 2, 3, 3], [4, 5, 6, 1], [7, 8,

浏览 1提问于2019-04-25得票数 0

回答已采纳

3回答

如何填充相对于来自另一列的值的缺失值

python-3.x、pandas、missing-data

我想用相对于国家的条件来填充缺失的值:例如，我想用年龄的平均值来代替中国的缺失值，而对于美国，它是年龄的中位数。就目前而言，我不想触及欧盟缺失的价值观。我怎么能意识到呢？在dataframe下面 import pandas as pd data = [['USA', ], ['EU', 15], ['China', 35], ['USA', 45], ['EU', 30], ['China', ], ['USA', 28], ['EU',

浏览 4提问于2020-01-13得票数 1

回答已采纳

1回答

在Pandas Dataframe中寻找缺口

python、pandas、dataframe

我有一个Dataframe，它有一列分钟和相关的值，频率大约是79秒，但有时会丢失一个时间段的数据(根本没有行)。我希望检测到是否存在25分钟或更长的间隔，如果有，则删除数据集。我如何测试是否存在差距？ dataframe如下所示： INDEX minutes data 0 23.000 1.456 1 24.185 1.223 2 27.250 0.931 3 55.700 2.513 4

浏览 1提问于2020-04-09得票数 0

回答已采纳

1回答

我如何循环通过一个DataFrame并构建一个新的(带有条件的)？

python-3.x、pandas、function、loops、dataframe

因此，我为我的问题创建了一个DataFrame： import pandas as pd import random median = random.uniform(0, 1) data = [[random.uniform(0, 1), random.uniform(0, 1)], [random.uniform(0, 1), random.uniform(0, 1)], [random.uniform(0, 1), random.uniform(0, 1)]] df= pd.DataFrame(data, columns=["A","B"]) DataFra

浏览 3提问于2019-09-26得票数 0

回答已采纳

2回答

潘达斯丢行的优化

python、pandas、optimization

我有一个完成以下要求的功能：对于每一行，如果行中50%或更多列高于中位数，则确定该行的列值是否高于相应列的中值()，删除行。我试图通过以下功能来完成这一任务： def remove_rows(df): col_count = len(df.columns) remove_rows = [] for idx, row in tqdm(df.iterrows(), total=df.shape[0]): count = 0 for col in df.columns: if int(count) >= in

浏览 3提问于2021-10-28得票数 1

回答已采纳

1回答

当其他列满足标准时，计算列中行的和

pandas、median

我有一个如下所示的dataframe (代码在底部，如果您关心的话)： A B C D E Year Category 1980 Alpha 100 800 10 15 1.2350 Bravo 200 700 20 25 2.3550 Charlie 300 600 30 35 3.3600 Delta 400 500 40 45 4.4448 1981 Alpha 500 400

浏览 4提问于2020-01-27得票数 1

回答已采纳

1回答

Pandas中最大值的位置

pandas、dataframe、data-science

我有一个pandas dataframe，我想检索dataframe中最大值的位置(行、列)。我该怎么做呢？

浏览 2提问于2019-11-05得票数 1

1回答

熊猫:计算一列中两个值之间的行数。

python、pandas、dataframe、count

假设我有以下数据 import pandas as pd df = pd.DataFrame({ 'Est': [1.18,1.83,2.08,2.30,2.45,3.21,3.26,3.54,3.87,4.58,4.59,4.98], 'Buy': [0,1,1,1,0,1,1,0,1,0,0,1] }) Est Buy 0 1.18 0 1 1.83 1 2 2.08 1 3 2.30 1 4 2.45 0 5 3.21 1 6 3.26 1 7 3.54 0

浏览 2提问于2022-09-26得票数 1

回答已采纳

1回答

如何将上一行的结果添加到当前行的内容中？

python、pandas

import pandas as pd import numpy as np df = pd.DataFrame({"a": [7, 2, 3], "b": [4, 5, 6], "c": [100, np.nan, np.NaN]}) df Out[11]: a b c 0 7 4 100.0 1 2 5 NaN 2 3 6 NaN 对于上面的Python大熊猫DataFrame，我想对行号0做这样的操作:计算列a和b之间的差异。其结果应该添加到c列的内容中，并存储在(新的)列d中。对于第一行

浏览 1提问于2018-12-10得票数 2

回答已采纳

1回答

如何处理pandas中的聚合数据？

python、pandas

我有一个数据集，如下所示： val 1 1 3 4 6 6 9 ... 我无法将其加载到熊猫数据帧中，因为它太大了。因此，我使用Spark聚合数据以形成： val occurrences 1 2 3 1 4 1 6 2 9 1 ... 并将其加载到熊猫数据帧中。"val“列不超过100，所以它不会占用太多内存。我的问题是，我不能很容易地在这样的结构上操作，例如使用pandas找到均值或中位数，也不能使用seaborn绘制箱线图。我只能使用我自己编

浏览 0提问于2018-09-18得票数 1

1回答

将两个字典合并成一个熊猫数据

python、pandas、dictionary

我的问题类似于但是，这个问题询问了如何将两个字典合并到一个dataframe中，使用字典作为列。在我的例子中，字典是dataframe的行。MRE： foo ={‘平均数’：0.11，‘中位数’：0.09，'p90'：0.24} bar ={‘平均数’：0.10，‘中位数’：0.09，'p90'：0.20} } 我想要这样的数据文件： set mean median p90 foo 0.11 0.09 0.24 bar 0.10 0.09 0.20 我怎样才能创建它？

浏览 4提问于2022-07-14得票数 1

回答已采纳

1回答

大熊猫的条件聚集

pandas

import pandas as pd import numpy as np cols = ['name', 'performance', 'activity'] data = [ ['bob', 50, 95], ['bob', 0, 80], ['bob', 82, 4], ['bob', 50, 120], ['joey', 37, 50], ['joey', -4, 70

浏览 2提问于2022-11-28得票数 1

回答已采纳

3回答

使用滚动中值过滤Pandas数据帧中的异常值

pandas、median、outliers、rolling-computation

我正在尝试从GPS高程位移与日期的散点图中过滤出一些异常值我尝试使用df.rolling来计算每个窗口的中位数和标准差，如果它大于3个标准差，则删除该点。但是，我不能想出一种方法来遍历列并比较滚动计算的中位数。以下是我到目前为止所拥有的代码 import pandas as pd import numpy as np def median_filter(df, window): cnt = 0 median = df['b'].rolling(window).median() std = df['b'].rolling(windo

浏览 0提问于2017-10-27得票数 9

回答已采纳

5回答

带有awk的柱的中位数

bash、sed、awk、median

如何使用AWK计算一列数字数据的中位数？我可以想出一个简单的算法，但我似乎不能编程：到目前为止，我所拥有的是： sort | awk 'END{print NR}' 这就给出了列中元素的数量。我想用它来打印某个行的(NR/2)。如果NR/2不是整数，那么我向上舍入到最近的整数，那就是中位数，否则我取(NR/2)+1和(NR/2)-1的平均值。

浏览 0提问于2011-05-29得票数 19

回答已采纳

1回答

在pandas dataframe python中创建子列

python、pandas、dataframe

我有一个包含多列的数据帧 df = pd.DataFrame({"cylinders":[2,2,1,1], "horsepower":[120,100,89,70], "weight":[5400,6200,7200,1200]}) cylinders horsepower weight 0 2 120 5400 1 2 100 6200 2 1 80 7200 3

浏览 21提问于2019-01-13得票数 1

回答已采纳

5回答

DF多列在R中的最小值和中位数

给定的dataframe如下所示： V1 V2 V3 5 8 12 4 9 5 7 3 9 ... 如何将列添加到dataframe中的最小值和每一行计算的这3列的中间值？得到的DF应该如下所示： V1 V2 V3 Min Median 5 8 12 5 8 4 9 5 4 5 7 3 9 3 7 ... 我试过用dplyr::mutate mutate(df, Min = min(V1,V2,V3)) 但这需要整个dataframe的最小值，并将该值放入每一行。我如何才能得到每一行的最小值和中间值？

浏览 1提问于2016-03-09得票数 4

回答已采纳

3回答

pandas在特定列的行上创建中间数

python、pandas

因此，假设我有一个示例DataFrame： import pandas as pd x = pd.DataFrame({"Name": ["A", "B", "C"], "total_1": [1, 2, 3], "total_2": [7, 8, 9], "total_3": [9, 10, 11]} 我想要做的是创建一个新的数据帧，它包含所有包含子串total的列的中位数，并沿行执行。即，新数据帧将具有应当为[7, 8, 9]的列。我想如果我可以选择名称中带有total的柱，

浏览 20提问于2021-03-25得票数 2

回答已采纳

2回答

熊猫:用各自的中值填充多列的nan值，但使用索引访问这些列

python、pandas、loops

我有一个有15列和5000行的DataFrame。在DataFrame中有4列包含NaN值。我想用中位数代替这些数值。由于有几个列，我想通过一个for-循环来实现这一点。这些是列号:1、5、8、9。每列的NaN值得到相应的中值。我试过： for i in [1,5,8,9]: df[i] = df[i].fillna(df[i].transform('median'))

浏览 6提问于2022-06-26得票数 1

1回答

如何将rpy2矩阵对象转换为Pandas数据帧？

python-2.7、pandas、rpy2

在使用熊猫读取.csv文件，然后使用rpy2包将其转换为R数据后，我使用一些R函数(也通过rpy2)创建了一个模型，现在我想将模型的摘要转换为pandas (这样我就可以将其保存为.csv文件或用于其他目的)。我遵循了熊猫网站上的说明(来源：)，以便找出答案： import pandas as pd from rpy2.robjects import r import sys import rpy2.robjects.packages as rpackages from rpy2.robjects.vectors import StrVector from rpy2.robjects imp

浏览 3提问于2017-09-13得票数 0

回答已采纳

1回答

如何检查Pandas Dataframe列是否包含值？

pandas

我想检查pandas.DataFrame列是否包含特定值。例如，这个玩具Dataframe在"two"列中有一个"h" import pandas as pd df = pd.DataFrame( np.array(list("abcdefghi")).reshape((3, 3)), columns=["one", "two", "three"] ) df one two three 0 a b c 1 d e f 2 g h i

浏览 1提问于2021-11-12得票数 0

1回答

用Pandas NumPy函数计算样本统计量

python、pandas、numpy、dataframe

我正在尝试创建一个函数，该函数使用DataFrame函数返回Pandas DataFrame中所有列的平均值、中值或标准差。这是一个学校作业，所以没有理由使用NumPy，除了这是对我的要求。我很难弄清楚如何在Pandas DataFrame中使用NumPy函数来解决这个问题。这里是问题的文本. 下面的代码单元格包含一个名为comp_sample_stat的函数，它接受两个参数"df“，其中包含特定公司的dow的数据，以及stat，它将包含三个字符串中的一个：”平均值“、"std”或“中位数”。对于这个问题：如果stat等于“平均”，则使用numpy的平均值函数返回d

浏览 0提问于2018-10-08得票数 0

回答已采纳

1回答

检查列表的一个或多个元素是否存在于Pandas列中

python、python-3.x、pandas、numpy

此问题是以下问题Check if pandas column contains all elements from a list的扩展在问题中，为了派生输出，在Pandas列中检查列表的所有成员。我需要检查列表的一个或多个元素，即即使列表中只有一个元素与pandas列中的元素匹配，我也希望在输出中考虑这一点示例数据将为 frame = pd.DataFrame({'a' : ['a,b,c', 'a,c,f', 'b,d,f','a,z,c']}) letters = ['a','

浏览 30提问于2020-07-20得票数 0

回答已采纳

1回答

将pandas Series或DataFrame列插入现有Excel文件的第一个空列(使用OpenPyXL?)

python、python-3.x、excel、pandas、openpyxl

我正在使用Python的pandas库处理Excel文件中的一些数据，并根据这些数据创建两个新列。我想将这些列添加到Excel文件中现有列的最右侧，而不会扰乱已经存在的数据。由于这个原因，我不能使用pd.to_excel()，因为这会覆盖现有的数据，并且整个工作表都会丢失其格式。我正在查看OpenPyXL以保存新数据(必须读取文件两次并不是很好，但是使用OpenPyXL处理头并将它们传递给pandas在我看来有点混乱)。问题是ws.append()函数在第一列(A列)的底部插入数据，我想在第一个可用空闲列(例如C和D列)的顶部(第1行)插入数据。理想情况下，这应该从两个pandas Seri

浏览 3提问于2020-04-09得票数 1

1回答

为什么统计模块只返回列名，而不返回中位数？

python、pandas、statistics、return、median

alcohol file import pandas as pd import statistics as st def median_1(table): print(table.median()) def median_2(table): print(st.median(table)) # Reading the excel file and sorting the value according to the X column file=pd.read_excel("C:\\Users\\hp\\Desktop\\alcohol.xls").

浏览 5提问于2020-06-30得票数 0

回答已采纳

1回答

Pandas未正确保存到CSV

python、pandas、csv

我有CSV文件： lang 12345,it 77777,en 第一行是标题。我的表有一列lang。在接下来的每一行中，都有两个值: index和value。当我用pd.read_csv(path)的Pandas阅读这张表时，我得到了下一个DataFrame结构： lang 12345 it 77777 en 但是当我通过df.to_csv(path)将它保存回CSV时，我在CSV文件的头之前得到了冗余的,： ,lang 12345,it 77777,en 似乎pandas处理这个逗号就像处理未命名的列一样，当我下次阅读这个文件时，我得到了这个DataFrame结构：

浏览 24提问于2019-09-22得票数 0

回答已采纳

1回答

熊猫to_numeric不是向下转换整数列

python-3.x、pandas

我有一个带有dtype('int64')列的dataframe。列中的值从0到10不等。dataframe有770 K行和56列的不同类型。当我运行下面的代码时，我得到了dtype('int64')。我本以为结果至少会降到int32或int16。下面是一个可复制的例子。 import pandas as pd df = pd.DataFrame([x for x in range(10)]*77000, columns=['recommendation']) df.dtypes df.recommendation.apply(lambda x:

浏览 0提问于2018-10-26得票数 7

回答已采纳

1回答

数据帧与另一系列的按列比较

pandas

看起来dataframe.le不是以列的方式运行的。 df = DataFrame(randn(8,12)) series=Series(rand(8)) df.le(series) 我预计对于df中的每一列，它都会与series进行比较(因此，与series进行的总共12列比较，因此涉及12列*8行比较)。但是对于df中的每个元素，它将与series中的每个元素进行比较，因此这将涉及12(列)*8(行)*8(系列元素)比较。如何实现逐列比较？第二个问题是，一旦我完成了列比较，我想要能够计算出每一行有多少“真”，我现在正在做astype(int32)，把bool转换成int，然后再做sum，

浏览 1提问于2013-05-30得票数 0

回答已采纳