使用pandas中的函数更改不同列的值_Pandas:更改列中的值_函数捕获不同列中的值之间的更改 - 腾讯云开发者社区

python、python-3.x、pandas

考虑一下这个dataframe df = pandas.DataFrame(numpy.random.randint(0,100,size=(200, 4)), columns=list('ABCD')) df['E'] = list(numpy.arange(1001, 1021)) * 10 df['F'] = ['c', 'b', 'b', 'a', 'd'] * 20 + ['d', 'a', 'b', '

浏览 2提问于2017-06-30得票数 3

回答已采纳

2回答

从列中删除NaN值时会发生什么？

python、nan

在Pandas中，从列中删除NaN值后，在删除NaN值的索引处存储的值是什么？我能够成功地从列中删除NaN值，但是df的形状是完好无损的，但是该特定列的大小发生了变化。 1445 70.0 **1446 NaN** 1447 80.0 1448 70.0 1449 21.0 1450 60.0 1451 78.0 1452 35.0 1453 90.0 1454 62.0 1455 62.0 1456 85.0 1457 66.0 1458 68.0 1459 75.0 Name: LotFronta

浏览 16提问于2020-07-11得票数 0

回答已采纳

1回答

通过布尔比较对列进行分组(类似于使用Matlab的grpstats)

python、pandas

我在Pandas中有一个dataframe，它的格式如下(还有一堆其他列)。 chip WL ok 0 1 1 True 1 1 2 True 2 1 3 True 3 1 4 True 4 2 1 False 5 2 2 True 6 2 3 True 7 2 4 True 我想按芯片分组，计算每个chip的WL数量，并对ok列中的每个值执行逻辑and。预期输出应如下所示： chip WLs ok 0 1 4 True

浏览 1提问于2014-07-03得票数 0

1回答

变量用于不同任务时的Python内存使用情况

python、memory-management

我正在与pandas在ETL管道中工作，并且我正在超出我的计算机的内存使用量。我正在阅读Python中的内存使用情况，当我创建一个pandas Dataframe时，我不明白内存使用是如何工作的，我为这个Dataframe指定了一个名称，并且我使用相同的名称进行一些转换或向其中添加更多列。例如： df = pd.DataFrame( { 'column1': [1,2] ,'column1': ['a','b']}) 如果现在我想要向此Dataframe添加另一列： df['column3'] = 1 用于第一

浏览 1提问于2020-11-23得票数 0

1回答

OneHotEncoder更改名称列

python、label、categorical-data、one-hot-encoding

我使用OneHotencoder将分类列转换为数值数据，但算法更改了列的名称。如何保存相同的名称列？ (我使用python 3) 我的数据框如下： >>> import pandas >>> import numpy >>> ar = numpy.array([['yassine', 1], ['jack',7], ['ahmed',4]]) >>> df = pandas.DataFrame(ar, columns = ['name', 'labe

浏览 1提问于2019-04-10得票数 0

2回答

如何将Nan和负数替换为零

python、pandas、dataframe

? 在上面的数据框中，我试图使用pandas将最后一列中的NaN和负值替换为0，我在这里使用了一些建议，但这似乎也会影响其他列，并将其他列中的值替换为零。如何将其限制为只显示选定的列

浏览 211提问于2021-08-25得票数 0

2回答

如何在NaN DataFrame中使用行值从列表构建中删除Pandas值

python、python-3.x、pandas

伙计们，我在pandas中有一个列，它是一个列表，其中包含row中的所有值。下面是一个示例。 print(df4['List']) 0 [8,9,10,25,14,25,14,17,19,30] 1 [nan,85,48,75,nan,96,32,14,15,21,28,17,nan] 2 [nan,85,48,75,nan,] 3 [1,nan] 4 [85,75,41,nan] 5 [nan,65,34] 如何从我的列表中删除这些'nan‘值？我在python中尝试了一些传统的列表方法，但是在pandas DataFrame中我没有得到相同的结果。就像这个

浏览 13提问于2019-11-02得票数 1

1回答

如何让Pandas数据帧在多核上运行？

python-3.x、pandas、multicore

我在pandas dataframe中处理了大约500万行数据&大约45 minutes.There是多列，数据转换涉及到将一些列复制到新列，根据给定的逻辑更改某些列中的值，以及许多这样的转换。由于pandas一次只在一个核心上运行，我的其他节点仍然处于空闲状态。如何让pandas利用所有可用节点并减少总的转换时间？

浏览 52提问于2021-01-12得票数 0

2回答

当作为参数传递时，如何跨多个自定义函数处理Pandas DataFrame？

python、pandas、function、dataframe、memory-management

我们有一个项目，其中我们有多个*.py脚本，这些脚本的函数接收和返回熊猫的dataframe变量作为参数。但是，这让我想知道:当dataframe变量作为参数传递或作为从这些函数返回的变量时，它们在内存中的行为是什么？修改df变量也会改变父/主/全局变量吗？请考虑以下示例： import pandas as pd def add_Col(df): df["New Column"] = 10 * 3 def mod_Col(df): df["Existing Column"] = df["Existing Column"]

浏览 1提问于2020-06-23得票数 4

回答已采纳

11回答

在pyspark dataframe中显示不同的列值。

python、apache-spark、pyspark、apache-spark-sql

有了Pandas，您如何实现与Pandas df['col'].unique()相当的功能。我想列出列中的所有唯一值。不是SQL类型方式(寄存器模板然后是SQL查询不同的值)。另外，我不需要groupby，然后是countDistinct，而是想在该列中检查不同的值。

浏览 21提问于2016-09-08得票数 176

回答已采纳

2回答

Julia pandas语法select values from conditional

pandas、syntax、julia

在Python的pandas中，如果我有一个具有n列的DataFrame，并且我想将满足某些条件的行保留在特定的列中，我只需输入：df[df.column1 > 0]，我找不到在Julia pandas中执行此操作的正确语法。

浏览 2提问于2017-11-29得票数 0

3回答

在pandas.read_csv中，dtype和转换器有什么区别？

python、pandas、types、converter、type-inference

熊猫函数read_csv()读取一个.csv文件。它的文档是根据文件，我们知道：类型:列->类型的类型名称或数据块，数据或列的默认无数据类型。例如{‘a’：np.float64，‘b’：np.int32} (不支持引擎=‘python’) 和转换器: dict，默认不对某些列中的值进行转换的函数。键可以是整数或列标签。在使用此函数时，我可以调用pandas.read_csv('file',dtype=object)或pandas.read_csv('file',converters=object)。显然，转换器的名称可以表示数据类型

浏览 3提问于2015-12-07得票数 37

回答已采纳

2回答

Pandas、numpy.where()和numpy.nan

python、pandas、dataframe、numpy、nan

我想使用numpy.where()向pandas.DataFrame添加一列。我想对条件为false的行使用NaN值(以指示这些值是“缺失的”)。考虑一下： >>> import numpy; import pandas >>> df = pandas.DataFrame({'A':[1,2,3,4]}); print(df) A 0 1 1 2 2 3 3 4 >>> df['B'] = numpy.nan >>> df['C'] = numpy.wher

浏览 144提问于2021-05-11得票数 5

回答已采纳

2回答

熊猫组在1.1.0填充物后滴下组栏

python、pandas、pandas-groupby

我有一段熊猫代码，用于1.0.5版。下面是我的问题的一个简单的、独立的例子： import pandas as pd df = pd.DataFrame(data=[ ('bk1', 10), ('bk1', None), ('bk1', 13), ('bk1', None), ('bk2', None), ('bk2', 14), ('bk3', 12), ('bk3', None), ], colu

浏览 1提问于2020-08-05得票数 5

回答已采纳

1回答

如何在同一个pandas数据帧的一列中执行两个聚合操作？

python、pandas、aggregate

我在pandas data frame中有一列，我想找出同一结果中某列的最小和最大值。但问题是，我只能得到一个聚合值作为回报。 import pandas as pd print(df) col1 col2 5 9 6 6 3 4 4 3 df.agg({'col1':'sum','col1':'mean'}) 这个聚合的输出只给出了一个含义： col1 4.5 dtype: float64 然而，对于col1，我需要的输出应该既有和又有均值，我只是得到了均值。

浏览 17提问于2019-05-04得票数 0

回答已采纳

2回答

将Pandas数据文件返回给函数的调用方(返回和为函数调用分配变量)

python

假设我们有下面的Pandas df df = pd.DataFrame({'food' : ['spam', 'ham', 'eggs', 'ham', 'ham', 'eggs', 'milk'], 'sales' : [10, 15, 12, 5, 14, 3, 8]}) 让我们进一步假设，我们有以下函数，它对df中的sales列的值进行平方： def square_sales(df): df['

浏览 4提问于2022-03-15得票数 0

2回答

从pandas列中提取任意格式的日期(日期是较长字符串的一部分)

python、pandas

我正在尝试从pandas列中提取任意格式的日期(日期是较长字符串的一部分)。我已经在pandas之外找到了 answer，但我不确定如何在pandas专栏中使用它。日期可以采用各种格式，例如： footballer, born October 1989 footballer, born 1900s footballer, born 29 December 1987 Brazilian footballer, born 1983 31/02/1901 16 May 2019 是否可以将任何日期格式和部分日期作为具有date类型的pandas列？

浏览 25提问于2019-07-13得票数 4

回答已采纳

3回答

Seaborn groupby pandas系列

matplotlib、pandas、seaborn

我想要将我的数据可视化到箱形图中，这些箱形图按我可怕的图中显示的另一个变量进行分组：所以我要做的是使用pandas系列变量来告诉pandas我有分组的变量，所以这就是我要做的： import pandas as pd import seaborn as sns #example data for reproduciblity a = pd.DataFrame( [ [2, 1], [4, 2], [5, 1], [10, 2], [9, 2], [3, 1] ]) #converting second column to Series a.ix[:,1] = pd.Series

浏览 0提问于2014-08-13得票数 4

回答已采纳

2回答

用Python将十六进制转换为负int

python、pandas、hex

我想将列x中的十六进制转换为正确的负int，如列"true“中所看到的，但是我得到了y列的结果。 x y true fdf1 65009 -527 我试过了(我知道这不对) df["y"] = df["x"].apply(int,base=16) 从这个中，我知道了这个函数： def s16(value): return -(value & 0x8000) | (value & 0x7fff) a = s16(int('fdf1', 16)) print(a) 可以将单个值转换为正确

浏览 0提问于2018-11-28得票数 2

回答已采纳

2回答

根据其他Dataframe列值更新Dataframe列值

python、pandas

我有一个pandas Dataframe，它有几列。我想根据Protocol中的值从Information列中获取前3个元素。例如:如果协议是TCP，我想要信息中的前3个元素。使用下面的代码，我可以分隔我的操作所需的列。但我不知道如何使下一段代码适应这一点。 chunk[['Protocol', 'Information']] = chunk[['Protocol', 'Information']] 编辑：我希望更新这些值。而不是把他们分开。

浏览 9提问于2019-05-29得票数 1

回答已采纳

2回答

大熊猫独立系列与数据来源的不同行为

python、python-2.7、pandas、numpy、dataframe

这是我的代码和警告信息。如果我通过使用s将Series更改为独立的Series，就不会出现这样的错误。在Windows上使用Python 2.7。似乎从独立创建的系列和从数据帧的列创建的系列是不同的行为？谢谢。我的目的是更改Series值本身，而不是在副本上进行更改。源代码 import pandas as pd sample = pd.read_csv('123.csv', header=None, skiprows=1, dtype={0:str, 1:str, 2:str, 3:float}) sample.columns = pd.Index(da

浏览 1提问于2016-08-29得票数 0

回答已采纳

1回答

在尝试将函数应用于复制列时，熊猫会抛出奇怪的异常

python、pandas、dataframe、duplicity

为什么我会收到以下错误消息？我试图将一个函数应用到一个重复的列中。请不要告诉我，解决方案是做一些类似df["a"] = 2 * df["a"]的事情；这是一个简单的例子，说明了我现在正在做的更复杂的事情。 >>> df = pd.DataFrame({"a" : [0,1,2], "b" : [1,2,3]}) >>> df[["a", "a"]].apply(lambda x: x[0] + x[1], axis = 1) Traceback (most rec

浏览 2提问于2016-06-11得票数 2

回答已采纳

2回答

如何使用基于列名的向量化操作？

python、pandas

假设我有这样的安排 import pandas as pd def dummy(val1, val2): return val1 * val2 / 10 df = pd.DataFrame({'a': range(1, 3), 'b': range(2, 4), 'c': range(3, 5)}) d = {'a': 3, 'b': 10} a b c 0 1 2 3 1 2 3 4 现在，我想将dummy应用于df中的列，这些列在d中作为键存在，并添加新列；因此，val1

浏览 4提问于2022-02-04得票数 2

回答已采纳

2回答

在ipython笔记本中使用熊猫数据映射函数时出错

python、pandas、ipython-notebook

我刚从Python开始，在玩Kaggle泰坦尼克号的数据时被困在了一些东西上。下面是我在ipython笔记本中输入的内容(train.csv来自上面kaggle链接中的泰坦尼克号数据)： import pandas as pd df = pd.read_csv("C:/fakepath/titanic/data/train.csv") 然后，我继续这样做，以检查“性”专栏中是否有任何不良数据： df['Sex'].value_counts() 返回： male 577 female 314 dtype: int64 df['Gend

浏览 5提问于2015-05-17得票数 3

回答已采纳

1回答

Python编程:将SAS数据读取到python时出错

python、pandas、sas

当我尝试使用pandas读取python中的sas7bdat文件时。它显示流出错误如下。有人知道怎么解决这个问题吗？非常感谢。 import pandas as pd pd.read_sas('D:/My Documents/data.sas7bdat') 错误消息： OverflowError Traceback (most recent call last) pandas\_libs\tslib.pyx in pandas._libs.tslib.array_with_unit_to_datetime() pan

浏览 1提问于2018-09-12得票数 0

1回答

理解.groupby().first()在压缩Pandas DataFrame时的含义？

python、pandas、dataframe

因为我不确定确切的术语--比方说，我有这个文件： dataA.csv： event,car,bike,bus 63175,,18, 65641,45,9, 65805,,,54 68388,,65, 68388,,,39 73041,7,,18 79336,,44, 79423,,,5 与dataA = pd.read_csv("dataA.csv", dtype='Int64')一起阅读这篇文章，我们得到了一只熊猫DataFrame： dataA: event car bike bus 0 63175 <NA> 18 &

浏览 1提问于2020-04-11得票数 1

回答已采纳

2回答

创建带有权重的Pandas DataFrame列，如果1列中的值介于其他2列中的值之间

python、pandas、lambda

如果一列中的值介于其他列中的两个值之间，则无法向新的Pandas DataFrame列添加权重(int)。但是，我可以使用True/False值(如果使用astype)创建列(或者0/1值)。 import pandas as pd df = pd.DataFrame({'a': [1,2,3], 'b': [4,5,6], 'c': [3,6,4]}) df a b c 0 1 4 3 1 2 5 6 2 3 6 4 这样做是可行的： df['between_bool'] = df[

浏览 6提问于2017-03-08得票数 0

回答已采纳

2回答

如何寻找大熊猫数据数组最大值的索引

python-3.x、pandas、dataframe、max

把一只dataFrame解析成熊猫。用户可以使用DataFrame.idxmax获得最大值的索引(列)名称，但是，如果行中的所有值都为零(或相等值)，则索引默认返回第一列。因此，如何为筛选所有为零的或所有相等的值，以便不返回列名。我正在使用pandas.DataFrame.idxmax帮助文件。但是，没有筛选器选项。我相信熊猫可以使用loc[df['something']==value]过滤，但我不知道如何达到最大值。 import pandas as pd myArr = {'column0':[1, 1, 0, 1, 1], 'col

浏览 3提问于2019-08-13得票数 0

4回答

如何获取一列中每个元素的长度

python、pandas

在csv文件中，有一个名为"no_pun“的列。里面有一些标记词。我想得到这个列中每个元素的长度。这在python中很容易实现。但我有个错误。我的代码： for i in range(0,len(data['no_pun'])): data["len_desc"][i] = len(data["no_pun"][i]) KeyError： KeyError Traceback (most recent call last) /anaconda3/lib/python3.6/site-packages/pandas/core

浏览 0提问于2019-04-07得票数 2

19回答

有没有一种简单的方法可以将Pandas数据帧中的yes/no列更改为1/0？

python、pandas、dataframe、series

我将csv文件读入pandas数据帧，并希望将具有二进制答案的列从yes/no字符串转换为1/0整数。下面，我展示了其中一列("sampleDF“是pandas数据帧)。 In [13]: sampleDF.housing[0:10] Out[13]: 0 no 1 no 2 yes 3 no 4 no 5 no 6 no 7 no 8 yes 9 yes Name: housing, dtype: object 非常感谢您的帮助！

浏览 18提问于2016-12-01得票数 53

1回答

在Pandas Dataframe中使用数学库检查NaN

python、python-2.7、pandas、nan

如果我指定一个值，'some value'给一个数据文件索引，则该列的其他索引返回NaN。稍后，我想循环遍历dataframe索引并更改NaN中的值。我正在尝试与math.isnan()检查，但它需要一个浮点，就像输入一样。我能用什么功能来执行这个检查呢？ import pandas as pd import math BabyDataSet = [['Bob', 968], ['Jessica', 155], ['Mary', 77], ['John', 578], ['Mel', 973]] d

浏览 0提问于2015-06-24得票数 2

回答已采纳

2回答

塔吉特=列车[‘索赔’]和塔吉特=列车[‘索赔’].copy()之间有什么区别？

python、pandas、dataframe、machine-learning

考虑到train是一个Pandas，这两者有什么区别？ target = train['claim']‍target = ‍train['claim'].copy()‍ 由于这两个代码段都用于将列的值赋值给目标变量，它们有何不同？

浏览 2提问于2021-09-03得票数 2

回答已采纳

1回答

如何在多列Pandas条件下过滤具有查询功能的空行

python、pandas、dataframe

嗨，我正在尝试过滤我的数据，条件是它应该基于列条件来filter行。因此，我希望filter列中没有任何空白值的所有行(AD65)，也希望只对那些在列B14中有值"Machine"的行进行filter。我在Pandas中尝试使用Pandas函数并返回空的数据帧。我尝试过过滤非空值条件，这是可行的。下面是我的示例代码： df = pd.DataFrame(data, columns=['AD65', 'W70', 'B14']) print(df.query("AD65 == 'notnull' &

浏览 1提问于2021-03-25得票数 0

回答已采纳

1回答

如何防止pandas.read_gbq推断列的数据类型

python、pandas、google-bigquery

我正在使用pandas.read_gbq阅读google中的一个表。我面临的问题是pandas自动推断每个列的数据类型，这就是创建问题。例如，在表中，我有一个列名aspect_ratio和熊猫自动将所有值转换为浮动，这是我想要防止的。 source df expected 55 55.0 55 25 25.0 25 21 21.0 21 nan nan nan 22 22.0

浏览 0提问于2019-11-25得票数 0

1回答

如何在pyspark中使用pandas_udf拆分dataframe中的字符串

string、pyspark、user-defined-functions

我只有一列的dataframe。我想使用pyspark中的pandas_udf拆分字符串。因此，我有以下代码： from pyspark.sql.functions import pandas_udf, PandasUDFType @pandas_udf('str') def split_msg(string): msg_ = string.split(" ") return msg_ temp = temp.select("_c6").withColumn("decoded", split_msg(temp._c

浏览 17提问于2019-10-03得票数 0

回答已采纳

2回答

Pandas查找不连续数据的方法

python、pandas、numpy

我想找出pandas数据帧中的哪些列具有不连续的数据。所谓“不连续”，我的意思是这些值从某个值变为零，然后再有一些值。 [0,0,0,1,2,3,4,5,0,0,0] # continuous [0,0,0,1,2,0,4,5,0,0,0] # not continuous 我已经设法实现了一些可以做到这一点的代码，使用for循环来迭代数据帧的每一列。我在下面制作了一个工作代码片段来说明我的意思： import numpy as np import pandas as pd def find_discontinuous(series): switch = 0 for inde

浏览 0提问于2017-08-16得票数 1

回答已采纳

3回答

CSV不能用数值来解释。

python、pandas、csv、floating-point

(这是代码和“用户”问题的混合，但由于我怀疑问题是代码，所以我选择在StackOverflow中发布，而不是SuperUser Exchange)。我用.csv方法生成了一个pandas.DataFrame.to_csv()文件。该文件由2列组成:一列是标签(文本)，另一列是名为准确性的数值(浮点数)。分隔列的分隔符是逗号(，)，所有浮点数都用点浮点数存储，如下所示: 0.9438245862 即使将该列保存为float，Excel和也会推断其类型为文本。当我尝试将这个列格式化为数字时，他们忽略了“0”。并返回非常高的值，而不是小数，如下所示： (文字) 0.9438245862 =>

浏览 2提问于2021-03-16得票数 0

回答已采纳

2回答

X.func和X.func( )的区别

python、pandas、oop

我遇到过许多这样的情况，在构建的函数或模块中，语法有时是"X.func_name“，有时是(X.func_name())。例如:在Pandas中，"df.columns“给出所有列的名称，如果错误写入为"df.columns()”#TypeError：'Index‘对象不可调用，则抛出错误。同样在Pandas中，"count()“、"min()”等被写为df.count() \x{e76f} df.min() 我希望我已经正确地解释了我的问题。我相信它与OOP类的概念和它的成员函数有关，但是我想要一个更深入的理解。

浏览 6提问于2020-05-16得票数 0

回答已采纳

2回答

在pandas dataframe列中使用字典键

python、pandas

我编写了以下代码，在其中创建了pandas数据帧字典： import pandas as pd import numpy as np classification = pd.read_csv('classification.csv') thresholdRange = np.arange(0, 70, 0.5).tolist() classificationDict = {} for t in thresholdRange: classificationDict[t] = classification for k, v in classificationDic

浏览 1提问于2017-03-19得票数 0

1回答

根据条件和位置设置值

python、pandas

我需要根据条件设置列的值，但我只需要在前5行设置它。这是我用来选择正确行的语句，它工作得很好。 kunden_df.loc[kunden_df["Distanz"] == 1].iloc[0:amount_contracts] 但是，设置列(Betreuer)上的值不会有任何影响。 kunden_df.loc[kunden_df["Distanz"] == 1].iloc[0:amount_contracts]["Betreuer"] = value 我知道这是一个语法问题，我已经发现了非常类似的问题(比如：Pandas/Python: Se

浏览 15提问于2020-08-25得票数 0

回答已采纳

1回答

Pandas DataFrame计数函数中重复数据和错误名称的结果

python、pandas、dataframe、count

我有一个关于Pandas DataFrame count函数的问题。我正在编写以下代码： d = {'c1': [1, 1, 1, 1, 1], 'c2': [1, 1, 1, 1, 1], 'c3': [1, 1, 1, 1, 1], 'Animal': ["Cat", "Cat", "Dog", "Cat", "Dog"]} import pandas as pd df = pd.DataFrame(data=d) 最后，我使用了DataFram

浏览 3提问于2020-10-26得票数 0

1回答

谷歌地理编码ValueError

python、pandas、valueerror、geocode

我目前正在尝试从目前存储在pandas数据帧中的一系列地址中提取纬度和经度值。我现在有以下代码： import pandas as pd from googlemaps import Client as GoogleMaps GoogleAPIkey = "myAPIkey" gmaps = GoogleMaps(GoogleAPIkey) df = pd.read_csv("addresslist") df输出如下： |Location | 0|Robert Pitt Drive, Spring V

浏览 18提问于2021-01-28得票数 2

1回答

熊猫to_sql()不使用PostgreSQL -值的时间太长，不能改变类型

python、django、postgresql、pandas、django-models

我使用Pandas和SQLAlchemy在一个CSV文件上应用一些ETL 在验证这些字段并转换其中一些字段之后，我尝试将其导出到我的PostgreSQL数据库，但是我得到了一个错误，这是没有意义的： sqlalchemy.exc.DataError: (psycopg2.DataError) value too long for type character varying(50) 我已经将字段更改为多个值(最初设置为15)。我试图获取该字段的NaN值，并将其替换为“”(只有一个字段)。为此，我用： >>> df.loc[df['foo'].isnull(),

浏览 5提问于2016-10-17得票数 3

回答已采纳

3回答

如何在星火中打印DataFrame列的唯一值？

java、apache-spark、apache-spark-sql

我从Parquet文件创建一个DataFrame，如下所示： DataFrame parquetFile = sqlContext.read().parquet("test_file.parquet"); parquetFile.printSchema(); parquetFile.registerTempTable("myData"); DataFrame data_df = sqlContext.sql("SELECT * FROM myData"); 现在，我想打印出一个名为field1的列的所有唯一值。我知道，在使用Python的情况下

浏览 8提问于2017-05-19得票数 2

回答已采纳

1回答

熊猫to_csv头与栏

python、pandas

pandas.to_csv函数似乎有两个属性，它们执行相同的任务。也许我遗漏了什么。从文件中：列:序列，可选要写入的列标题:布尔值或字符串列表，默认为True 写出列名。如果给出一个字符串列表，则假定它是列名的别名。当给出列的列表时，它们将列按我指定的顺序排列。 import pandas as pd from StringIO import StringIO df = pd.DataFrame({"foo":[1,2], "bar":[1,2]}) sio = StringIO() df.to_csv(sio) sio.getvalue

浏览 3提问于2015-07-29得票数 3

回答已采纳

1回答

为什么熊猫series.map方法适用于列连接？

python、pandas

从几个中，连接dataframe中的列的一种简单方法是使用map命令，如下例所示。map函数返回一个序列，那么为什么不能只使用一个常规系列而不是map呢？ import pandas as pd df = pd.DataFrame({'a':[1,2,3],'b':[4,5,6]},index=['m','n','o']) df['x'] = df.a.map(str) + "_x" a b x m 1 4 1_x n 2 5 2_x o

浏览 3提问于2015-07-08得票数 2

回答已采纳

2回答

Python熊猫-突出显示最高的n，max，min值

python、pandas

如何在dataframe列中突出显示最高的3max(或min)值？例如，我有： import pandas as pd df = pd.DataFrame({"Values A":[1,2,3,4,5], "Values B":[5,4,3,2,1]}) 我想在Values A列中突出显示(我希望能够为背景和文本选择颜色)。我怎么能这么做？

浏览 8提问于2022-08-05得票数 0

回答已采纳

2回答

为什么使用pandas.assign而不是简单地初始化新列？

python、pandas

我刚刚发现了熊猫数据帧的assign方法，它看起来很不错，非常类似于R中的dplyr的mutate。然而，我总是通过‘动态’初始化一个新列来获得它。有没有assign更好的原因？例如(基于pandas文档中的示例)，要在dataframe中创建一个新列，我可以这样做： df = DataFrame({'A': range(1, 11), 'B': np.random.randn(10)}) df['ln_A'] = np.log(df['A']) 但是pandas.DataFrame.assign文档建议这样做： df.assi

浏览 1提问于2018-01-10得票数 32

回答已采纳

2回答

如何在pandas中创建混合类型数据

python、pandas、mixed-type

这是一个相当不标准的问题。出于教育目的，我尝试在csv文件中创建一个混合类型的列，以便在pandas DataFrame中导入数据集时收到一条警告消息，并在以后处理该列以显示它是如何完成的。问题是，我在Excel的字符串列中键入0，保存它并关闭文件，但聪明的熊猫仍然将该列作为字符串列导入，因此它不会检测到其中是否确实存在浮点数。我还尝试使用astype('float')、导出和重新导入来更改pandas中仅这些0的格式。还是不管用。有没有人知道如何创建一个pandas将读取混合类型的列？提前感谢！

浏览 8提问于2020-02-09得票数 0

1回答

在Pandas数据帧上使用apply()时出现Numpy解包错误

python、pandas、numpy

我有一个Pandas DataFrame，它有两列，其中包含范围[-pi，pi)中的一些角度。我需要计算每一行的瞬时角速度，这可以使用diff()来完成，但是当我的数据跨越从pi到-pi的不连续时，这种简单的方法就失败了，例如我正在尝试对我的列使用numpy.unwrap()，但是当我尝试下面的代码时，我得到了一个ValueError。 angle_data["theta"].apply(np.unwrap) <Traceback message> ValueError: diff requires input that is at least one dim

浏览 74提问于2020-12-08得票数 1

回答已采纳