将Pandas Dataframe的索引拆分为单独的列_pandas将列值拆分为单独的列_Pandas将列中的列表拆分为多个单独的列 - 腾讯云开发者社区

python、pandas

我的dataframe中有Data2列。我试图通过向NewCol列应用一个筛选器来创建一个新列(‘Data2’)。下面的代码工作，新列的结果是正确的。但在运行代码时，我会得到以下错误消息。我怎么才能解决这个问题？我认为这会影响性能。 C:\Python27\lib\site-packages\IPython\kernel__main__.py:2: SettingWithCopyWarning:值试图在来自DataFrame的片的副本上设置。请参阅文档中的注意事项： # In[1]: import pandas as pd import numpy as np from pandas im

浏览 2提问于2015-08-27得票数 0

3回答

利用DataFrame函数误差的熊猫.loc时间指数

python、pandas、dataframe、datetime、indexing

我已经用DataFrame索引创建了DateTime，然后将索引拆分为日期索引列和时间索引列。现在，当我使用pd.loc()调用特定时间的一行时，系统会显示一个错误。下面是一个步骤，说明我是如何从一开始就完成DataFrame的，直到达到我的考虑为止。 import pandas as pd import numpy as np df= pd.DataFrame({'A':[1, 2, 3, 4], 'B':[5, 6, 7, 8], 'C':[9, 10, 11, 12], 'DateTime':pd.to_date

浏览 0提问于2021-08-31得票数 1

回答已采纳

1回答

向pandas DataFrame添加新列时的NaN值

python、pandas、dataframe、nan

我正在尝试在一个pandas DataFrame中生成一个新列，该列与另一个pandas DataFrame中的值相等。当我尝试创建新列时，我只得到新列值的NaNs。首先，我使用API调用来获取一些数据，'mydata‘DataFrame是按日期索引的一列数据。 mydata = Quandl.get(["YAHOO/INDEX_MXX.4"], trim_start="2001-04-01", trim_end="2014-03-31", collapse

浏览 1提问于2014-10-07得票数 26

回答已采纳

2回答

为分组的pandas数据帧创建散点图

python、pandas、dataframe、matplotlib、scatter-plot

我有一个Pandas DataFrame，我想要按某个列进行分组。然后，我想对这个分组的数据帧做一个散点图。然而，如果我这样做了，我会得到一个错误，因为我分组的列是无法识别的。 # Data loading, processing and for more import pandas as pd import numpy as np # Visualization import seaborn as sns import matplotlib.pyplot as plt # set seaborn style because it prettier sns.set() df = pd.D

浏览 27提问于2020-12-17得票数 0

回答已采纳

1回答

可能的索引按列编号(而不是标签)而没有iloc？

python、pandas

我们可以在不使用的情况下同时索引大熊猫的行和列吗？文件上说使用DataFrame，在[]中切片行。但是，当我想以相同的方式包含行和列时，它是不工作的。 data = pandas.DataFrame(np.random.rand(10,5), columns = list('abcde')) data[0:2] #only rows data.iloc[0:2,0:3] # works. data[0:2,0:3] # not working in python, but it works similarly in R

浏览 2提问于2017-02-19得票数 0

回答已采纳

1回答

通过提取没有for循环的DatetimeIndex时间，在一个小区上绘制每一天

python、pandas、dataframe、matplotlib、datetimeindex

我有一个包含7天随机数据的数据，每个数据点都由DatetimeIndex索引。我想在一个地块上绘制每天的数据。目前，我的尝试如下： import numpy as np import pandas as pd import matplotlib.pyplot as plt n =10000 i = pd.date_range('2018-04-09', periods=n, freq='1min') ts = pd.DataFrame({'A': [np.random.randn() for i in range(n)]}, index=i) d

浏览 8提问于2022-01-06得票数 2

回答已采纳

4回答

根据DataFrame中的字符串格式创建额外行

python、pandas、dataframe、string-formatting、apply

我希望高效地在DataFrame上执行以下操作。在DataFrame中有一个包含字符串的特殊列，其中一些行存在格式化问题。Naemly，在我的例子中，它有一个+符号，将应该是两个单独列的条目分开。特别是，考虑： import pandas as pd pd.DataFrame([ ['a', 0, 1 ], ['b+c', 2, 3 ], ['d+e', 4, 5 ], ['f', 6, 7 ] ]) 其中的指纹： 0 1 2 0 a 0 1 1 b+c

浏览 4提问于2017-04-19得票数 2

2回答

将dataframe列移动到最后一列。

python-3.x、pandas、dataframe、shift

我想将数据文件中的列移动到最后一栏，我尝试使用shift。但这并没有改变这个位置。 import pandas a pd df = #input dataframe df['x'] = df['x'].shift(axis=1) Error: raise ValueError(f"No axis named {axis} for object type {cls.__name__}") ValueError: No axis named 1 for object type Series 还有其他选择吗？有人能给我建议吗？

浏览 14提问于2022-06-28得票数 1

回答已采纳

1回答

为什么滑雪板的火车/测试分裂加上PCA使我的标签不正确？

python、pandas、scikit-learn、pca

我在Scikit中探索PCA -学习( Python 3上的0.20)使用Pandas来构造我的数据。当我应用测试/训练分割(仅当)时，我的输入标签似乎不再匹配PCA输出。 import pandas import sklearn.datasets from matplotlib import pyplot import seaborn def load_bc_as_dataframe(): data = sklearn.datasets.load_breast_cancer() df = pandas.DataFrame(data.data, columns=data.fe

浏览 1提问于2018-11-01得票数 1

回答已采纳

1回答

避免Pandas将None隐式转换为列元组中的NaN

python、pandas

我有一个Pandas DataFrame，它的列用Python tuples标记。这些列标签元组可以不包含任何内容。当我尝试使用以下任一方法向数据框添加列时，标记元组中的None被隐式转换为numpy.nan。方法1-使用dataframe[ NewColumn ] = ...语法添加列 >>> import pandas >>> df = pandas.DataFrame() >>> column_label = ( 'foo', None ) >>> df[column_label] = [ 1,

浏览 1提问于2016-01-05得票数 1

1回答

滑雪板StratfiedShuffleSplit

python、scikit-learn

有人能帮我理解StratifiedShuffleSplit做什么吗？我是这个图书馆的新手。我理解分层抽样背后的原理，然而，就代码而言，StratifiedShuffleSplit函数到底返回了什么？我正在读的这本书有以下代码，但是我没有完全遵循。这个函数是否实际上在数据上添加了一个索引来区分测试和训练，这就是为什么他们会使用.loc？它到底是将income_cat列拆分为什么呢？谢谢! from sklearn.model_selection import StratifiedShuffleSplit split = StratifiedShuffleSplit(n_splits=1, t

浏览 1提问于2018-11-13得票数 1

回答已采纳

1回答

获取行满足条件的列名

python、pandas、dataframe

我有一个只有一行和数百列的pandas dataframe，我想创建一个字符串列表，其中的元素是值满足条件的dataframe的列名。我还希望将特定的文本连接到每个元素。以下是数据帧： df = pd.DataFrame(data={ 'name': ["Jimmy"], 'SN522': [0], 'SN521': [1], 'SN520': [0], 'SN519': [1], 'SN518': [0]}) 我想要行= 0的所有列

浏览 20提问于2021-08-16得票数 1

回答已采纳

1回答

Dataframe.update()中的‘'join’参数

python-3.x、dataframe

我正在尝试用另一个更新数据帧。我注意到'update‘只更新匹配列处的值，而不会从另一个框架添加新列。如何执行这两个功能:更新值和添加新列？ import pandas as pd df = pd.DataFrame({'A': [1, 2, 3], 'B': [400, 500, 600]}) new_df = pd.DataFrame({'B': [4, 5, 6],'C': [7, 8, 9]}) df.update(new_df, join='left') 更新的df没有'C‘列。为什么会这

浏览 0提问于2018-10-20得票数 1

2回答

有什么更好的方法将列添加到pandas.Series中？

python、pandas、data-science

import pandas series1 = pandas.Series({ 'a':1, 'b':2, }) dict = series1.to_dict() dict['c'] = 3 series2 = pandas.Series(dict) 我需要在series1上添加一个列/索引。当前，如上所述，我通过从series1的数据创建一个字典，添加一个索引，然后使用该字典创建一个新的系列来创建series2。有没有一种方法可以像pandas.DataFrame.join()或pandas.DataFrame.assign(

浏览 31提问于2021-04-17得票数 0

回答已采纳

4回答

熊猫:从DatetimeIndex中提取值

python、pandas、datetimeindex

我有一个Pandas DataFrame，它的行和列是DatetimeIndex。 import pandas as pd data = pd.DataFrame( { "PERIOD_END_DATE": pd.date_range(start="2018-01", end="2018-04", freq="M"), "first": list("abc"), "second": list("efg")

浏览 23提问于2022-11-01得票数 1

回答已采纳

2回答

使用matplotlib在x轴上绘制包含时间数据的条形图

python、matplotlib、plot

我有一个包含两列的DataFrame，一列是字符串格式的一系列时间日期，另一列是一些值。我想把这个数据框画成条形图下面是我的代码： import matplotlib.pyplot as plt import pandas df = pandas.DataFrame({'a':['090000','093000','100000','103000'],'b':[2,3,4,5]}) df['a']=pandas.to_datetime(df['a'],format

浏览 2提问于2016-03-27得票数 1

2回答

如何将多个变量传递给pandas dataframe，以便将它们与.map一起使用来创建新列

python、pandas

要将多个变量传递给一个普通的python函数，您只需编写如下代码： def a_function(date,string,float): do something.... convert string to int, date = date + (float * int) days return date 在使用Pandas DataFrames时，我知道您可以基于一个列的内容创建一个新列，如下所示： df['new_col']) = df['column_A'].map(a_function) # This m

浏览 2提问于2015-05-22得票数 6

2回答

计算Pandas Dataframe字符串的运行天数

python、python-2.7、pandas

我有一个Pandas dataframe，可以存储人们的旅行日期。我想添加一个列来显示逗留的长度。为此，需要对string进行解析、转换为datetime并减去。Pandas似乎把datetime转换看作是一个完整的系列，而不是一个单独的strings作为一个I TypeError: must be string, not Series。我喜欢使用非循环选项来实现这一点，因为实际的数据集相当大，但需要一些帮助。 import pandas as pd from datetime import datetime df = pd.DataFrame(data=[['Bob', &

浏览 2提问于2016-05-06得票数 0

回答已采纳

1回答

使用pandas系列从pandas DataFrame中提取值

python、pandas、dataframe、indexing

我有一个包含键-值对的pandas Series，其中键是我的pandas DataFrame中列的名称，值是DataFrame中该列的索引。例如：系列：然后在我的DataFrame中：因此，从我的DataFrame中，我希望从'A‘的DataFrame中提取索引12处的值，即435.81。我想将所有这些值放入另一个序列中，所以类似于{ 'A'：435.81，'AAP'：468.97，...} 我的声誉很低，所以我不能将我的图片作为图片发布，而不是链接(有人能帮我解决这个问题吗？谢谢！)

浏览 30提问于2017-08-15得票数 0

2回答

如何引用我的Pandas数据索引？

python、pandas、indexing、dataframe

我有一个Pandas dataframe，在这里我指定了一些列作为索引： planets_dataframe.set_index(['host','name'], inplace=True) 并希望能够在不同的情况下引用这些指数。在查询中，使用索引的名称很好。 planets_dataframe.query('host == "PSR 1257 12"') 但是，如果尝试使用它获取索引值的列表，就会导致错误，就像在列时一样。 planets_dataframe.name #AttributeError: 'DataFram

浏览 4提问于2014-04-26得票数 14

回答已采纳

1回答

将有限索引上的数据帧连在一起，否则将开始一个新的列-熊猫。

python、pandas、dataframe

我需要向数据帧的最后一列添加新数据，如果数据帧中有任何空单元格，或者创建一个新列。我想知道是否有任何通过熊猫功能(例如，合作、加入、合并等)来实现这一目标的节奏式方法。例子如下： import numpy as np import pandas as pd df1 = pd.DataFrame({'0':[8, 9, 3, 5, 0], '1':[9, 6, 6, np.nan, np.nan]}) df2 = pd.DataFrame({'2':[2, 9, 4]}, index = [3,4,0]) desired_output = p

浏览 0提问于2022-04-04得票数 1

1回答

从存储在DataFrame中的列表中删除项

python、pandas、list、nlp

我有一个DataFrame，其中包含一些(文本)清洁广告在一栏和一些非常基本的描述相同的广告在另一栏。我还将术语频率以‘关键字’：频率格式存储在字典中。任务是从df中的列表中清除低于某个频率切点水平的所有术语。 import pandas as pd adset = {"ID": ["(1483785165, 2009)", "(1538280431, 2010)", "(1795044103, 2010)"], "Body":[['price', '#', &#

浏览 1提问于2021-11-12得票数 2

回答已采纳

2回答

pandas等同于R的cbind (垂直连接/堆叠向量)

python-3.x、pandas、concat、cbind

假设我有两个数据帧： import pandas .... .... test1 = pandas.DataFrame([1,2,3,4,5]) .... .... test2 = pandas.DataFrame([4,2,1,3,7]) .... 我尝试过test1.append(test2)，但它相当于R的rbind。如何将这两列合并为数据帧的两列，类似于R中的cbind函数？

浏览 4提问于2015-02-19得票数 45

回答已采纳

3回答

像访问常规列一样访问Pandas索引

python、pandas、dataframe、indexing、series

我有一个带有命名索引的Pandas DataFrame。我想把它传递给一段代码，该代码接受一个DataFrame、一个列名和其他一些东西，并执行一系列涉及该列的工作。只有在这种情况下，我想要突出显示的列是索引，但是为这段代码提供索引标签是行不通的，因为您不能像提取常规列那样提取索引。例如，我可以像这样构造一个DataFrame： import pandas as pd, numpy as np df=pd.DataFrame({'name':map(chr, range(97, 102)), 'id':range(10000,10005), 'valu

浏览 1提问于2018-09-03得票数 32

2回答

在应用函数之后，如何用多行替换熊猫中的一行？

python、pandas、dataframe、text-processing、data-processing

我有一个熊猫数据，它只包含一个列，其中包含一个字符串。我想要向每一行应用一个函数，该函数将将字符串按句子拆分，并将该行替换为从函数生成的行。示例dataframe： import pandas as pd df = pd.DataFrame(["A sentence. Another sentence. More sentences here.", "Another line of text"]) df.head()输出 0 0 A sentence. An

浏览 3提问于2022-02-15得票数 2

回答已采纳

2回答

无法用字典更新Pandas dataframe元素

python、pandas、dataframe、dictionary

我有一个Pandas dataframe，其中只有2列:第一列是名称，第二列是与名称相关的信息字典。添加新行很好，但是如果我尝试通过指定一个新字典来更新字典列，我将得到 ValueError: Incompatible indexer with Series 所以，准确地说，这就是我为了产生错误而做的事情： import pandas as pd df = pd.DataFrame(data=[['a', {'b':1}]], columns=['name', 'attributes']) pos = df[df.loc[:,

浏览 22提问于2022-06-24得票数 0

1回答

用时间戳交错Pandas Dataframes

python、pandas

我有2个Pandas DataFrame，每个都包含2列。其中一列是时间戳列t，另一列包含传感器读数。现在我想要创建一个包含4个列的DataFrame，它被交织在时间戳列上。示例：第一个Dataframe： +----+----+ | t1 | s1 | +----+----+ | 0 | 1 | | 2 | 3 | | 3 | 3 | | 5 | 2 | +----+----+ 第二个DataFrame： +----+----+ | t2 | s2 | +----+----+ | 1 | 5 | | 2 | 3 | | 4 | 3 | +----+----+

浏览 0提问于2015-05-04得票数 0

回答已采纳

2回答

如何为DataFrame中的每一列绘制盒图？

python、pandas、matplotlib

我有一个多列的DataFrame df，我希望使用matplotlib为每个列创建一个boxplot 。下面我的df.info()输出的DataFrame供参考 <class 'pandas.core.frame.DataFrame'> RangeIndex: 9568 entries, 0 to 9567 Data columns (total 5 columns): Ambient Tempreature 9568 non-null float64 Exhaust Vacuum 9568 non-null float64 Ambient

浏览 0提问于2018-08-09得票数 10

回答已采纳

1回答

如何检查Pandas Dataframe列是否包含值？

pandas

我想检查pandas.DataFrame列是否包含特定值。例如，这个玩具Dataframe在"two"列中有一个"h" import pandas as pd df = pd.DataFrame( np.array(list("abcdefghi")).reshape((3, 3)), columns=["one", "two", "three"] ) df one two three 0 a b c 1 d e f 2 g h i

浏览 1提问于2021-11-12得票数 0

1回答

将python dataframe的每个元素划分为一个系列

python、pandas

我有如下所示的数据： import pandas as pd data1 = {"a":[1.,3.,5.,2.], "b":[4.,8.,3.,7.], "c":[5.,45.,67.,34]} data2 = {"a":[4., 6, 8] } df = pd.DataFrame(data1) df2 = pd.DataFrame(data2) 因此，df的每个元素都应该除以df2的第一行，直到全部。我所做的： df = df.divide(df2, axis=0 ) 它给了我所有的行为N

浏览 6提问于2022-05-06得票数 0

回答已采纳

2回答

如何在python dataframe的单个列中划分元素？

python、pandas、division

我需要将Pandas DataFrame中特定列中的每个元素除以100。默认情况下，Pandas中的.div()函数将所有元素划分为所有列，并且试图指定要划分的列只剩下这些列。 d = { 'SYMBOL':['AAAAA','BBBBB','CCCCC'], 'ASSETS':[5, 21, 74]} data = pd.DataFrame(d,columns=['SYMBOL','ASSETS']) data = data['ASSETS']

浏览 0提问于2019-07-02得票数 1

回答已采纳

3回答

Python向字典中写入大量数据时超时

python、pandas、dictionary

我有一段工作代码，它读取pandas列，并将其唯一值写入字典，然后将该值映射为整数。问题是它的计算效率太低，而且总是在它完成之前被杀死。我有165个这样的列和每列的300,000+行。示例： my pandas dataframe df: A B cat lion dog tiger cat tiger my output dictionary: dict['A'] = {'cat':1,'dog',2} dict['B'] = {'lion':1,'tiger',2}

浏览 10提问于2017-02-12得票数 0

回答已采纳

1回答

如何使用.loc和.contains设置列值

python、pandas、numpy、loc

.loc和.contains函数都返回一个dataframe对象。pandas文档指出，要为列中的每一行重新赋值，我应该使用.loc，但当与.contains结合使用时，我会收到以下警告：正在尝试对DataFrame中切片的副本设置值。尝试使用.locrow_indexer，col_indexer = value，请参阅文档中的注意事项：但是，这个过程是有效的，并且我得到了数据帧的列中每一行所需的值重新赋值。如何避免此警告？ #works df.loc[df["matchType"]=='duo',["matchType"]]='du

浏览 0提问于2019-04-15得票数 0

1回答

Pandas如何在不丢失列标题的情况下连接两个数据帧

python、pandas

我有以下玩具代码： import pandas as pd df = pd.DataFrame() df["foo"] = [1,2,3,4] df2 = pd.DataFrame() df2["bar"]=[4,5,6,7] df = pd.concat([df,df2], ignore_index=True,axis=1) print(list(df)) 输出：[0,1] 预期输出：[foo,bar] (顺序并不重要) 如果我能保证两个数据帧的标题是唯一的，有没有办法在不丢失原始列标题的情况下连接两个数据帧呢？我想到了遍历这些列，然后

浏览 1提问于2017-04-14得票数 16

回答已采纳

4回答

我如何使用pandas agg对布尔值进行求和，并始终得到结果？

python、pandas、pandas-groupby

我有一个包含bool类型列的数据框。我想使用pandas的groupby和agg函数来获取每个id的True值的数量。我已经做过很多次了，但是结果列的类型似乎取决于数据框。下面是一个示例： import pandas as pd d = {'id': [1, 1, 2, 3], 'bool': [True, False, False, True]} df = pd.DataFrame(data=d) print(df.groupby(['id']).agg({'bool': 'sum'})) 我从这段代码

浏览 0提问于2020-04-03得票数 1

1回答

重新排序dataframe列

python、csv、pandas

是否有办法从txt-文件中订购Pandas数据文件中的列： pandas.DataFrame.read_table 例如，从csv文件中，使用： pandas.DataFrame.to_csv 中可以传递订单列。 columns 或者一般情况下，是否有一种重新排序dataframe列的方法？也许使用.ix模块？

浏览 2提问于2014-07-15得票数 1

回答已采纳

1回答

为什么在Pandas.DataFrame上使用Pandas.DataFrame

pandas

什么时候应该在一列Pandas.Series上使用Pandas.DataFrame？我觉得单列dataframe提供了更多的灵活性，所以也许这只是一个什么时候这种灵活性可能会带来更大的伤害而不是好处的问题？有什么性能问题我应该考虑吗？

浏览 2提问于2014-06-23得票数 1

回答已采纳

1回答

pandas.DataFrame.groupby.nunique()没有删除groupby列。这是一个错误吗？

python、pandas、pandas-groupby

尽管我将参数as_index设置为True，但pandas.DataFrame.groupby.nunique()会将我分组的列保留在结果中。 pandas版本为: 0.24.1 df = pd.DataFrame( {'a': [1, 1, 2, 3, 2], 'b': [1, 2, 3, 4, 4]} ) df.groupby('a', as_index=True).nunique() 输出为： # a b # a # 1 1 2 # 2 1 2 # 3 1 1 我期望： # b # a

浏览 0提问于2019-08-21得票数 2

1回答

将函数应用于MultiIndex pandas.DataFrame列

python、pandas、apply、multi-index

我有一个MultiIndex DataFrame，其中我想将一个函数应用到它的一个列中，并将结果分配给同一列。 In [1]: import numpy as np import pandas as pd cols = ['One', 'Two', 'Three', 'Four', 'Five'] df = pd.DataFrame(np.array(list('ABCDEFGHIJKLMNO'), dtype='object').reshape(3,

浏览 4提问于2014-04-08得票数 5

回答已采纳

3回答

如何在Python中从创建的Dataframe中删除索引？

python、python-3.x、pandas

我使用以下命令通过合并两个列表创建了一个Dataframe df： import pandas as pd df=pd.DataFrame({'Name' : list1,'Probability' : list2}) 但是我想删除第一列(索引列)，并将名为Name的列作为第一列。我尝试使用del df['index']和index_col=0。但它们不起作用。我还检查了reset_index()，但这不是我需要的。我想从像这样创建的Dataframe中完全删除整个索引列(如上所述)。谁来帮帮忙！

浏览 5提问于2016-05-21得票数 17

回答已采纳

2回答

如何通过分组将Pandas Dataframe转换为数据字典

python、pandas、dataframe、dictionary、pandas-groupby

我有一个由3D数据构建的DataFrame，其形式如下：指数：A，B 列：1.a，1.b，2.a，2.b 我试图把它解压缩到字典中，用索引{1,2}和列{A，B}将{a，b}映射到DataFrames。示例输入： aa = pandas.DataFrame({'1.a':[1,2], '1.b':[3,4], '2.a':[5,6], '2.b':[7,8], 'index':['A', 'B']}).set_index('index') 目标输出： bb =

浏览 8提问于2021-01-28得票数 0

回答已采纳

1回答

更改熊猫组栏抛出警告

python、pandas

在下面的代码中，我将DataFrame的点按其X值分组到回收箱中。现在我想给Y列分配一个组ID，但是熊猫总是给我一个SettingWithCopyWarning类型的警告。我做错了什么？ import numpy as np import pandas as pd d = np.random.random((10, 2)) d[:, 1] = 0 m = pd.DataFrame(d, columns=("x", "gid")) dx = 0.2 grp = m.groupby(lambda i: int(m["x"][i] / dx)) gid

浏览 2提问于2015-05-19得票数 0

回答已采纳

1回答

使用熊猫将多个csv文件连接到一个文件夹中[MemoryError:]

python、pandas

我在一个文件夹中有5个csv文件，在这里我想将每个csv文件中的所有列连接到一个dataframe中。当我只加入2个csv文件时，它工作得很好，但是当我想加入5个csv文件时，我遇到了一个错误。我的代码如下： In [7]: import pandas import os import numpy as np import glob path =r'D:/PreprocessingITRC/output/All/' allFiles = glob.glob(path + "/*.csv") dataframe = pandas.DataFrame() for

浏览 4提问于2015-04-20得票数 2

回答已采纳

3回答

pandas read_csv index_col=None不使用每行末尾的分隔符

python、pandas

我正在阅读“Python for Data Analysis”这本书，但在“Example: 2012联邦选举委员会数据库”部分将数据读取到DataFrame时遇到了问题。问题是其中一列数据总是被设置为索引列，即使index_col参数设置为None也是如此。下面是指向数据的链接：。下面是加载代码(为了节省检查时间，我设置了nrows=10)： import pandas as pd fec = pd.read_csv('P00000001-ALL.csv',nrows=10,index_col=None) 为了保持简短，我排除了数据列输出，但以下是我的输出(请不要使用索引

浏览 2提问于2012-10-19得票数 63

回答已采纳

1回答

Pandas中的行系列与Col系列

python、pandas、dataframe

行和列在本质上是否与数据对象相同？例如，在以下方面： import pandas as pd df = pd.DataFrame([ {"Title": "Titanic", "ReleaseYear": 1997, "Director": "James Cameron"}, {"Title": "Spider-Man", "ReleaseYear": 2002, "Director": "Sam Raimi"}

浏览 2提问于2020-08-16得票数 2

回答已采纳

2回答

从dask dataframe保存多个地块文件

python、dask、parquet

我想从Dask dataframe中保存多个拼图文件，一个拼图文件用于特定列中的所有唯一值。因此，拼图文件的数量应该等于该列中唯一值的数量。例如，给定以下数据帧，我想保存四个拼图文件，因为在列"A“中有四个唯一的值。 import pandas as pd from dask import dataframe as dd df = pd.DataFrame( { "A": [1, 1, 2, 3, 1, 3, 6, 6], "B": ["A", "L", "C",

浏览 5提问于2021-04-09得票数 1

2回答

将元组的列拆分为两列

python、python-2.7、pandas、dataframe、dask

我正在使用python2.7和dask 我有一个dataframe，其中有一个元组列，我创建了如下所示： table[col] = table.apply(lambda x: (x[col1],x[col2]), axis = 1, meta = pd.Dataframe) 我想把这个元组列重新转换成熊猫中的两个独立列，我会这样做： table[[col1,col2]] = table[col].apply(pd.Series) 这样做的要点是，dask dataframe不支持多个索引，我希望根据多个列使用groupby，并希望创建一个元组列，该列将为我提供一个包含我所需的所有值的索引(

浏览 7提问于2017-11-19得票数 4

回答已采纳

7回答

是否同时对列和索引值对pandas数据帧进行排序？

python、pandas、sorting、dataframe

按列的值和索引对pandas dataframe进行排序是否可行？如果按列的值对pandas数据帧进行排序，则可以得到按列排序的结果数据帧，但不幸的是，您会看到数据帧的索引顺序与排序列的值相同。那么，我是否可以按列对数据帧进行排序，例如名为count的列，但也可以按索引值对其进行排序？按降序对列进行排序也是可行的，但是按升序对索引进行排序是否可行呢？我知道如何对dataframe中的多个列进行排序，也知道通过首先对索引执行reset_index()并对其进行排序，然后再次创建索引，就可以实现这里所要求的结果。但是，这是不是更直观、更有效的方法呢？

浏览 2提问于2013-11-29得票数 59

2回答

合并大熊猫的几个枢轴表

python、python-3.x、pandas

我怎么能合并两张熊猫枢轴表？当我尝试运行我的代码时，我有错误: keyerror data_pivot= pandas.DataFrame(data.pivot_table(值= 'NR_ACTIONS'，index="HOUR"，"OPID"，“名称”，列=‘CONTACTED_PERSON_NEW’，aggfunc=‘sum’) data_pivot.fillna(0，inplace=True) data2_pivot= pandas.DataFrame(data2.pivot_table(值=‘data.pivot_table_PA’，i

浏览 2提问于2015-08-19得票数 5

回答已采纳

3回答

根据其他列的条件填充空熊猫列

python、pandas、dataframe

假设我有以下玩具dataframe： # Import pandas library import pandas as pd # initialize list of lists data = [['tom', 10], ['nick', 15], ['juli', 14]] # Create the pandas DataFrame df = pd.DataFrame(data, columns = ['Name', 'Age']) # print dataframe. df 我创建了一个空列，我想

浏览 1提问于2019-08-15得票数 4