为什么熊猫要区分Series
和单列DataFrame
换句话说:Series
类存在的原因是什么?
我主要使用带有datetime索引的时间序列,这可能有助于设置上下文。
发布于 2016-08-19 16:22:00
在pandas文档中,http://pandas.pydata.org/pandas-docs/stable/dsintro.html系列是一个一维标签数组,能够容纳任何数据类型。要以panda Series的形式读取数据:
import pandas as pd
ds = pd.Series(data, index=index)
DataFrame是一个具有潜在不同类型的列的二维标记数据结构。
import pandas as pd
df = pd.DataFrame(data, index=index)
在上面的两个索引中都是列表
例如:我有一个包含以下数据的csv文件:
,country,popuplation,area,capital
BR,Brazil,10210,12015,Brasile
RU,Russia,1025,457,Moscow
IN,India,10458,457787,New Delhi
要将上述数据作为序列和数据帧读取:
import pandas as pd
file_data = pd.read_csv("file_path", index_col=0)
d = pd.Series(file_data.country, index=['BR','RU','IN'] or index = file_data.index)
输出:
>>> d
BR Brazil
RU Russia
IN India
df = pd.DataFrame(file_data.area, index=['BR','RU','IN'] or index = file_data.index )
输出:
>>> df
area
BR 12015
RU 457
IN 457787
发布于 2018-05-30 20:23:46
Series是一个一维对象,可以保存任何数据类型,例如整数、浮点数和字符串
import pandas as pd
x = pd.Series([A,B,C])
0 A
1 B
2 C
系列的第一列称为索引0,1,2第二列是您的实际数据,即A,B,C
DataFrames是二维对象,可以保存序列、列表、字典
df=pd.DataFrame(rd(5,4),['A','B','C','D','E'],['W','X','Y','Z'])
发布于 2018-07-19 18:18:16
Series是一维标签数组,能够容纳任何数据类型(整数、字符串、浮点数、Python对象等)。轴标签统称为索引。创建序列的基本方法是调用:
s = pd.Series(data, index=index)
DataFrame是一个具有潜在不同类型的列的二维标记数据结构。您可以将其视为电子表格或SQL表,或Series对象的字典。
d = {'one' : pd.Series([1., 2., 3.], index=['a', 'b', 'c']),
two' : pd.Series([1., 2., 3., 4.], index=['a', 'b', 'c', 'd'])}
df = pd.DataFrame(d)
https://stackoverflow.com/questions/26047209
复制相似问题