首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

1. Pandas系列 - 基本数据结构

从面板中选择数据 系列(Series)是能够保存任何类型数据(整数,字符串,浮点数,Python对象等)一维标记数组。...,与数据长度相同 默认np.arange(n)如果没有索引被传递 3 dtype dtype用于数据类型 如果没有,将推断数据类型 4 copy 复制数据,默认为false 构成一个Series输入有...数据帧(DataFrame)功能特点: 潜在列是不同类型 大小可变 标记轴(行列) 可以对行列执行算术运算 构造函数: pandas.DataFrame(data, index, columns...这只有在没有索引传递情况下才是这样。 4 dtype 每列数据类型。 5 copy 如果默认值为False,则此命令(或任何它)用于复制数据。...major_axis) x 5 (minor_axis) Items axis: 0 to 1 Major_axis axis: 0 to 3 Minor_axis axis: 0 to 4 从DataFrame对象

5.1K20

上手Pandas,带你玩转数据(1)-- 实例详解pandas数据结构

1.对表格类型数据读取输出速度非常快。(个人对比excelpandas,的确pandas不会死机....)在他演示中,我们可以看到读取489597行,6列数据只要0.9s。... Series 字典对象生成 DataFrame: df = pd.DataFrame( { 'A': 1., 'B': pd.Timestamp('20130102'), 'C': pd.Series...,缺少元素NaN(不是数字)填充。...这只有在没有通过索引情况下才是正确。 dtype:每列数据类型。 copy:如果默认值为False,则使用该命令(或其它)复制数据。...---- DataFrame基本方法 属性或方法 描述 Ť 转置行列。 axes 以行轴标签列轴标签作为唯一成员返回列表。 dtypes 返回此对象dtypes。

6.7K30
您找到你想要的搜索结果了吗?
是的
没有找到

Python3快速入门(十三)——Pan

Series是带有标签一维数组,可以保存任何数据类型(整数,字符串,浮点数,Python对象等),轴标签统称为索引(index)。...二、Series 1、Series简介 Series是能够保存任何类型数据(整数,字符串,浮点数,Python对象等)一维标记数组,轴标签统称为index(索引)。...index:索引值必须是唯一散列,与数据长度相同。 如果没有索引被传递,默认为np.arange(n)。 dtype:数据类型,如果没有,将推断数据类型。...: Series.axes:返回行轴标签列表 Series.dtype:返回对象数据类型 Series.empty:如果对象为空,返回True Series.ndim:返回底层数据维数,默认为1 Series.size...2、DataFrame特点 数据帧(DataFrame)功能特点如下: (1)底层数据列是不同类型 (2)大小可变 (3)标记轴(行列) (4)可以对行列执行算术运算 3、DataFrame对象构造

8.4K10

十分钟入门 Pandas

通过纳入大量库一些标准数据模型,提供了高效操作大型数据集所需工具; 安装 pip install pandas 数据类型 Series 定义 一维数组类型,其中每个元素有各自标签;可当作一个由带标签元素组成...series字典; 关键点 异构数据; 大小可变; 数据可变; 功能特点 潜在类是不同类型; 大小可变; 标记轴(行列); 可对行列执行算术运算; Panel 定义 三维,大小可变数组...dataFrame = pd.DataFrame(np.random.randn(5)) print('axes:\n', dataFrame.axes) # 2、dtypes,返回对象数据类型 print...(4, 5))} print('DataFrameDict:\n', pd.Panel(data)) """ 描述性统计 """ dict = {'Name':pd.Series(['Tom','James...# 5、split(' ') 给定模式拆分每个字符串。 # 6、cat(sep=' ') 使用给定分隔符连接系列/索引元素。

3.7K30

十分钟入门Pandas

通过纳入大量库一些标准数据模型,提供了高效操作大型数据集所需工具; 安装 pip install pandas 数据类型 Series 定义 一维数组类型,其中每个元素有各自标签;可当作一个由带标签元素组成...字典; 关键点 异构数据; 大小可变; 数据可变; 功能特点 潜在类是不同类型; 大小可变; 标记轴(行列); 可对行列执行算术运算; Panel 定义 三维,大小可变数组; 关键点...dataFrame = pd.DataFrame(np.random.randn(5)) print('axes:\n', dataFrame.axes) # 2、dtypes,返回对象数据类型 print...(4, 5))} print('DataFrameDict:\n', pd.Panel(data)) """ 描述性统计 """ dict = {'Name':pd.Series(['Tom','James...# 5、split(' ') 给定模式拆分每个字符串。 # 6、cat(sep=' ') 使用给定分隔符连接系列/索引元素。

4K30

盘一盘 Python 系列 4 - Pandas (上)

学习 numpy 一样,学习 pandas 还是遵循 Python 里「万物皆对象原则,既然把数据表当对象,我们就按着数据表创建、数据表存载、数据表获取、数据表合并和连接、数据表重塑透视...接下来我们代码来创建 pandas 数据表,有两种方式: 按步就班 pd.Series(), pd.DataFrame() pd.Panel() 一步登天万矿里面的 WindPy API...Series s 也是一个对象 dir(s) 可看出关于 Series 所有的属性内置函数,其中最重要 s.values 打印 s 中元素 s.index 打印 s 中元素对应索引...,这是 s2 索引是一组日期对象,数据类型是 datetime64,频率是 D (天)。...【创建数据表】创建 Series, DataFrame, Panel 下面语句 pd.Series(x, index=idx) pd.DataFrame(x, index=idx, columns=

6.2K52

pandas(一)

data=pd.Series(['a','b','c'],index=[1,3,5])   data.loc[1]   data.loc[1:3]   iloc:表示取值切片都是隐式   data.iloc...(data) 通过series对象创建   pd.DataFrame({'data':data,'age':[1,2,3,4])  *注意此处data是前面series创建好有索引对象 通过numpy...>18,['name','age']] 更新数据 data[0,1]= 20 numpy通用函数pandas也适用 当用两个series对象创建dataframe对象时,会取两个对象并集,没有的nan...index=list('avcde'))   data.fillna(0)  缺失值0填充   data.fillna(method='ffill')  缺失值前面的有效值填充,bfill用后面的有效值填充...  data.fillna(method='ffill',axis=1)  每行前面有效值填充   如果缺失值前面没有值,那么仍然是缺失值

96020

Pandas中文官档 ~ 基础用法1

要是只有浮点数或整数,则输出结果数据类型是浮点数。...values 有以下几个缺点: Series 含扩展类型时,Series.values 无法判断到底是该返回 Numpy array,还是返回 ExtensionArray。...比如,两个 DataFrame 相加,除非两个 DataFrame 里同一个位置都有缺失值,其相加仍为 NaN,如果只有一个 DataFrame 里存在缺失值,则可以 fill_value 指定一个值来替代...False False True b False False False c False False False d True False False 这些操作生成一个与左侧输入对象类型相同...因此,要合并这两个 DataFrame 对象,其中一个 DataFrame 中缺失值将按指定条件另一个 DataFrame 里类似标签中数据进行填充。

2.8K20

Pandas中文官档 ~ 基础用法1

要是只有浮点数或整数,则输出结果数据类型是浮点数。...values 有以下几个缺点: Series 含扩展类型时,Series.values 无法判断到底是该返回 Numpy array,还是返回 ExtensionArray。...比如,两个 DataFrame 相加,除非两个 DataFrame 里同一个位置都有缺失值,其相加仍为 NaN,如果只有一个 DataFrame 里存在缺失值,则可以 fill_value 指定一个值来替代...False False True b False False False c False False False d True False False 这些操作生成一个与左侧输入对象类型相同...因此,要合并这两个 DataFrame 对象,其中一个 DataFrame 中缺失值将按指定条件另一个 DataFrame 里类似标签中数据进行填充。

2.8K10

数据科学 IPython 笔记本 7.4 Pandas 对象介绍

在最基本层面上,Pandas 对象可以认为是 NumPy 结构化数组增强版本,其中行标签而不是简单整数索引来标识。...字典是将任意键映射到一组任意值结构,而Series是将类型化键映射到一组类型化值结构。...这种类型很重要:正如 NumPy 数组后面的特定于类型编译代码,使其在某些操作方面,比 Python 列表更有效,PandasSeries``类型信息使其比 Python 字典更有效。...c': 4}]) a b c 0 1.0 2 NaN 1 NaN 3 4.0 来自序列对象字典 正如我们之前看到那样,DataFrame也可以从Series对象字典构造: pd.DataFrame...作为有序集合索引 Pandas 对象旨在促进一些操作,例如跨数据集连接,这取决于集合运算许多方面。

2.3K10

Pandas中文官档 ~ 基础用法

要是只有浮点数或整数,则输出结果数据类型是浮点数。...values 有以下几个缺点: Series 含扩展类型时,Series.values 无法判断到底是该返回 Numpy array,还是返回 ExtensionArray。...比如,两个 DataFrame 相加,除非两个 DataFrame 里同一个位置都有缺失值,其相加仍为 NaN,如果只有一个 DataFrame 里存在缺失值,则可以 fill_value 指定一个值来替代...False False True b False False False c False False False d True False False 这些操作生成一个与左侧输入对象类型相同...因此,要合并这两个 DataFrame 对象,其中一个 DataFrame 中缺失值将按指定条件另一个 DataFrame 里类似标签中数据进行填充。

2.3K20

数据分析篇 | Pandas基础用法1

要是只有浮点数或整数,则输出结果数据类型是浮点数。...values 有以下几个缺点: Series 含扩展类型时,Series.values 无法判断到底是该返回 Numpy array,还是返回 ExtensionArray。...比如,两个 DataFrame 相加,除非两个 DataFrame 里同一个位置都有缺失值,其相加仍为 NaN,如果只有一个 DataFrame 里存在缺失值,则可以 fill_value 指定一个值来替代...False False True b False False False c False False False d True False False 这些操作生成一个与左侧输入对象类型相同...因此,要合并这两个 DataFrame 对象,其中一个 DataFrame 中缺失值将按指定条件另一个 DataFrame 里类似标签中数据进行填充。

2.3K10

Pandas中文官档 基础用法1

要是只有浮点数或整数,则输出结果数据类型是浮点数。...values 有以下几个缺点: Series 含扩展类型时,Series.values 无法判断到底是该返回 Numpy array,还是返回 ExtensionArray。...比如,两个 DataFrame 相加,除非两个 DataFrame 里同一个位置都有缺失值,其相加仍为 NaN,如果只有一个 DataFrame 里存在缺失值,则可以 fill_value 指定一个值来替代...False False True b False False False c False False False d True False False 这些操作生成一个与左侧输入对象类型相同...因此,要合并这两个 DataFrame 对象,其中一个 DataFrame 中缺失值将按指定条件另一个 DataFrame 里类似标签中数据进行填充。

1.6K20

数据分析厉器---pandas入门

pandas是python非常好用数据分析库, pandas优势 增强图表可读性 便捷数据处理能力 读取文件方便 封装了Matplotlib、Numpy画图计算 series...series创建 Series是一个类似于一维数组数据结构,它能够保存任何类型数据,比如整数、字符串、浮点数等,主要由一组数据与之相关索引两部分构成。...dtype:数据类型 pd.Series(np.arange(9)) 0 0 1 1 2 2 3 3 4 4 5 5 6 6 7 7 8 8 dtype...20 blue 100 dtype: int64 series属性 为了更方便地操作Series对象索引和数据,Series中提供了两个属性indexvalues color_count.index...dtype=int64) color_count[0] 10 color_count[1] 20 DataFrame DataFrame创建 DataFrame是一个类似于二维数组或表格(如excel)对象

67830

Pandas中文官档 ~ 基础用法1

要是只有浮点数或整数,则输出结果数据类型是浮点数。...values 有以下几个缺点: Series 含扩展类型时,Series.values 无法判断到底是该返回 Numpy array,还是返回 ExtensionArray。...比如,两个 DataFrame 相加,除非两个 DataFrame 里同一个位置都有缺失值,其相加仍为 NaN,如果只有一个 DataFrame 里存在缺失值,则可以 fill_value 指定一个值来替代...False False True b False False False c False False False d True False False 这些操作生成一个与左侧输入对象类型相同...因此,要合并这两个 DataFrame 对象,其中一个 DataFrame 中缺失值将按指定条件另一个 DataFrame 里类似标签中数据进行填充。

1.9K30

Python 数据处理:Pandas库使用

1.1 Series Series是一种类似于一维数组对象,它由一组数据(各种 NumPy 数据类型)以及一组与之相关数据标签(即索引)组成。...可以通过Seriesvaluesindex属性获取其数组表示形式索引对象: import pandas as pd obj = pd.Series([4,7,-5,3]) print(obj.values...下表列出了这些方法: 方法 描述 append 连接另一个Index对象,产生一个新Index difference 计算差集,并得到一个Index intersection 计算交集 union...要对行或列索引进行排序(按字典顺序),可使用sort_index方法,它将返回一个排序对象: import pandas as pd obj = pd.Series(range(4), index...;对于数据对齐连接类型操作十分有用 unique 计算Series中唯一值数组,按发现顺序返回 value_counts 返回一个Series,其索引为唯一值,其值为频率,按计数值降序排列

22.7K10
领券