首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

软件测试|数据分析神器pandas教程(三)

DataFrame DataFrame 是一个表格型数据结构,它含有一组有序列,每列可以是不同类型(数值、字符串、布尔型)。...DataFrame 既有索引也有列索引,它可以被看做由 Series 组成字典(共同用一个索引)。...从以上输出结果可以知道, DataFrame 数据类型一个表格,包含 rows() 和 columns(列): 图片 使用字典(key/value)创建DataFrame,代码如下: import pandas...NaN Pandas 可以使用 loc 属性返回指定数据,如果没有设置索引,第一引为 0,第二引为 1,实例如下: import pandas as pd data = { "Goals...为各行索引,逗号隔开: import pandas as pd data = { "Goals": [27, 20, 18], "Asts": [20, 16, 12] } # 数据载入

47520

详解pd.DataFrame几种索引变换

导读 pandas中最常用数据结构是DataFrame,而DataFrame相较于嵌套list或者二维numpy数组更好用原因之一在于其提供了索引和列名。...,当原DataFrame中存在该索引时则提取相应或列,否则赋值为空或填充指定。...对于前面介绍示例数据df,重组引为例,两种可选方式为: ?...注意原df中行索引为[1, 3, 5],而新重组目标索引为[1, 2, 3],其中[1, 3]为已有索引直接提取,[2, 4]在原df中不存在,所以填充空;同时,原df中索引[5]由于不在指定索引中...05 stack与unstack 这也是一对互逆操作,其中stack原义表示堆叠,实现将所有列标签堆叠索引中;unstack即解堆,用于将复合索引中一个维度索引平铺到列标签中。

2.1K20
您找到你想要的搜索结果了吗?
是的
没有找到

初探pandas——安装和了解pandas数据结构

安装pandas 通过python pip安装pandas pip install pandas pandas数据结构 pandas常用数据结构包括:Series和DataFrame Series Series...: int64 左边为索引,右边为,默认索引从0n-1(n为数据长度),可以通过values属性和index属性分别获得Series对象和索引 print(obj.values) array([...dtype: int64 DataFrame DataFrame表示矩阵数据表,包含已排序列集合,每一列可以是不同类型(数值、字符串、布尔等) DataFrame既有索引,也有列索引,可以被视为一个共享相同索引...Series字典 # 创建DataFrame对象 data={'age':[18,18,18,20,20,20],'name':['a','b','c','aa','bb','cc'],'height...一列可以按字典型标记或属性那样索引为Series frame=pd.DataFrame(data,columns=['name','age','height']) print(frame['name'

55110

Pandas入门

]中必须是索引真实; 用iloc进行索引时,中括号[ ]中必须是整数,与列表list索引取值类似,例如obj.iloc[2]就是取第3。...Dataframe既有索引也有列索引,它可以被看做由 Series组成字典(共用同一个索引)。...字典并集成为列 简单例子如下: from pandas import DataFrame data = {'state':['Ohio', 'Ohio', 'Ohio', 'Nevada',...image.png 4.4 DataFrame选出多行 选出第2、 3,即选出索引为1、2,代码如下: 注意,df.iloc 不是方法,是类似于列表list可迭代对象,所以后面必须接中括号[...image.png 附加题:筛选出如下所示数据, 即第37,第36列所有数据 army.iloc[range(3,8)][army.columns[3:7]] ?

2.1K50

Pandas_Study01

pandas 入门概念 series 和 dataframe 这是pandas 中最为基本两个概念,series 类似于一维数组,可以近似当成普通数组进行操作,对于series 默认会有引为它索引...而DataFrame是一种表格型数据结构,它含有一组有序列,每列可以是不同DataFrame既有索引,也有列索引,它可以看作是由Series组成字典,不过这些Series公用一个索引。...iloc 用法(Dataframe) iloc([这里是标识], [这里是列标识]) 语法与loc 看上去比较类似,但功能更为单一 示例: data.iloc[:,1:4] # 返回全部,索引为1...4列 data.iloc[3,[1,5]] #返回索引为3,索引为1和5列。...data.iloc[1:8,[1,5]] #取出索引为17,索引为1和5列。

16610

数据分析之pandas模块

,当用字典时,字典key会成为索引   1,索引和切片 用中括号时,可以是显示索引,也可以是隐式索引 用句点符‘.’...二、DataFrame   DataFrame是一个表格型数据结构,DataFrame由一定顺序排列多列数据组成,设计初衷是将Series使用场景从一维拓展多维,DataFrame既有索引index...1,DataFrame创建   最常用方法是传递一个字典字典key为列索引,每一个key对应作为对应列数据,所以应该是个列表。还可以指定索引,但不可以指定列索引。 ?   ...6,级联 pandas使用pd.concat(),与np.concatedate()类似,参数有些不同。...‘2’这列中‘6’换成‘ww’ df.replace(to_replace={2:6,3:9},value='ww')#把列索引为2中6和列索引为3中9换成‘ww’ df.replace(to_replace

1.1K20

Python之数据规整化:清理、转换、合并、重塑

合并数据集 pandas.merge可根据一个或者多个不同DataFrame连接起来。 pandas.concat可以沿着一条轴将多个对象堆叠一起。...4.1 重塑层次化索引 层次化索引为DataFrame数据重排任务提供了良好一致性方式。主要两种功能: stack:将数据列“旋转”为。...unstack:将数据“旋转”为列。 5. 数据转换 5.1 利用函数或映射进行数据转换 Seriesmap方法可以接受一个函数或含有映射关系字典型对象。...pandascut函数 5.5 检测和过滤异常值 异常值过滤或变换运算很大程度上其实就是数组运算。 6. 字符串操作 6.1 字符串对象方法 split逗号分割字符串可以拆分成数段。...字符串“::”jion方法冒号分隔符形式连接起来。

3K60

Python数据处理(6)-pandas数据结构

首先,使用下面的pandas导入约定: pd是pandas约定俗成缩写,Series和DataFramepandas中两个最重要数据结构。我们将简单介绍二者用法,作为pandas入门。...由于创建Series时没有给定索引参数,于是默认索引为0N-1。 通过Seriesvalues和index属性,可以获取数据数组和索引数组。...我们可以通过传入索引参数对数据进行标记,然后就可以通过索引获取对应数据点,这一点类似于字典数据结构。 和NumPy中介绍很多操作类似,Series同样可以进行布尔索引和矢量化操作。...2.DataFrame DataFramePandas数据分析中最常用和最重要数据结构,它是一个表格型数据结构,这一点与Excel表格十分类似,每个数据点既有索引又有列索引。...创建DataFrame最常用一种方法就是传入一个由等长列表组成字典。 结果DataFrame会自动加上索引(跟Series类似), 并且全部列都会有序排列。

1.1K80

Pandas创建DataFrame对象几种常用方法

DataFramepandas常用数据类型之一,表示带标签可变二维表格。本文介绍如何创建DataFrame对象,后面会陆续介绍DataFrame对象用法。...pandas as pd 接下来就可以通过多种不同方式来创建DataFrame对象了,为了避免排版混乱影响阅读,直接在我制作PPT上进行截图。...生成后面创建DataFrame对象时用到日期时间索引: ? 创建DataFrame对象,索引为2013年每个月最后一天,列名分别是A、B、C、D,数据为124列随机数。 ?...创建DataFrame对象,索引与列名与上面的代码相同,数据为124列1100之间随机数。 ?...根据字典来创建DataFrame对象,字典“键”作为DataFrame对象列名,其中B列数据是使用pandasdate_range()函数生成日期时间,C列数据来自于使用pandasSeries

3.5K80

DataFrame和Series使用

DataFrame和Series是Pandas最基本两种数据结构 可以把DataFrame看作由Series对象组成字典,其中key是列名,是Series Series和Python...原始行索引为0,1,现在行索引为Tome,Bob Series DataFrame 在这里调用时候, 都是大写 (Pandas API 有些是大写字母开头) Series常用属性 1.加载CSV...对象 first_row = data.loc[941] first_row 3.可以通过 index 和 values属性获取索引和 first_row.values # 获取Series中所有的...df按加载部分数据:先打印前5数据 观察第一列 print(df.head()) 最左边一列是行号,也就是DataFrame索引 Pandas默认使用行号作为索引。...Series唯一计数 # 可以使用 value_counts 方法来获取Pandas Series 频数统计 df.groupby(‘continent’) → dataframeGroupby

7910

Python数据分析 | Pandas数据变换高级函数

Pandas中有非常高效简易内置函数可以完成,最核心3个函数是map、apply和applymap。下面我们图解方式介绍这3个方法应用方法。 首先,通过numpy模拟生成一组数据。...对于这两种方式,map都是把对应数据逐个当作参数传入字典或函数中,进行映射得到结果。...例如,我们要对年龄age列进行调整(加上或减去一个),这个加上或减去我们希望通过传入。...Series形式(Series引为列名)传入指定函数,返回相应结果。...对每个Series执行结果后,会将结果整合在一起返回(若想有返回,定义函数时需要return相应) 当然,DataFrameapply和Seriesapply一样,也能接收更复杂函数,如传入参数等

1.3K31

Python | Pandas | DataFrame | 初始化,数据选取

参考链接: Python | Pandas 数据 DataFrame 初始化 1由字典初始化 (1)字典是{key:list} 格式 data = {'name':['li', 'liu', 'chen...(data) print(df)        要注意字典是无序键值对,所以有时会出现数据顺序与预想中不同情况        name score   one      li    90     three...还提供了loc(根据标签)和iloc(根据位置),跟ix在功能上有重叠 先看loc print(df.loc['one'])  #选取索引为'one' print(df.loc[:,['name'...,'sex']])   # 选取所有的以及columns为name和sex数据; print(df.loc[['one','two'],['name','sex']] )  #表示选取索引为'one...'和'two'中olumns为name和sex数据区 #以下两行都是输出 li ,但前者只输出,类型为str,而后者会输出对应列和索引,依旧是DataFrame print(df.loc['one

1.5K00

一文介绍Pandas9种数据访问方式

Pandas核心数据结构是DataFrame,所以在讲解数据访问前有必要充分认清和深刻理解DataFrame这种数据结构。...而每个dict内部则是一个各行索引为key子dict。...前面受where容易使人联想到SQL,其实提到query让人想到仍然是SQL,因为SQL=Structed Query Language,所以query用在DataFrame中其实是提供了一种类SQL...在DataFrame中,filter是用来读取特定或列,并支持三种形式筛选:固定列名(items)、正则表达式(regex)以及模糊查询(like),并通过axis参数来控制是方向或列方向查询...由于DataFrame可看做是嵌套dict结构,所以也提供了类似字典get()方法,主要适用于不确定数据结构中是否包含该标签时,与字典get方法非常类似: ? 9. lookup。

3.7K30

数据分析 ——— pandas数据结构(一)

之前我们了解了numpy一些基本用法,在这里简单介绍一下pandas数据结构。 一、Pandas数据结构 Pandas处理有三种数据结构形式:Series,DataFrame, index。...Series和DataFrame是现在常用两种数据类型。 1. Series Series和一维数组很像,只是它每一个都有一个索引,输出显示时索引在左,在右。...pandas.Series( data, index=index, dtype, copy) data: 可以是多种类型,如列表,字典,标量等 index: 索引必须是唯一可散列,与数据长度相同,...它是最常用Pandas对象。和Series一样,DataFrame接受许多不同类型输入。...pandas.DataFrame( data, index, columns, dtype) data: 包含一维数组,列表对象, 或者是Series对象字典对象 index :对于标签,如果没有索引被传递

2K20

Python可视化数据分析05、Pandas数据分析

对Series对象进行NumPy数组运算,都会保留索引和之间连接。 将Series看成是一个定长有序字典,因为它是一个索引数据一个映射。 ...输出8 print(obj["d"]) # 输出2 print(obj[["a", "c", "d"]]) # 选取索引为"a","c","d"对应。...Datarame有和列索引;它可以被看作是一个Series字典(每个Series共享一个索引)。...对象中values属性 values属性会二维Ndarray形式返回DataFrame数据 如果DataFrame各列数据类型不同,则数组数据类型就会选用能兼容所有列数据 from pandas...(obj[["a", "d"]]) # 获取索引为a和d元素 obj["b":"c"] = 5 # 设置索引bc为5 print(obj) frame = DataFrame(np.arange

2.5K20

Python3快速入门(十三)——Pan

Series 使用字典(dict)作为数据时,如果没有指定索引,则按排序顺序取得字典构造索引。...index:索引标签,如果没有传递索引,索引默认为np.arrange(n)。 columns:列索引标签,如果没有传递列引,默认列索引是np.arange(n)。...DataFrame 使用字典列表作为数据创建DataFrame时,默认使用range(len(list))作为index,字典集合作为columns,如果字典没有相应键值对,其使用NaN填充。...DataFrame 使用Series字典作为数据创建DataFrame时,得到DataFrameindex是所有Seriesindex并集,字典集合作为columns。...选择 DataFrame选择可以通过将标签传递给loc函数来选择,也可以通过将整数位置传递给iloc()函数来选择,返回Series,Series名称是检索标签,Seriesindex为

8.4K10
领券