首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Pandas必会的方法汇总,数据分析必备!

11 df.iloc[行位置,列位置] 通过默认生成的数字索引查询指定的数据。...,从DataFrame选取单个行或行子集 6 df.iloc[where_i,where_j] 通过整数位置,同时选取行和列 7 df.at[1abel_i,1abel_j] 通过行和列标签,选取单一的标量...8 df.iat[i,j] 通过行和列的位置(整数),选取单一的标量 9 reindex 通过标签选取行或列 10 get_value 通过行和列标签选取单一值 11 set_value 通过行和列标签选取单一值...举例:使用iloc按位置区域提取数据 df_inner.iloc[:3,:2] #冒号前后的数字不再是索引的标签名称,而是数据所在的位置,从0开始,前三行,前两列。...计算数据最大值所在位置索引(自定义索引) 3 .argmin() 计算数据最小值所在位置索引位置(自动索引) 4 .argmax() 计算数据最大值所在位置索引位置(自动索引) 5 .describe

5.9K20

Pandas必会的方法汇总,建议收藏!

11 df.iloc[行位置,列位置] 通过默认生成的数字索引查询指定的数据。...同时选取行和列 8 df.at[1abel_i,1abel_j] 通过行和列标签,选取单一的标量 9 df.iat[i,j] 通过行和列的位置(整数),选取单一的标量 10 reindex 通过标签选取行或列...11 get_value 通过行和列标签选取单一值 12 set_value 通过行和列标签选取单一值 举例:使用iloc按位置区域提取数据 df_inner.iloc[:3,:2] #冒号前后的数字不再是索引的标签名称...举例:按照索引列排序 df_inner.sort_index() 六、相关分析和统计分析 序号 方法 说明 1 .idxmin() 计算数据最小值所在位置索引(自定义索引) 2 .idxmax() 计算数据最大值所在位置索引...(自定义索引) 3 .argmin() 计算数据最小值所在位置索引位置(自动索引) 4 .argmax() 计算数据最大值所在位置索引位置(自动索引) 5 .describe() 针对各列的多个统计汇总

4.7K40
您找到你想要的搜索结果了吗?
是的
没有找到

00.数据结构关于浮点数运算的越界问题1.数据结构2.Pandas的两种常用数据结构3.Series系列4.DataFrame数据框

关于浮点数运算的越界问题 a = 4.2 b = 2.1 a + b Out[26]: 6.300000000000001 (a + b) == 6.3 Out[27]: False from decimal...2.Pandas的两种常用数据结构 类型 注释 Series 系列 DataFrame 数据框 使用前需要将pandas 模块引入 from pandas import Series, DataFrame...import pandas as pd 3.Series系列 类似一维数组(ndarray)的对象,由一组数据(各种NumPy数据类型)以及与之相关的数据标签(索引)组成,用于存储一行或一列数据。...但是Series除了可以使用位置作为下标存取元素之外,还可以使用标签下标存取元素,这一点和字典相似。...Name: 2, dtype: object df.loc[1:2] Out[24]: age name sex 1 22 Bb F 2 23 Cc M #iloc按位置索引

1.1K10

左手用R右手Python系列——循环中的错误异常规避

Test[5,2]'//mlab.toutiao.com/report/download/report47.pdf' #将其中的第3、5个地址设置为越界地址(就是网址合法但是索引越界,那么你请求不到合法数据...report/download/report570.pdf" Test[5,2]<-"https://mlab.toutiao.com/report/download/report470.pdf" 使用越界地址在浏览中请求的返回界面是这样的...但是如果你在不知情的情况下,不做任何异常处理,那么遇到错误链接导致进程阻塞,编辑会自己弹出错误,然后中断进程,这是我们不愿意看到的。...Python: import json import random import requests import pandas as pd import osimport time 仍然时先抓取PDF下载地址...mydata.to_csv("D:/Python/File/toutiaoreport.csv") 可以看到,R语言与Python的错误捕获与规避机制都很好理解,只要在合适的位置放置好错误捕获函数,并同时指定出错后的解决错误就可以了

1.6K60

Python学习入门到精通:字符串切片操作

切片操作是使用频率非常高的操作,它的一般模式[start:end),左闭右开,索引为end的元素不会被截取。 在交互式解释里跟随我操作 1....指定开始和结束位置 >>> a = 'I like python' >>> a[2:6] 'like' >>> a[2:-7] 'like' 做切片操作时,你也可以使用反向索引 2....指定结束位置,不指定开始位置 >>> a = 'I like python' >>> a[:-7] 'I like' 如果不指定开始位置,那么开始位置就是0 4....切片操作允许索引越界 >>> a = 'I like python' >>> len(a) 13 >>> a[2:19] 'like python' 字符串a的长度是13,索引从0开始,最大索引为12...,19显然已经超出了合理范围,专业名词叫越界,但程序并没有报错,这是切片操作的一个特点,当索引越界时,切片操作将13作为了结束位置

51420

Python 数据处理:Pandas库的使用

行也可以通过位置或名称的方式进行获取,比如用loc属性: import pandas as pd data = {'state': ['Ohio', 'Ohio', 'Ohio', 'Nevada'...向[ ]传递单一的元素或列表,就可选择列。...同时选取行和列 df.at[label_i, label_j] 通过行和列标签,选取单一的标量 df.iat[i,j] 通过行和列的位置(整数),选取单一的标量 reindex 通过标签选取行或列 get_value..., set_value 通过行和列标签选取单一值 ---- 2.5 整数索引 处理整数索引Pandas 对象常常难住新手,因为它与 Python 内置的列表和元组的索引语法不同。...我们有包含0,1,2的索引,但是引入用户想要的东西(基于标签或位置索引)很难,另外,对于非整数索引,不会产生歧义: import pandas as pd ser2 = pd.Series(np.arange

22.7K10

Pandas图鉴(二):Series 和 Index

为了解决这些问题,Pandas又有两种方括号的 "口味": .loc[]总是使用标签并包括区间的两端; .iloc[]总是使用位置索引,并排除了右端。...就像range()一样,它几乎不使用任何内存,并提供与位置索引相吻合的标签。...首先,Pandas 纯粹通过位置来引用行,所以如果想在删除第3行之后再去找第5行,可以不用重新索引(这就是iloc的作用)。...由于系列中的每个元素都可以通过标签或位置索引来访问,所以有一个argmin(argmax)的姐妹函数,叫做idxmin(idxmax),如图所示: 下面是Pandas的自描述性统计函数的列表,供参考:...它可以是 用g.apply(f)接受一个组x(一个系列对象)并生成一个单一的值(如sum())的函数f。

22820

SQL、Pandas和Spark:常用数据查询操作对比

by:设置分组聚合统计的字段 having:依据聚合统计后的字段进一步过滤 order by:设置返回结果排序依据 limit:限定返回结果条数 这是一条SQL查询语句中所能涉及的主要关键字,经过解析和优化之后...与merge操作类似,join可看做是merge的一个简化版本,默认以索引作为连接字段,且仅可通过DataFrame来调用,不是Pandas的顶级接口(即不存在pd.join方法)。...Spark:相较于Pandas中有多种实现两个DataFrame连接的方式,Spark中接口则要单一许多,仅有join一个关键字,但也实现了多种重载方法,主要有如下3种用法: // 1、两个DataFrame...order by用于根据指定字段排序,在Pandas和Spark中的实现分别如下: Pandas:sort_index和sort_values,其中前者根据索引排序,后者根据传入的列名字段排序,可通过传入...limit关键字用于限制返回结果条数,这是一个功能相对单一的操作,二者的实现分别如下: Pandas:可分别通过head关键字和iloc访问符来提取指定条数的结果; Spark:直接内置了limit算子

2.4K20

Pandas】已完美解决:AttributeError: ‘DataFrame‘ object has no attribute ‘ix‘

一、问题背景 在Pandas的早期版本中,ix 是一个方便的索引,允许用户通过标签和整数位置索引DataFrame的行和列。...然而,随着Pandas版本的更新,为了简化API和提高代码的可读性,ix 索引Pandas 0.20.0版本中被弃用,并在后续版本中完全移除。...二、可能出错的原因 使用了Pandas 0.20.0或更高版本,但代码中仍然包含对 ix 的引用。 从旧的Pandas代码或教程中复制了代码,而这些代码是基于已经弃用的 ix 索引的。...loc 主要用于基于标签的索引,而 .iloc 则用于基于整数位置索引。...) 如果你知道要选择的行和列的整数位置,可以使用 .iloc: # 使用.iloc选择第一行和第二列(注意这里索引是从0开始的) result = df.iloc[0, 1] # 第一行是0,第二列

70910

统计师的Python日记【第5天:Pandas,露两手】

数据导出 ---- 统计师的Python日记【第5天:Pandas,露两手】 前言 根据我的Python学习计划: Numpy → Pandas → 掌握一些数据清洗、规整、合并等功能 → 掌握类似与SQL...上一集开始学习了Pandas的数据结构(Series和DataFrame),以及DataFrame一些基本操作:改变索引名、增加一列、删除一列、排序。 今天我将继续学习Pandas。...Python进行数据分析》): 方法 描述 count() 非NA值的数量 describe() 各列的汇总统计 min()、max() 最小、最大值 argmin()、argmax() 最小、最大值对应的索引位置...三、层次化索引 我们前面的索引就是Chu、Bao、Ha、Hu......,单一层次索引,如果索引为亚洲-中国-各个省-各个市,变量为人口,这就是典型的层次化索引。...索引的名字也可以当变量一样命名,分别命名country和year两个索引名: ? 用 .swaplevel() 可以调换两个索引contry和year的位置: ? 3.

3K70

Java基础系列(四十二):集合之AbstractList

ListIterator的实现类ListItr private class ListItr extends Itr implements ListIterator { //指定光标位置等于索引的迭代构造...protected transient int modCount = 0; //判断索引是否越界 private void rangeCheckForAdd(int index) {.../其实这里并不理解,为啥不去检查索引越界。。...return cursor-1; } 假定迭代现在运行到1所在的位置,可以很容易的看出当迭代处于这个位置的时候,去调用nextIndex()方法得到的是1,而调用previousIndex..., 这里的lastRet代表的是上一次迭代到的元素的光标位置,所以,我们来举个例子,当迭代在4的位置的时候,使用了previous()方法,这时的迭代位置是在3,而上次迭代到的元素的游标位置也是3

1.1K20

Java基础-数组的常见操作

创建数组,赋值3个元素,数组的索引就是0,1,2,没有3索引,因此我们不能访问数组中不存在的索引,程序运 行后,将会抛出 ArrayIndexOutOfBoundsException 数组越界异常。...在开发中,数组的越界异常是不能出现的,一 旦出现了,就必须要修改我们编写的代码。 ? 3.2 数组空指针异常 观察一下代码,运行后会出现什么结果。 ?...在开发中,数组的越界异常是不能出现的,一旦出现了,就必须要修 改我们编写的代码。 ? 空指针异常在内存图中的表现 ?...3.5 数组反转 数组的反转: 数组中的元素颠倒顺序,例如原始数组为1,2,3,4,5,反转后的数组为5,4,3,2,1 实现思想:数组最远端的元素互换位置。...实现反转,就需要将数组最远端元素位置交换 定义两个变量,保存数组的最小索引和最大索引 两个索引上的元素交换位置 最小索引++,最大索引–,再次交换位置 最小索引超过了最大索引,数组反转操作结束 ?

53210

JDK1.9-数组的常见操作

3.1 数组越界异常 观察一下代码,运行后会出现什么结果。...创建数组,赋值3个元素,数组的索引就是0,1,2,没有3索引,因此我们不能访问数组中不存在的索引,程序运 行后,将会抛出 ArrayIndexOutOfBoundsException 数组越界异常。...在开发中,数组的越界异常是不能出现的,一 旦出现了,就必须要修改我们编写的代码。 3.2 数组空指针异常 观察一下代码,运行后会出现什么结果。...在开发中,数组的越界异常是不能出现的,一旦出现了,就必须要修 改我们编写的代码。...实现反转,就需要将数组最远端元素位置交换 定义两个变量,保存数组的最小索引和最大索引 两个索引上的元素交换位置 最小索引++,最大索引–,再次交换位置 最小索引超过了最大索引,数组反转操作结束

33830
领券