首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Pandas 2.2 中文官方教程和指南(一)

pandas ,轴旨在为数据提供更多语义含义;即,对于特定数据,很可能有一种“正确”方式来定位数据。因此,目标是减少编写下游函数数据转换所需心理努力。...当特别关注表位置某些和/或时,请在选择括号[]前使用iloc运算符。 使用loc或iloc选择特定和/或时,可以为所选数据分配新值。...记住 在选择数据子集时,使用方括号[]。 在这些括号,您可以使用单个/标签、/标签列表、标签切片、条件表达式或冒号。 使用loc选择特定和/或时,请使用和列名称。...当特别关注表位置某些和/或时,请在选择括号[]前使用iloc运算符。 在使用loc或iloc选择特定和/或时,可以为所选数据分配新值。...记住 在选择数据子集时,使用方括号[]。 在这些括号,您可以使用单个/标签、/标签列表、标签切片、条件表达式或冒号。 使用loc选择特定和/或时,请使用和列名称。

26510

30 个小例子帮你快速掌握Pandas

读取数据 本次演示使用Kaggle上提供客户流失数据[1]。 让我们从将csv文件读取到pandas DataFrame开始。...通过将isna与sum函数一起使用,我们可以看到每缺失值数量。 df.isna().sum() ? 6.使用loc和iloc添加缺失值 正在做这个例子来练习loc和iloc。...同样,对于Balance使用均值替换缺失值。...第一个参数是位置索引,第二个参数是名称,第三个参数是值。 19.where函数 它用于根据条件替换行或值。默认替换值是NaN,但我们也可以指定要替换值。...25.绘制直方图 Pandas不是数据可视化库,但用它创建一些基本图形还是非常简单发现使用Pandas创建基本图比使用其他数据可视化库更容易。 让我们创建Balance直方图。

10.6K10
您找到你想要的搜索结果了吗?
是的
没有找到

手把手教你做一个“渣”数据师,Python代替老情人Excel

二、查看数据属性 现在我们有了DataFrame,可以从多个角度查看数据了。Pandas有很多我们可以使用功能,接下来将使用其中一些来看下我们数据。...6、查看DataFrame数据类型 ? 三、分割:即Excel过滤器 描述性报告是关于数据子集和聚合,当需要初步了解数据时,通常使用过滤器来查看较小数据特定,以便更好理解数据。...2、查看多 ? 3、查看特定 这里使用方法是loc函数,其中我们可以指定以冒号分隔起始行和结束。注意,索引从0开始而不是1。 ? 4、同时分割 ? 5、在某一筛选 ?...4、将总添加到已存在数据 ? 5、特定总和,使用loc函数 ? 或者,我们可以用以下方法: ? 6、drop函数删除 ? 7、计算每总和 ?...简单数据透视表,显示SepalWidth总和,行列SepalLength和标签名称。 现在让我们试着复杂化一些: ? fill_value参数将空白替换为0: ?

8.3K30

Read_CSV参数详解

对于多文件正在准备 本地文件读取实例:://localhost/path/to/table.csv sep : str, default ‘,’ 指定分隔符。如果不指定参数,则会尝试使用逗号分隔。...header参数可以是一个list例如:[0,1,3],这个list表示将文件这些作为标题(意味着每一有多个标题),介于中间行将被忽略掉(例如本例2;本例数据1,2,4行将被作为多级标题出现...names : array-like, default None 用于结果列名列表,如果数据文件没有标题,就需要执行header=None。...na_values : scalar, str, list-like, or dict, default None 一组用于替换NA/NaN值。如果传参,需要制定特定空值。默认为‘1....Pandas尝试使用三种不同方式解析,如果遇到问题则使用下一种方式。

2.7K60

pandas.read_csv参数详解

对于多文件正在准备 本地文件读取实例:://localhost/path/to/table.csv sep : str, default ‘,’ 指定分隔符。如果不指定参数,则会尝试使用逗号分隔。...header参数可以是一个list例如:[0,1,3],这个list表示将文件这些作为标题(意味着每一有多个标题),介于中间行将被忽略掉(例如本例2;本例数据1,2,4行将被作为多级标题出现...names : array-like, default None 用于结果列名列表,如果数据文件没有标题,就需要执行header=None。...na_values : scalar, str, list-like, or dict, default None 一组用于替换NA/NaN值。如果传参,需要制定特定空值。默认为‘1....Pandas尝试使用三种不同方式解析,如果遇到问题则使用下一种方式。

3K30

python pandas.read_csv参数整理,读取txt,csv文件

对于多文件正在准备 本地文件读取实例:://localhost/path/to/table.csv sep : str, default ‘,’ 指定分隔符。如果不指定参数,则会尝试使用逗号分隔。...header参数可以是一个list例如:[0,1,3],这个list表示将文件这些作为标题(意味着每一有多个标题),介于中间行将被忽略掉(例如本例2;本例数据1,2,4行将被作为多级标题出现...names : array-like, default None 用于结果列名列表,如果数据文件没有标题,就需要执行header=None。...na_values : scalar, str, list-like, or dict, default None 一组用于替换NA/NaN值。如果传参,需要制定特定空值。默认为‘1....Pandas尝试使用三种不同方式解析,如果遇到问题则使用下一种方式。

3.7K20

python数据分析笔记——数据加载与整理

9、10、11三种方式均可以导入文本格式数据。 特殊说明:第9使用条件是运行文件.py需要与目标文件CSV在一个文件夹时候可以只写文件名。...5、文本缺失值处理,缺失数据要么是没有(空字符串),要么是某个标记值表示,默认情况下,pandas会用一组经常出现标记值进行识别,如NA、NULL等。查找出结果以NAN显示。...重塑数据 1、旋转数据 (1)重塑索引、分为stack(将数据旋转为)和unstack(将数据旋转为)。...一对一替换np.nan替换-999 多对一替换np.nan替换-999和-1000. 多对多替换np.nan代替-999,0代替-1000. 也可以使用字典形式来进行替换。...利用drop_duplicates方法,可以返回一个移除了重复DataFrame. 默认情况下,此方法是对所有的进行重复项清理操作,也可以用来指定特定或多进行。

6K80

python pandas.read_csv参数整理,读取txt,csv文件

对于多文件正在准备 本地文件读取实例:://localhost/path/to/table.csv sep : str, default ‘,’ 指定分隔符。如果不指定参数,则会尝试使用逗号分隔。...header参数可以是一个list例如:[0,1,3],这个list表示将文件这些作为标题(意味着每一有多个标题),介于中间行将被忽略掉(例如本例2;本例数据1,2,4行将被作为多级标题出现...names : array-like, default None 用于结果列名列表,如果数据文件没有标题,就需要执行header=None。...na_values : scalar, str, list-like, or dict, default None 一组用于替换NA/NaN值。如果传参,需要制定特定空值。默认为‘1....Pandas尝试使用三种不同方式解析,如果遇到问题则使用下一种方式。

6.3K60

Python数据科学(六)- 资料清理(Ⅰ)1.Pandas1.资料筛选2.侦测遗失值3.补齐遗失值

,Pandas等,不仅可以快速简单地清理数据,还可以让非编程的人员轻松地看见和使用数据。...Pandas 纳入了大量库和一些标准数据模型,提供了高效地操作大型数据所需工具。pandas提供了大量能使我们快速便捷地处理数据函数和方法。...1.资料筛选 #存储元素与切割 import pandas as pd df = pd.DataFrame(info) df.ix[1] # 查看特定 df[['name', 'age']] # 查看特定特定内容...使用0值表示沿着每一标签\索引值向下执行方法 使用1值表示沿着每一或者标签模向执行对应方法 下图代表在DataFrame当中axis为0和1时分别代表含义(axis参数作用方向图示): 3...# 把暂无资料替换成物业费 df[df['物业费'] == ‘暂无资料’, ‘物业费’] = np.nan # 在打开文件时候,直接把暂无资料替换成缺失值 df = pandas.read_csv

2.2K30

30 个 Python 函数,加速你数据分析处理速度!

为了更好学习 Python,将以客户流失数据为例,分享 「30」 个在数据分析过程中最常使用函数和方法。...我们减了 4 ,因此列数从 14 个减少到 10 。 2.选择特定 我们从 csv 文件读取部分列数据。可以使用 usecols 参数。...12.Groupby 函数 Pandas Groupby 函数是一个多功能且易于使用功能,可帮助获取数据概述。它使浏览数据和揭示变量之间基本关系更加容易。 我们将做几个组比函数示例。....where 函数 它用于根据条件替换行或值。...发现使用 Pandas 创建基本绘图更容易,而不是使用其他数据可视化库。 让我们创建平衡直方图。 ? 26.减少浮点数小数点 pandas 可能会为浮点数显示过多小数点。

8.9K60

Pandas教程

作为每个数据科学家都非常熟悉和使用最受欢迎和使用工具之一,Pandas库在数据操作、分析和可视化方面非常出色 为了帮助你完成这项任务并对Python编码更加自信,Pandas上一些最常用函数和方法创建了本教程...;(2)它非常小,很简单 泰坦尼克号数据可以在这里下载:https://bit.ly/33tOJ2S 导入库 为了我们目的,“Pandas”库是必须导入 import pandas as pd...a) 使用read_csv将csv文件导入。你应该在文件添加数据分隔符。...在这种情况下,从第4到第10选择年龄大于或等于10岁乘客。 data.loc[4:10, ['Age']] >= 10 ? g) 在某些条件下使用loc选择特定值。...布尔索引:iloc data.iloc[, ]按数字选择 a) 选择数据第4。 data.iloc[3] ? b) 从所有中选择一个行数组。

2.8K40

Python—关于Pandas缺失值问题(国内唯一)

获取文中CSV文件用于代码编程,请看文末,关注,致力打造别人口中公主 在本文中,我们将使用PythonPandas库逐步完成许多不同数据清理任务。...是否还有其他类型丢失数据不太明显(无法通过Pandas轻松检测到)? 了说明意思,让我们开始研究示例。 我们要使用数据是非常小房地产数据。...稍后我们将使用它来重命名一些缺失值。 导入库后,我们将csv文件读取到Pandas数据使用该方法,我们可以轻松看到前几行。...这些是Pandas可以检测到缺失值。 回到我们原始数据,让我们看一下“ ST_NUM”。 ? 第三中有一个空单元格。在第七,有一个“ NA”值。 显然,这些都是缺失值。...从前面的示例,我们知道Pandas将检测到第7空单元格为缺失值。让我们一些代码进行确认。

3.1K40

Python库实用技巧专栏

sep: str 指定数据分隔符, 默认尝试","分隔, 分隔符长于一个字符且不是"\s+", 将使用python语法分析器, 并且忽略数据逗号 delimiter: str 定界符, 备选分隔符...=0表示第一数据而不是文件第一 names: array like 用于结果列名列表, 若数据文件没有标题则需要执行header=None, 默认列表不能出现重复, 除非设定参数mangle_dupe_cols...=False来使pandas不适用第一作为索引 usecols: array-like 返回一个数据子集, 该列表值必须可以对应到文件位置(数字可以对应到指定)或者是字符传为文件列名...从文件头开始算起) na_values: scalar, str, list-like, or dict 一组用于替换NA/NaN值, 如果传递, 需要制定特定空值。...来做转换, Pandas尝试使用三种不同方式解析, 如果遇到问题则使用下一种方式 使用一个或者多个arrays(由parse_dates指定)作为参数 连接指定多字符串作为一个列作为参数 每行调用一次

2.3K30

超全pandas数据分析常用函数总结:上篇

基础知识在数据分析中就像是九阳神功,熟练掌握,加以运用,就可以练就深厚内力,成为绝顶高手自然不在话下! 为了更好地学习数据分析,对于数据分析pandas这一模块里面常用函数进行了总结。...创建数据并读取 2.1 创建数据 构造了一个超市购物数据,该数据属性包括:订单ID号(id)、订单日期(date)、消费金额(money)、订单商品(product)、商品类别(department...# np.arange会自动输出范围数据,这里会输出101~110id号。...() # 数据相关信息概览:索引情况、数据类型、非空值、内存使用情况 data.describe() # 快速综合统计结果 4....数据清洗 4.1 查看异常值 当然,现在这个数据很小,可以直观地发现异常值,但是在数据很大时候,下面这种方式查看数据集中是否存在异常值,如果有其他更好方法,欢迎传授给我。

3.5K31

Pandas 学习手册中文第二版:6~10

如果不这样做,Pandas 将假定第一数据一部分,这将在以后处理引起一些问题。 指定要加载特定 还可以指定读取文件时要加载。...在本章,我们将研究 Pandas 解决这些问题有多么容易。 如何处理缺失数据数据NaN值(也称为np.nan – 来自 NumPy 形式)时,Pandas 缺少。...其他值(甚至另一种类型数据)明确替换某些值 应用方法来基于算法转换值 只需删除多余 我们已经了解了如何使用几种技术删除,因此在此不再赘述。...前面我们已经看到了如何使用.fillna()方法您自己决定替换NaN值。...-2e/img/00504.jpeg)] 替换特定值非常方便,因为它为否则需要编码遍历所有循环提供了快捷方式。

2.2K20

2天学会Pandas

根据位置设置loc和iloc4.3 根据条件设置4.4 按设置4.5 添加Series序列(长度必须对齐)4.6 设定某行某列为特定值4.7 修改一整行数据5.Pandas处理丢失数据5.1 创建含...NaN矩阵5.2 删除掉有NaN5.3 替换NaN值为0或者其他5.4 是否有缺失数据NaN6.Pandas导入导出6.1 导入数据6.2 导出数据7.Pandas合并操作7.1 Pandas...# 获取特定 # 指定行数据 print(df.loc['20180819']) ''' A 0 B 1 C 2 D 3 Name: 2018-08-19 00:00:00...[2,:]=np.nan df.ix['20180823'] = np.nan print(df) 5.Pandas处理丢失数据 5.1 创建含NaN矩阵 # Pandas处理丢失数据 import...16 17.0 18.0 19 2018-08-25 20 21.0 22.0 23 ''' 5.2 删除掉有NaN # 删除掉有NaN print(df.dropna(

1.5K20

最全面的Pandas教程!没有之一!

比如尝试获取上面这个表 name 数据: ? 因为我们只获取一,所以返回就是一个 Series。可以 type() 函数确认返回值类型: ?...交叉选择数据 我们可以 .xs() 方法轻松获取到多级索引某些特定级别的数据。比如,我们需要找到所有 Levels ,Num = 22 : ?...当你使用 .dropna() 方法时,就是告诉 Pandas 删除掉存在一个或多个空值(或者)。删除是 .dropna(axis=0) ,删除是 .dropna(axis=1) 。...比如,将表中所有 NaN 替换成 20 : ? 当然,这有的时候打击范围太大了。于是我们可以选择只对某些特定或者进行填充。比如只对 'A' 进行操作,在空值处填入该平均值: ?...查找空值 假如你有一个很大数据,你可以 Pandas .isnull() 方法,方便快捷地发现表空值: ?

25.8K64

数据科学 IPython 笔记本 7.7 处理缺失数据

许多教程数据与现实世界数据之间差异在于,真实世界数据很少是干净和同构。特别是,许多有趣数据缺少一些数据。为了使事情变得更复杂,不同数据源可能以不同方式标记缺失数据。...在标记方法,标记值可能是某些特定数据惯例,例如例如使用-9999或某些少见位组合来表示缺失整数值,或者它可能是更全局惯例,例如使用NaN(非数字)表示缺失浮点值,这是一个特殊值,它是 IEEE...空值上操作 正如我们所看到Pandas 将None和NaN视为基本可互换,用于指示缺失值或空值。为了促进这个惯例,有几种有用方法可用于检测,删除和替换 Pandas 数据结构空值。...参数允许你为要保留/指定最小数量非空值: df.dropna(axis='rows', thresh=3) 0 1 2 3 1 2.0 3.0 5 NaN 这里删除了第一和最后一,因为它们只包含两个非空值...填充空值 有时比起删除 NA 值,你宁愿有效值替换它们。这个值可能是单个数字,如零,或者可能是某种良好替换或插值。

4K20
领券