首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

手把手教你做一个“渣”数据师,用Python代替老情人Excel

6、导入特定 使用usecols参数,可以指定是否DataFrame中导入特定。 ? 这只是个开始,并不是所有的功能,但已足够你“尝鲜”了。...三、分割:即Excel过滤器 描述性报告是关于数据子集和聚合的,当需要初步了解数据,通常使用过滤器来查看较小的数据集或特定,以便更好的理解数据。...14、从DataFrame获取特定的值 ? 如果想要用特定值查看整个DataFrame,可以使用drop_duplicates函数: ? 15、排序 特定排序,默认升序: ?...五、数据计算 1、计算某一特定的值 输出结果是一个系列。称为单列数据透视表: ? 2、计数 统计每或每行的非NA单元格的数量: ? 3、求和 按行或求和数据: ? 为每行添加总: ?...默认方法; outer——当左侧或右侧DataFrame中存在匹配,返回所有记录。 ? 以上可能不是解释这个概念的最好例子,但原理是一样的。

8.3K30

Python 全栈 191 问(附答案)

如何使用正则表达式,匹配浮点数? 使用正则表达式,如何匹配出正整数?...global 关键字在哪些场景发挥重要作用 Python 函数的五类参数都指哪些? 如何区分参数是位置参数还是关键字参数? f(*a,**b) 可变位置参数,可变关键字参数怎么传参?...Pandas 做特征工程之 删除 Pandas 增加特征的方法 Pandas 使用 cut, qcut, ChiMerge 算法做分项总结 LabelEncoder 编码和 get_dummies...Pandas 使用 apply(type) 做类型检查 Pandas 使用标签和位置选择数据的技巧 一个快速清洗数据的小技巧,某列上使用 replace 方法和正则,快速完成值的清洗。...DataFrame 上快速某些展开特征工程,使用 map 如何做到?

4.2K20
您找到你想要的搜索结果了吗?
是的
没有找到

懂Excel也能轻松入门Python数据分析包pandas(二):高级筛选(上)

前言 经常听别人说 Python 在数据领域有多厉害,结果学了很长时间,连数据处理都麻烦得要死。后来才发现,原来不是 Python 数据处理厉害,而是他有数据分析神器—— pandas 。...pandas 中没有啥高级筛选的说法,因为他的筛选本来就很灵活,看看 pandas 的实现: - 简单易懂,都是之前文章介绍过的,这里不多说 特定值过滤 "4、5或7班的记录",Excel 高级筛选的条件区域设置如下...条件值可以直接使用常用的比较符号 - 还是要注意条件标题"总分" pandas 实现如下: - 第一句,添加新,总和。...pandas 新增列非常简单,df[新列名字]=新值,即可 - df.loc[:,'语文':'生物'] ,是获取语文到生物之间的的数据 - .sum(axis=1) ,横向求和。...因为 pandas 可以灵活行或做运算,通过 axis 即可表达运算是行还是操作。

1.2K20

懂Excel也能轻松入门Python数据分析包pandas(二):高级筛选(上)

前言 经常听别人说 Python 在数据领域有多厉害,结果学了很长时间,连数据处理都麻烦得要死。后来才发现,原来不是 Python 数据处理厉害,而是他有数据分析神器—— pandas 。...pandas 中没有啥高级筛选的说法,因为他的筛选本来就很灵活,看看 pandas 的实现: - 简单易懂,都是之前文章介绍过的,这里不多说 特定值过滤 "4、5或7班的记录",Excel 高级筛选的条件区域设置如下...条件值可以直接使用常用的比较符号 - 还是要注意条件标题"总分" pandas 实现如下: - 第一句,添加新,总和。...pandas 新增列非常简单,df[新列名字]=新值,即可 - df.loc[:,'语文':'生物'] ,是获取语文到生物之间的的数据 - .sum(axis=1) ,横向求和。...因为 pandas 可以灵活行或做运算,通过 axis 即可表达运算是行还是操作。

1.5K10

Pandas入门2

image.png 5.3 DataFrame和Series之间的运算 默认情况下,DataFrame和Series之间的算术运算会将Series的索引匹配到DataFram的,然后沿着行一直向下广播...apply方法是DataFram中的每一行或者每一进行映射。 ?...image.png 5.6 pandas的聚合函数 聚合函数包括:求和,最大值,最小值,计数、均值、方差、分位数 这些聚合函数都是基于没有缺失数据的情况。 ?...关键字参数axis,可以填入的值为0或1,0表示行进行操作,1表示进行操作 示例如下: from pandas import Series,DataFrame from numpy import...Python中的字符串处理 对于大部分应用来说,python中的字符串应该已经足够。 如split()函数字符串拆分,strip()函数字符串去除两边空白字符。

4.2K20

一场pandas与SQL的巅峰大战

Python也是分析师常用的工具之一,尤其pandas更是一个数据分析的利器。...pandas可以调用head(n)方法,n是行数。MySQL可以使用limit n,n同样表示行数。(点击图片可以查看大图) ? 2.查询特定的数据 有的时候我们只想查看某几列的数据。...pandas里可以使用中括号或者loc,iloc等多种方式进行列选择,可以选择一或多。loc方式可以直接写列名,iloc方式需要指定索引,即第几列。...3.查询特定去重后的数据 例如我们想查看一共有多少人(去重过的)下过单。pandas里有unique方法,SQL里有distinct关键字。如下面图左侧代码所示。...pandas中,可以使用前文提到的方式进行选择操作,之后可以直接目标进行赋值,SQL中需要使用update关键字进行表的更新。示例如下:将年龄小于20的用户年龄改为20。

2.2K20

python数据科学系列:pandas入门详细教程

或字典(用于重命名行标签和标签) reindex,接收一个新的序列与已有标签匹配,当原标签中不存在相应信息,填充NAN或者可选的填充值 set_index/reset_index,互为逆操作,...isin/notin,条件范围查询,即根据特定值是否存在于指定列表返回相应的结果 where,仍然是执行条件查询,但会返回全部结果,只是将不满足匹配条件的结果赋值为NaN或其他指定值,可用于筛选或屏蔽值...广播机制,即当维度或形状不匹配,会按一定条件广播后计算。由于pandas是带标签的数组,所以广播过程中会自动按标签匹配进行广播,而非类似numpy那种纯粹按顺序进行广播。...3 数据转换 前文提到,处理特定可用replace每个元素执行相同的操作,然而replace一般仅能用于简单的替换操作,所以pandas还提供了更为强大的数据转换方法 map,适用于series...一般而言,分组的目的是为了后续的聚合统计,所有groupby函数一般不单独使用,而需要级联其他聚合函数共同完成特定需求,例如分组求和、分组求均值等。 ?

13.8K20

【Mark一下】46个常用 Pandas 方法速查表

你可以粗略浏览本文,了解Pandas的常用功能;也可以保存下来,作为以后数据处理工作的速查手册,没准哪天就会用上呢~ 1创建数据对象 Pandas最常用的数据对象是数据框(DataFrame)和Series...到n且索引j到k间的记录In: print(data2.iloc[0:2,0:1]) Out: col1 0 2 1 1选取行索引[0:2)索引[0:1)中间的记录...sum()) Out: col2 a 2 b 1 Name: col1, dtype: int64以col2为维度,以col1为指标求和pivot_table建立数据透视表视图In:...,'col3':np.mean})) Out: col1 col3 col2 a 2 0.5 b 1 1.0data2中以col2为维度,col1求和,col3...求均值 作者:宋天龙 摘自:《Python数据分析与数据化运营(第2版)》 来源:Python爱好者社区

4.7K20

通宵翻译Pandas官方文档,写了这份Excel万字肝货操作!

索引值也是持久的,所以如果你 DataFrame 中的行重新排序,特定行的标签不会改变。 5. 副本与就地操作 大多数 Pandas 操作返回 Series/DataFrame 的副本。... Pandas 中,您可以直接整列进行操作。 pandas 通过 DataFrame 中指定单个系列来提供矢量化操作。可以以相同的方式分配新。... Pandas 中,您通常希望使用日期进行计算将日期保留为日期时间对象。输出部分日期(例如年份)是通过电子表格中的日期函数和 Pandas 中的日期时间属性完成的。...提取第n个单词 Excel 中,您可以使用文本到向导来拆分文本和检索特定。(请注意,也可以通过公式来做到这一点。)...查找和替换 Excel 查找对话框将您带到匹配的单元格。 Pandas 中,这个操作一般是通过条件表达式一次整个或 DataFrame 完成。

19.5K20

Pandas中实现Excel的SUMIF和COUNTIF函数功能

顾名思义,该函数满足特定条件的数字相加。 示例数据集 本文使用从Kaggle找到的一个有趣的数据集。...图3:Python pandas布尔索引 使用已筛选的数据框架,可以选择num_calls并计算总和sum()。...使用groupby()方法 pandas库有一个groupby()方法,允许组进行简单的操作(例如求和)。要使用此函数,需要提供组名、数据和要执行的操作。...Pandas中的SUMIFS SUMIFS是另一个Excel中经常使用的函数,允许执行求和计算使用多个条件。 这一次,将通过组合Borough和Location来精确定位搜索。...中不存在 mode()——将提供MODEIF(S),虽然这个函数Excel中不存在 小结 Pythonpandas是多才多艺的。

8.9K30

pandas基础:使用Python pandas Groupby函数汇总数据,获得对数据更好地理解

标签:Python与Excel, pandas Python中,pandas groupby()函数提供了一种方便的方法,可以按照我们想要的任何方式汇总数据。...然而,每个付款期结束,你有没有想过“我到底把这些钱花在哪里了?”。...在下面的示例中,我们首先按星期几对数据进行分组,然后指定要查看的——“Debit(借方)”,最后对分组数据的“Debit”执行操作:计数或求和。...现在,你已经基本了解了如何使用pandas groupby函数汇总数据。下面讨论当使用该函数,后台是怎么运作的。...元组中,第一个元素是类别名称,第二个元素是属于特定类别的子集数据。因此,这是拆分步骤。 我们也可以使用内置属性或方法访问拆分的数据集,而不是其进行迭代。

4.3K50

Python pandasexcel的操作实现示例

最近经常看到各平台里都有Python的广告,都是excel的操作,这里明哥收集整理了一下pandasexcel的操作方法和使用过程。...本篇介绍 pandas 的 DataFrame (Column) 的处理方法。示例数据请通过明哥的gitee进行下载。...数据格式化 pandas 默认的数据显示,没有使用千分位分隔符,在数据较大,感觉不方便。...可以对Excel进行基础的读写操作 Pandas可以实现Excel各表各行各的增删改查 Pandas可以进行表中行筛选等 到此这篇关于Python pandasexcel的操作实现示例的文章就介绍到这了...,更多相关Python pandasexcel操作内容请搜索ZaLou.Cn以前的文章或继续浏览下面的相关文章希望大家以后多多支持ZaLou.Cn!

4.4K20

一场pandas与SQL的巅峰大战

Python也是分析师常用的工具之一,尤其pandas更是一个数据分析的利器。...pandas可以调用head(n)方法,n是行数。MySQL可以使用limit n,n同样表示行数。(点击图片可以查看大图) ? 2.查询特定的数据 有的时候我们只想查看某几列的数据。...pandas里可以使用中括号或者loc,iloc等多种方式进行列选择,可以选择一或多。loc方式可以直接写列名,iloc方式需要指定索引,即第几列。...3.查询特定去重后的数据 例如我们想查看一共有多少人(去重过的)下过单。pandas里有unique方法,SQL里有distinct关键字。如下面图左侧代码所示。...pandas中,可以使用前文提到的方式进行选择操作,之后可以直接目标进行赋值,SQL中需要使用update关键字进行表的更新。示例如下:将年龄小于20的用户年龄改为20。

1.6K40

一场pandas与SQL的巅峰大战

Python也是分析师常用的工具之一,尤其pandas更是一个数据分析的利器。...pandas可以调用head(n)方法,n是行数。MySQL可以使用limit n,n同样表示行数。(点击图片可以查看大图) ? 2.查询特定的数据 有的时候我们只想查看某几列的数据。...pandas里可以使用中括号或者loc,iloc等多种方式进行列选择,可以选择一或多。loc方式可以直接写列名,iloc方式需要指定索引,即第几列。...3.查询特定去重后的数据 例如我们想查看一共有多少人(去重过的)下过单。pandas里有unique方法,SQL里有distinct关键字。如下面图左侧代码所示。...pandas中,可以使用前文提到的方式进行选择操作,之后可以直接目标进行赋值,SQL中需要使用update关键字进行表的更新。示例如下:将年龄小于20的用户年龄改为20。

1.6K10

Panda处理文本和时序数据?首选向量化

作者:luanhz 导读 Pandas作为Python数据分析的首选框架,不仅功能强大接口丰富,而且执行效率也相比原生Python要快的多,这是得益于Pandas底层由C实现,同时其向量化执行方式也非常利于并行计算...01 字符串接口——str Pandas中,当一数据类型均为字符串类型,则可对该执行属性接口操作,即通过调用.str属性可调用一系列的字符串方法函数,其中这里的字符串方法不仅涵盖了Python中内置的字符串通用方法...,其中lower是Python字符串内置的通用方法,replace虽然是Pandas中的全局方法,但嵌套了一层str属性接口后即执行正则匹配的替换,这里即用到了正则表达式的匹配原则,即对a-z字母以外的其他字符替换为空字符...以上,举了几个简单的例子pandas中的字符串属性接口str进行了牛刀小试,其中包括python内置的字符串函数split、count、len等,也包括findallreplace中嵌套正则表达式等用法...基本都是Python中常用的字符串函数,调用时只需一个字符串列后调用str即可,方法简单,但效率却是异常明显的。

94320

Panda处理文本和时序数据?首选向量化

导读 Pandas作为Python数据分析的首选框架,不仅功能强大接口丰富,而且执行效率也相比原生Python要快的多,这是得益于Pandas底层由C实现,同时其向量化执行方式也非常利于并行计算。...01 字符串接口——str Pandas中,当一数据类型均为字符串类型,则可对该执行属性接口操作,即通过调用.str属性可调用一系列的字符串方法函数,其中这里的字符串方法不仅涵盖了Python中内置的字符串通用方法...,其中lower是Python字符串内置的通用方法,replace虽然是Pandas中的全局方法,但嵌套了一层str属性接口后即执行正则匹配的替换,这里即用到了正则表达式的匹配原则,即对a-z字母以外的其他字符替换为空字符...以上,举了几个简单的例子pandas中的字符串属性接口str进行了牛刀小试,其中包括python内置的字符串函数split、count、len等,也包括findallreplace中嵌套正则表达式等用法...基本都是Python中常用的字符串函数,调用时只需一个字符串列后调用str即可,方法简单,但效率却是异常明显的。

1.2K10

SQL、Pandas和Spark:常用数据查询操作对比

SQL查询的几个关键字,重点讲解Pandas和Spark中的实现。...02 Pandas和Spark实现SQL对应操作 以下按照SQL执行顺序讲解SQL各关键字Pandas和Spark中的实现,其中PandasPython中的数据分析工具包,而Spark作为集Java...数据过滤在所有数据处理流程中都是重要的一环,SQL中用关键字where实现,Pandas和Spark中也有相应的接口。 Pandas。...where关键字的,不过遗憾的是Pandas中的where和Numpy中的where一样,都是用于所有的所有元素执行相同的逻辑判断,可定制性较差。...而这在Pandas和Spark中并不存在这一区别,所以与where实现一致。 6)select。选择特定查询结果,详见Pandas vs Spark:获取指定的N种方式。 7)distinct。

2.4K20

Python数据分析笔记——Numpy、Pandas

Python数据分析——Numpy、Pandas库 总第48篇 ▼ 利用Python进行数据分析中有两个重要的库是Numpy和Pandas,本章将围绕这两个库进行展开介绍。...一维数组的索引 多维数组的索引 (2)切片索引 一维数组的切片索引(与Python列表的切片索引一样) 多维数组的切片索引 (3)花式索引 元素索引和切片索引都是仅局限于连续区域的值,而花式索引可以选取特定区域的值...(3)获取DataFrame的值(行或) 通过查找columns值获取对应的。(下面两种方法) 通过索引字段ix查找相应的行。 (4)进行赋值处理。 某一可以赋一个标量值也可以是一组值。...对于不存在的索引值带来的缺失值,也可以重新索引使用fill_value给缺失值填充指定值。...3、算数运算和数据对齐 (1)Series 与Series之间的运算 将不同索引的对象进行算数运算,将对象进行相加,如果存在,则结果的索引就是该索引的并集,而结果的对象为空。

6.4K80
领券