首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

手把手教你做一个“渣”数据师,用Python代替老情人Excel

三、分割:即Excel过滤器 描述性报告是关于数据子集和聚合的,当需要初步了解数据时,通常使用过滤器来查看较小的数据集或特定的,以便更好的理解数据。...2、查看 ? 3、查看特定行 这里使用的方法是loc函数,其中我们可以指定以冒号分隔的起始行和结束行。注意,索引从0开始而不是1。 ? 4、同时分割行和 ? 5、在某一中筛选 ?...9、用多个条件筛选数据 输入应为一个表,此方法相当于excel中的高级过滤器功能: ? 10、根据数字条件过滤 ? 11、在Excel中复制自定义的筛选器 ?...12、合并两个过滤器的计算结果 ? 13、包含Excel中的功能 ? 14、从DataFrame获取特定的值 ?...有四种合并选项: left——使用左侧DataFrame中的共享并匹配右侧DataFrame,N/A为NaN; right——使用右侧DataFrame中的共享并匹配左侧DataFrame,N/A为

8.3K30

一文介绍Pandas中的9种数据访问方式

通常情况下,[]常用于在DataFrame获取单列、或多行信息。具体而言: 当在[]中提供单值或多值(多个列名组成的列表)访问时进行查询,单值访问不存在列名歧义时还可直接用属性符号" ....例如,当标签类型(可通过df.index.dtype查看)为时间类型时,若使用无法隐式转换为时间的字符串作为索引切片,则引发报错 ? 切片形式返回行查询,且为范围查询 ?...切片类型与索引类型不一致时,引发报错 2. loc/iloc,可能是除[]之外最为常用的两种数据访问方法,其中loc标签值(列名和行索引取值)访问、iloc数字索引访问,均支持单值访问或切片查询...语法执行数据访问的方式,这对熟悉SQL的使用者来说非常有帮助!...在DataFrame中,filter是用来读取特定的行或,并支持三种形式的筛选:固定列名(items)、正则表达式(regex)以及模糊查询(like),并通过axis参数来控制是行方向或方向的查询

3.8K30
您找到你想要的搜索结果了吗?
是的
没有找到

Pandas知识点-合并操作merge

如果两个DataFrame的列名完全相同,使用outer合并方式,效果是将两个DataFrame行合并到一起。...on参数指定的必须在两个被合并DataFrame中都有,否则会报错。 on参数也可以指定,合并时多个进行连接。 ? 在合并时,只有多个的值同时相等,两个DataFrame才会匹配上。...validate: 用于指定两个DataFrame连接的对应关系,有one_to_one(一对一),one_to_many(一对),many_to_one(对一),many_to_many(...many_to_many: 两个DataFrame连接中的值都可以不唯一。 ? 使用的对应方式,任何情况都满足,合并不会报错。...如果需要本文代码,可以点击关注公众号“Python碎片”,然后在后台回复“pandas13”关键字获取完整代码。

3.1K30

python数据科学系列:pandas入门详细教程

与此同时,series因为只有一,所以数据类型自然也就只有一种,pandas为了兼容二者,series的数据类型属性既可以用dtype也可以用dtypes获取;而dataframe则只能用dtypes...自然毫无悬念 dataframe:无法访问单个元素,只能返回一或多行:单值或多值(多个列名组成的列表)访问时进行查询,单值访问不存在列名歧义时还可直接用属性符号" ....例如,当标签类型(可通过df.index.dtype查看)为时间类型时,若使用无法隐式转换为时间的字符串作为索引切片,则引发报错 ? 切片形式返回行查询,且为范围查询 ?...;sort_values是值排序,如果是dataframe对象,也可通过axis参数设置排序方向是行还是,同时根据by参数传入指定的行或者,可传入多行或并分别设置升序降序参数,非常灵活。...groupby,类比SQL中的group by功能,即按某一执行分组。

13.8K20

Pandas速查手册中文版

pandas-cheat-sheet.pdf 关键缩写和包导入 在这个速查手册中,我们使用如下缩写: df:任意的Pandas DataFrame对象 同时我们需要做如下的引入: import pandas...pd.read_html(url):解析URL、字符串或者HTML文件,抽取其中的tables表格 pd.read_clipboard():从你的粘贴板获取内容,并传给read_table() pd.DataFrame...数据选取 df[col]:根据列名,并以Series的形式返回 df[[col1, col2]]:以DataFrame形式返回 s.iloc[0]:位置选取数据 s.loc['index_one...([col1,col2]):返回一个进行分组的Groupby对象 df.groupby(col1)[col2]:返回col1进行分组后,col2的均值 df.pivot_table(index...):返回col1分组的所有的均值 data.apply(np.mean):对DataFrame中的每一应用函数np.mean data.apply(np.max,axis=1):对DataFrame

12.1K92

Flask数据库过滤器与查询集

,下面列出了一些常见的类型以及在模型中使用的Python类型。...Integer:普通整数,一般是32bit String:变长字符串 Text:变长字符串,对较长或不限长度的字符做了优化 Boolean:布尔值 Date:日期 DateTime:日期和时间...例如如果address模型中有两个或以上的定义为person模型的外键,SQLAlchemy就不知道该使用。...这种用户之间关注的关系,我们依然可以使用上面的方法来实现。 高级对多关系 自引用对多关系可在数据库中表示用户之间的关注,但却有个限制。使用对多关系时,往往需要存储所联两个实体之间的额外信息。...lazy参数都在“一”这一侧设定,返回的结果是“”这一侧中的记录。上述代码使用的是dynamic,因此关系属性不会直接返回记录,而是返回查询对象,所以在执行查询之前还可以添加额外的过滤器

6.8K10

妈妈再也不用担心我忘记pandas操作了

pd.read_html(url) # 解析URL、字符串或者HTML文件,抽取其中的tables表格 pd.read_clipboard() # 从你的粘贴板获取内容,并传给read_table()...数据选取: df[col] # 根据列名,并以Series的形式返回 df[[col1, col2]] # 以DataFrame形式返回 df.iloc[0] # 位置选取数据 df.loc[...升序排列,后col2降序排列数据 df.groupby(col) # 返回一个col进行分组的Groupby对象 df.groupby([col1,col2]) # 返回一个进行分组的Groupby...=max) # 创建一个col1进行分组,并计算col2和col3的最大值的数据透视表 df.groupby(col1).agg(np.mean) # 返回col1分组的所有的均值 data.apply...(np.mean) # 对DataFrame中的每一应用函数np.mean data.apply(np.max,axis=1) # 对DataFrame中的每一行应用函数np.max 其它操作: 改列名

2.2K31

数据分析从零开始实战 | 基础篇(四)

本系列学习笔记参考书籍:《数据分析实战》托马兹·卓巴斯 一 基本知识概要 1.利用Pandas检索HTML页面(read_html函数) 2.实战训练使用read_html函数直接获取页面数据 3....(1)io(最关键参数) 源码注释 A URL, a file-like object, or a raw string containing HTML....;str2表示分隔字符串 str3.join(list1) str2 表示什么字符串进行连接;list1表示待连接的列表 list2.append(str4...pad / ffill:检索,将最后一次不为空的值赋给下一个空值。 backfill / bfill:检索,将下一个不为空的值赋给该空值。...我的理解 其实很简单,就是搜索空值,然后limit的值表示最大的连续填充空值个数。 比如:limit=2,表示一中从上到下搜索,只替换前两个空值,后面都不替换。

1.3K20
领券