首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Python常用小技巧总结

others Python合并多个EXCEL工作表 pandasSeries和Dataframe数据类型互转 相同字段合并 Python小技巧 简单表达式 列表推导式 交换变量 检查对象使用内存情况...DataFrame对象每⼀列唯⼀值和计数 df.isnull().any() # 查看是否有缺失值 df[df[column_name].duplicated()] # 查看column_name...df.iloc[0,:] # 返回第⼀⾏ df.iloc[0,0] # 返回第⼀列第⼀个元素 df.loc[0,:] # 返回第⼀⾏(索引为默认数字时,⽤法同df.iloc),但需要注意loc...sys.getsizeof() range()函数返回一个类,使用内存方面,range远比实际数字列表更加高效 import sys mylist = range(1,10000) print...,返回子序列按输入iterable顺序排序。

9.4K20

用过Excel,就会获取pandas数据框架值、行和列

Python,数据存储计算机内存(即,用户不能直接看到),幸运pandas库提供了获取值、行和列简单方法。 先准备一个数据框架,这样我们就有一些要处理东西了。...df.columns 提供列(标题)名称列表df.shape 显示数据框架维度,本例为4行5列。 图3 使用pandas获取列 有几种方法可以pandas获取列。...语法如下: df.loc[行,列] 其中,列可选,如果留空,我们可以得到整行。由于Python使用基于0索引,因此df.loc[0]返回数据框架第一行。...获取1行 图7 获取多行 我们必须使用索引/切片来获取多行。pandas,这类似于如何索引/切片Python列表。...这有时称为链式索引。记住这种表示法一个更简单方法df[列名]提供一列,然后添加另一个[行索引]将提供该列特定。 假设我们想获取第2行Mary Jane所在城市。

18.9K60
您找到你想要的搜索结果了吗?
是的
没有找到

pandas处理字符串方法汇总

Pandas字符串处理 字符串一种常见数据类型,我们遇到文本、json数据等都是属于字符串范畴。Python内置了很多处理字符串方法,这些方法为我们处理和清洗数据提供了很大便利。...# 5、字符串切割 y.split(" ") # 返回列表形式;里面就是切割后每个元素 ['hello', 'python!', 'hello', 'pandas!']...Pandas字符或者字符与其他类型(案例None)混合类型。...str.index:查找指定字符字符串第一次出现位置(索引号) str.rindex:查找指定字符字符串中最后一次出现位置(索引号) str.capitalize:将字符串单词第一个字母变成大写...检查字符串是否只由大写字母组成 str.istitle:检查所有单词首字母是否大写,其他字母是否小写组成 str.startswith:检查字符串是否以指定字符开始 str.endswith:检查字符串是否以指定字符结束

27820

资源 | 23种Pandas核心操作,你需要过一遍吗?

选自 Medium 作者:George Seif 机器之心编译 参与:思源 本文转自机器之心,转载需授权 Pandas 一个 Python 软件库,它提供了大量能使我们快速便捷地处理数据函数和方法...一般而言,Pandas 使 Python 成为强大而高效数据分析环境重要因素之一。...Pandas 基于 NumPy 构建库,在数据处理方面可以把它理解为 NumPy 加强版,同时 Pandas 也是一开源项目。...a table 将 DataFrame 输出到一张表: print(tabulate(print_table, headers=headers)) 当「print_table」一个列表其中列表元素还是新列表...(10)检查空值 NaN pd.isnull(object) 检查缺失值,即数值数组 NaN 和目标数组 None/NaN。

2.9K20

pandas连接函数concat()函数「建议收藏」

如果为True,请不要使用并置轴上索引值。结果轴将被标记为0,…,n-1。如果要连接其中并置轴没有有意义索引信息对象,这将非常有用。注意,其他轴上索引连接仍然受到尊重。...join_axes:Index对象列表。用于其他n-1轴特定索引,而不是执行内部/外部设置逻辑。 keys:序列,默认值无。使用传递键作为最外层构建层次索引。如果为索引,应该使用元组。...levels:序列列表,默认值无。用于构建MultiIndex特定级别(唯一值)。否则,它们将从键推断。 names:list,default无。结果层次索引级别的名称。...检查新连接是否包含重复。这相对于实际数据串联可能是非常昂贵。 copy:boolean,default True。如果为False,请勿不必要地复制数据。....index]) #设置索引df1索引 pandas文档:http://pandas.pydata.org/pandas-docs/stable/ 发布者:全栈程序员栈长,转载请注明出处:https

64010

pandas 入门 1 :数据集创建和绘制

除非另有指明,否则文件将保存在运行环境下相同位置。 df.to_csv? 我们将使用唯一参数索引和标头。将这些参数设置为False将阻止导出索引和标头名称。...pandas,这些dataframe索引一部分。您可以将索引视为sql表主键,但允许索引具有重复。...我们可以检查所有数据是否都是数据类型整数。将此列数据类型设置为float没有意义。在此分析,我不担心任何可能异常值。...要意识到除了我们“名称”列中所做检查之外,简要地查看数据框内数据应该是我们游戏这个阶段所需要。随着我们在数据分析生命周期中继续,我们将有很多机会找到数据集任何问题。...与该表一起,最终用户清楚地了解Mel数据集中最受欢迎婴儿名称。plot()一个方便属性,pandas可以让您轻松地在数据框绘制数据。我们学习了如何在上一节中找到Births列最大值。

6.1K10

14个pandas神操作,手把手教你写代码

Python语言应用生态,数据科学领域近年来十分热门。作为数据科学中一个非常基础库,Pandas受到了广泛关注。Pandas可以将现实来源多样数据进行灵活处理和分析。...关于为何有Python这个项目,吉·范罗苏姆1996年曾写道:6年前,也就是1989年12月,我寻找一门“课余”编程项目来打发圣诞节前后时间。...图2 读取数据执行效果 其中: 自动增加了第一列,Pandas为数据增加索引,从0开始,程序不知道我们真正业务索引,往往需要后面重新指定,使它有一定业务意义; 由于数据量大,自动隐藏了中间部分...以上数据真正业务意义上索引name列,所以我们需要使它成为索引df.set_index('name', inplace=True) # 建立索引并生效 其中可选参数inplace=True会将指定好索引数据再赋值给..., y]一个非常强大数据选择函数,其中x代表行,y代表列,行和列都支持条件表达式,也支持类似列表那样切片(如果要用自然索引,需要用df.iloc[])。

3.3K20

开启机器学习第一课:用Pandas进行数据分析

Pandas一个Python库,提供了丰富数据分析方法。数据科学家经常使用Pandas来分析处理.csv,.tsv或.xlsx等表格数据。...Pandas主要数据结构包括Series和DataFrame类。前者针对一些特定数据类型一种一维索引数组格式。...用Bool值对列数据进行索引也是非常简便,具体实现为df [P(df ['Name'])],其中P表示对Name这个列每个元素进行检查所需某个逻辑条件。...其中,loc()方法用于按名称进行索引,我们假定“索引从0到5(包含索引值)行以及从State到Area code标记(包含索引值)值”,代码如下: df.loc[0:5, 'State':'...我们会假定“索引得到前三列前五行值,这种索引方式和Python切片方式一样,不会包含索引最大值对应,代码如下: df.iloc[0:5, 0:3] 如果想索引DataFrame数据第一行和最后一行

1.5K50

Pandas速查卡-Python数据科学

Josh Devlin 2017年2月21日 Pandas可以说是数据科学最重要Python包。...刚开始学习pandas时要记住所有常用函数和方法显然有困难,所以Dataquest(https://www.dataquest.io/)我们主张查找pandas参考资料(http://pandas.pydata.org...('1900/1/30', periods=df.shape[0]) 添加日期索引 查看/检查数据 df.head(n) 数据框前n行 df.tail(n) 数据框后n行 df.shape() 行数和列数...df.groupby(col) 从一列返回一组对象df.groupby([col1,col2]) 从列返回一组对象df.groupby(col1)[col2] 返回col2平均值...df2],axis=1) 将df1列添加到df2末尾(行数应该相同) df1.join(df2,on=col1,how='inner') SQL类型df1列与df2上列连接,其中col

9.2K80

Python连接大法|“合体”

01 主办方 本次活动主办方PythonPandas 02 小梦merge 小超呀,你认识sqljoin兄么,我们可是好兄弟(用法非常类似) 03 小超concat 哼,我和数据库UNION...对象,如果位指定,则以left和right列名交集作为连接键 left_on 以左侧DataFrame作为连接键 right_on 以右侧DataFrame作为连接键 left_index 以左侧索引作为连接键...indicator bool或str,默认为False validate str,可选,如果指定,则检查合并是否为指定类型。 ? ? 小梦merge 怎么样小超,我功能强大不?...levels 序列列表,默认无,用于构造多重索引 names 创建分层级别的名称 verify_integrity bool,默认为False,检查连接轴是否包含重复 一向公正pandas社长同样也为小超建造了一个场景...两人你来我往了不知多久,主办方都鼾声四起了 pandas伸个懒腰,小结一下吧: 1.merge默认内连接,concat默认外连接 2.concat准确来说是拼接,axis参数决定横纵向拼接,axis

75610

数据导入与预处理-课程总结-04~06章

可以选择C或者python。C引擎快但是Python引擎功能更加完备。...header:表示指定文件哪一行数据作为DataFrame类对象索引。 names:表示DataFrame类对象索引列表。...该参数可以取值为’first’(默认值)、 'last ‘和’False’,其中’first’代表删除重复,仅保留第一次出现数据;'last '代表删除重复,仅保留最后一次出现数据;'False...正态分布也称高斯分布,统计学十分重要概率分布,它有两个比较重要参数:μ和σ,其中μ遵从正态分布随机变量(值无法预先确定仅以一定概率取值变量)均值,σ此随机变量标准差。...as_index:表示聚合后新数据索引是否为分组标签索引,默认为True。 sort:表示是否对分组索引进行排序,默认为True。

13K10

盘一盘 Python 系列 4 - Pandas (上)

) 字典 (dict) 回顾Python 入门篇 (下)〗讲函数里可以设定不同参数,那么 x 位置参数 index 默认参数,默认值为 idx = range(0, len(x)) 用列表 s...,每个浮点数前面还有一个索引本例 0, 1, 2, 3。...因此创建 Series 时,如果不显性设定 index,那么 Python 给定一个默认从 0 到 N-1 值,其中 N x 长度。...Series s 也是一个对象,用 dir(s) 可看出关于 Series 所有的属性和内置函数,其中最重要 用 s.values 打印 s 元素 用 s.index 打印 s 元素对应索引...x 可以是 二维列表 (list) 二维 numpy 数组 (ndarray) 字典 (dict),其值一维列表、numpy 数组或 Series 另外一个 DataFrame 回顾Python

6.1K52

python数据分析万字干货!一个数据集全方位解读pandas

jupyter notebook可以看到,一共有23列变量,其中因为列数太多被隐藏了一部分,那么怎样可以看到这些变量呢 >>> pd.set_option("display.max.columns"...Series对象 Python最基本数据结构list,这也是了解pandas.Series对象一个很好起点。...我们知道Series对象几种方面与列表和字典相似之处。也就意味着我们可以使用索引运算符。现在我们来说明如何使用两种特定于pandas访问方法:.loc和.iloc。...使用.loc和.iloc会发现这些数据访问方法比索引运算符更具可读性。因为之前文章已经详细介绍了这两种方法,因此我们将简单介绍。更详细可以查看【公众号:早起python】之前文章。...结束语 走到这里,有关pandas最常用知识点就已经全部介绍完毕,当然其中有很多部分都值得我们再进一步细讲,比如iloc与loc使用、matplotlib各种操作,或者在数据清洗各种问题。

7.4K20

Polars:一个正在崛起新数据框架

它们收集和清理来自限定文本文件、电子表格和数据库查询数据方面提供了灵活性。最常用数据框架Pandas,这是一个python包,对于有限数据来说,它表现足够好。...为了检查数据是否被加载,你可以像Pandas一样使用head。 df.head() 同样,最后10个条目,数据框架形状和类型可以用以下代码检查。...df[:10] #访问前十行。 列可以通过名称直接引用。 df['name'] #找到'name'列 可以通过向数据框架传递索引列表来选择指数。...['name'].unique() #返回列唯一值列表 df.dtypes() #返回数据类型 Polars也支持Groupby和排序。...总的来说,Polars可以为数据科学家和爱好者提供更好工具,将数据导入到数据框架。有很多Pandas可以做功能目前Polars上不存在。在这种情况下,强烈建议将数据框架投向Pandas

4.6K30

从小白到大师,这里有一份Pandas入门指南

这个数任意,但是因为数据框类型转换意味着 numpy 数组间移动数据,因此我们得到必须比失去。 接下来看看数据中会发生什么。...索引 Pandas 强大,但也需要付出一些代价。当你加载 DataFrame 时,它会创建索引并将数据存储 numpy 数组。这是什么意思?...一旦加载了数据框,只要正确管理索引,就可以快速地访问数据。 访问数据方法主要有两种,分别是通过索引和查询访问。根据具体情况,你只能选择其中一种。但在大多数情况索引(和索引)都是最好选择。...为了检查索引是否已经排序并对它排序,主要有两种方法: %%time >>> mi_df.sort_index() CPU times: user 34.8 ms, sys: 1.63 ms, total...得到数据框,「年龄」列索引。 除了了解到「X 代」覆盖了三个年龄组外,分解这条链。第一步对年龄组分组。

1.8K11

从小白到大师,这里有一份Pandas入门指南

这个数任意,但是因为数据框类型转换意味着 numpy 数组间移动数据,因此我们得到必须比失去。 接下来看看数据中会发生什么。...索引 Pandas 强大,但也需要付出一些代价。当你加载 DataFrame 时,它会创建索引并将数据存储 numpy 数组。这是什么意思?...一旦加载了数据框,只要正确管理索引,就可以快速地访问数据。 访问数据方法主要有两种,分别是通过索引和查询访问。根据具体情况,你只能选择其中一种。但在大多数情况索引(和索引)都是最好选择。...为了检查索引是否已经排序并对它排序,主要有两种方法: %%time >>> mi_df.sort_index() CPU times: user 34.8 ms, sys: 1.63 ms, total...得到数据框,「年龄」列索引。 除了了解到「X 代」覆盖了三个年龄组外,分解这条链。第一步对年龄组分组。

1.7K30

从小白到大师,这里有一份Pandas入门指南

这个数任意,但是因为数据框类型转换意味着 numpy 数组间移动数据,因此我们得到必须比失去。 接下来看看数据中会发生什么。...索引 Pandas 强大,但也需要付出一些代价。当你加载 DataFrame 时,它会创建索引并将数据存储 numpy 数组。这是什么意思?...一旦加载了数据框,只要正确管理索引,就可以快速地访问数据。 访问数据方法主要有两种,分别是通过索引和查询访问。根据具体情况,你只能选择其中一种。但在大多数情况索引(和索引)都是最好选择。...为了检查索引是否已经排序并对它排序,主要有两种方法: %%time >>> mi_df.sort_index() CPU times: user 34.8 ms, sys: 1.63 ms, total...得到数据框,「年龄」列索引。 除了了解到「X 代」覆盖了三个年龄组外,分解这条链。第一步对年龄组分组。

1.7K30

Pandas 2.2 中文官方教程和指南(十一·二)

使用标签 'a':'f' 切片对象(请注意,与通常 Python 切片相反,索引同时包括起始和停止点!请参阅 使用标签进行切片 和 端点包含。)...](即__getitem__,对于熟悉 Python 实现类行为的人)进行索引主要功能选择较低维度切片。...pandas 提供了一套方法,以便获得纯整数索引。语义紧随 Python 和 NumPy 切片。这些基于 0 索引切片时,起始边界包含,而上限不包含。...int64 使用 isin 进行索引 考虑 Series isin() 方法,它返回一个布尔向量,其中 Series 元素存在于传递列表位置为真。...只需将值作为 dict,其中列,值您要检查项目列表

12210
领券