首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

pandas入门教程

这段输出说明如下: 输出的最后一行是Series数据的类型,这里的数据都是int64类型的。 数据第二输出,第一是数据的索引,pandas称之为Index。...我们可以分别打印出Series的数据和索引: ? 这两行代码输出如下: ? 如果不指定(像上面这样),索引是[1, N-1]的形式。不过我们也可以创建Series的时候指定索引。...请注意: DataFrame的不同可以是不同的数据类型 如果Series数组来创建DataFrame,每个Series将成为一行,而不是一 例如: ? df4的输出如下: ?...我们可以通过下面的形式DataFrame添加或者删除数据: ? 这段代码输出如下: ? Index对象与数据访问 pandas的Index对象包含了描述轴的元数据信息。...为了便于操作,填充之前,我们可以先通过rename方法修改行和的名称: ? 这段代码输出如下: ? 处理字符串 数据中常常牵涉到字符串的处理,接下来我们就看看pandas对于字符串操作。

2.2K20
您找到你想要的搜索结果了吗?
是的
没有找到

Pandas库常用方法、函数集合

Pandas是Python数据分析处理的核心第三方库,它使用二维数组形式,类似Excel表格,并封装了很多实用的函数方法,让你可以轻松地对数据集进行各种操作。...dataframe,类似sql的join concat:合并多个dataframe,类似sql的union pivot:按照指定的行列重塑表格 pivot_table:数据透视表,类似excel的透视表...:按照指定的或多个对数据进行分组 agg:对每个分组应用自定义的聚合函数 transform:对每个分组应用转换函数,返回与原始数据形状相同的结果 rank:计算元素每个分组的排名 filter...和 str.upper: 将字符串转换为小写或大写 str.replace: 替换字符串的特定字符 astype: 将一的数据类型转换为指定类型 sort_values: 对数据框按照指定进行排序...rename: 对或行进行重命名 drop: 删除指定的或行 数据可视化 pandas.DataFrame.plot.area:绘制堆积图 pandas.DataFrame.plot.bar:绘制柱状图

25110

数据导入与预处理-第4章-pandas数据获取

header:表示指定文件的哪一行数据作为DataFrame类对象的索引,默认为0,即第一行数据作为索引。...header:表示指定文件的哪一行数据作为DataFrame类对象的索引。 names:表示DataFrame类对象的索引列表。...HTML数据 从HTML表格获取数据 数据除了文件呈现,还可以在网页的HTML表格呈现,为此Pandas提供了用于从HTML网页表格读取数据的read_html()函数。... pandas 中支持直接从 sql 查询并读取。...index_col:表示将数据表标题作为DataFrame的行索引。。 coerce_float:表示是否将非字符串、非数字对象的值转换为浮点值(可能会导致精度损失),默认为True。

4K31

Pandas 25 式

目录 查看 pandas 及其支持项的版本 创建 DataFrame 重命名列 反转行序 反转列序 按数据类型选择字符串转换为数值 优化 DataFrame 大小 用多个文件建立 DataFrame...这样就可以生成 DataFrame 了,但如果要用非数字形式的列名,需要强制把字符串转换为列表, 再把这个列表传给 columns 参数。 ?...这里要注意的是,字符串里的字符数量必须与 DataFrame数一致。 3. 重命名列 ? 用点(.)选择 pandas 里的写起来比较容易,但列名里有空格,就没法这样操作了。...把字符串转换为数值 再创建一个新的 DataFrame 示例。 ? 这个 DataFrame 里的数字其实是以字符串形式保存的,因此,类型是 object。 ?...要把第二转为 DataFrame第二上使用 apply() 方法,并把结果传递给 Series 构建器。 ?

8.4K00

数据分析篇 | PyCon 大咖亲传 pandas 25 式,长文建议收藏

目录 查看 pandas 及其支持项的版本 创建 DataFrame 重命名列 反转行序 反转列序 按数据类型选择字符串转换为数值 优化 DataFrame 大小 用多个文件建立 DataFrame...这样就可以生成 DataFrame 了,但如果要用非数字形式的列名,需要强制把字符串转换为列表, 再把这个列表传给 columns 参数。 ?...这里要注意的是,字符串里的字符数量必须与 DataFrame数一致。 3. 重命名列 ? 用点(.)选择 pandas 里的写起来比较容易,但列名里有空格,就没法这样操作了。...把字符串转换为数值 再创建一个新的 DataFrame 示例。 ? 这个 DataFrame 里的数字其实是以字符串形式保存的,因此,类型是 object。 ?...要把第二转为 DataFrame第二上使用 apply() 方法,并把结果传递给 Series 构建器。 ?

7.1K20

数据处理利器pandas入门

想入门 Pandas,那么首先需要了解Pandas的数据结构。因为Pandas数据操作依赖于数据结构对象。Pandas中最常用的数据结构是 Series 和 DataFrame。...数据存储形式 数据存储逗号作为分隔符,列为: date, hour, type, 1001A, 1002A…,date和hour为时间信息,type为对应的要素,其余的均为站点名称。...读取数据 data = pd.read_csv('china_sites_20170101.csv', sep=',') 由于文件存储了多行多数据,因此,完全读取之后 data 为 DataFrame...Pandas主要有两种数据查询选择操作: 基于标签的查询 基于整数的位置索引查询 Pandas选择时,无需使用 date[:, columns] 的形式,先使用 : 选择所有行,再指定 columns...inplace选项直接针对原DataFrame操作 ⚠️ 'date' 和'hour'都是整数,需要将这两转换成字符串之后连接起来,连接的时候注意 date 形式是 '%Y%m%d',而 hour

3.6K30

一文介绍Pandas的9种数据访问方式

导读 Pandas之于日常数据分析工作的重要地位不言而喻,而灵活的数据访问则是其中的一个重要环节。本文旨在讲清Pandas的9种数据访问方式,包括范围读取和条件查询等。 ?...Pandas的核心数据结构是DataFrame,所以讲解数据访问前有必要充分认清和深刻理解DataFrame这种数据结构。...4. isin,条件范围查询,一般是对某一判断其取值是否某个可迭代的集合。即根据特定值是否存在于指定列表返回相应的结果。 5. where,妥妥的Pandas仿照SQL实现的算子命名。...Spark,filter是where的别名算子,即二者实现相同功能;但在pandasDataFrame却远非如此。...DataFrame,filter是用来读取特定的行或,并支持三种形式的筛选:固定列名(items)、正则表达式(regex)以及模糊查询(like),并通过axis参数来控制是行方向或方向的查询

3.7K30

干货:手把手教你用Python读写CSV、JSON、Excel及解析HTML

将数据存于pandas DataFrame对象意味着,数据的原始格式并不重要;一旦读入,它就能保存成pandas支持的任何格式。在前面这个例子,我们就将CSV文件读取的内容写入了TSV文件。...用索引可以很方便地辨认、校准、访问DataFrame的数据。索引可以是一连续的数字(就像Excel的行号)或日期;你还可以设定多索引。...文档位于: http://pandas.pydata.org/pandas-docs/stable/io.html#io-json-reader 03 用Python读写Excel文件 表格形式操作数据的文件格式...拿最新的XLSX格式来说,Excel可以单个工作表存储一百多万行及一万六千多。 1. 准备 要实践这个技法,你要先装好pandas模块。此外没有要求了。 2....可以列表的形式传入;我们的例子,就是['IATA', 'Airport_name']。

8.3K20

Pandas内存优化和数据加速读取

内存优化 一个现象是,使用pandas进行数据处理的时候,加载大的数据或占用很大的内存和时间,甚至有时候发现文件本地明明不大,但是用pandasDataFrame形式加载内存的时候会占用非常高的内存...对于object型,下图对比展示了数值型数据怎样Numpy数据类型存储,和字符串怎样Python内置类型进行存储的: ? 和数值类数据不同, object 类型的内存使用是可变的。...解决的办法是:pandas 0.15 版引入了 Categorials。category 类型底层使用了int值来表示一个的值,而不是使用原始值。...当我们将一转换成 category dtype 时,pandas 就使用最节省空间的 int 子类型来表示该的所有不同值。...Pandas的 HDFStore 类允许你将DataFrame存储HDF5文件,以便可以有效地访问它,同时仍保留类型和其他元数据。

2.6K20

数据分析利器--Pandas

(参考:Series与DataFrameDataFrame:一个Datarame表示一个表格,类似电子表格的数据结构,包含一个经过排序的列表集,它们每一个都可以有不同的类型值(数字,字符串,布尔等等...与其它你以前使用过的(如R 的 data.frame)类似Datarame的结构相比,DataFrame里的面向行和面向的操作大致是对称的。...(参考:Series与DataFrame) NaN/None: python原生的None和pandas, numpy的numpy.NaN尽管功能上都是用来标示空缺数据。...更详细的解释参考:Series与DataFrame 3.4 读取CSV文件 data = pd.read_csv("fileName.csv") read_csv()可以用的参数: 参数 说明 path...默认为False keep_date_col 如果将连接到解析日期,保留连接的。默认为False。 converters 的转换器 dayfirst 当解析可以造成歧义的日期时,以内部形式存储。

3.6K30

通宵翻译Pandas官方文档,写了这份Excel万字肝货操作!

Pandas ,您需要更多地考虑控制 DataFrame 的显示方式。 默认情况下,pandas 会截断大型 DataFrame 的输出显示第一行和最后一行。...pandas 可以创建 Excel 文件、CSV 或许多其他格式。 数据操作 1. 操作 电子表格,公式通常在单个单元格创建,然后拖入其他单元格计算其他的公式。... Pandas ,您可以直接对整列进行操作。 pandas 通过 DataFrame 中指定单个系列来提供矢量化操作。可以相同的方式分配新。... Pandas ,您需要在从 CSV 读取时或在 DataFrame 读取一次时,将纯文本显式转换为日期时间对象。 解析后,Excel电子表格默认格式显示日期,但格式可以更改。... Pandas ,这个操作一般是通过条件表达式一次对整个DataFrame 完成。

19.5K20

30 个小例子帮你快速掌握Pandas

读取数据集 本次演示使用Kaggle上提供的客户流失数据集[1]。 让我们从将csv文件读取pandas DataFrame开始。...inplace参数设置为True保存更改。我们删除了4,因此列数从14减少到10。 2.读取时选择特定的 我们只打算读取csv文件的某些读取时,列表将传递给usecols参数。...选择特定的 3.读取DataFrame的一部分行 read_csv函数允许按行读取DataFrame的一部分。有两种选择。第一个是读取前n行。...29.根据字符串过滤 我们可能需要根据文本数据(例如客户名称)过滤观察结果(行)。我已经将虚构名称添加到df_new DataFrame。 ? 让我们选择客户名称Mi开头的行。...endswith函数根据字符串末尾的字符进行相同的过滤。 Pandas可以对字符串进行很多操作。

10.6K10

20个经典函数细说Pandas的数据读取与存储

大家好,今天小编来为大家介绍几个Pandas读取数据以及保存数据的方法,毕竟我们很多时候需要读取各种形式的数据,以及将我们需要将所做的统计分析保存成特定的格式。...,因此可以read_sql()方法填入对应的sql语句然后来读取我们想要的数据, pd.read_sql(sql, con, index_col=None, coerce_float...con: 连接SQL数据库的Engine,一般用SQLAlchemy或者是PyMysql之类的模块来建立 index_col:选择某一作为Index coerce_float:将数字形式字符串直接...float型读入 parse_dates: 将某一日期型字符串传唤为datatime型数据,可以直接提供需要转换的列名默认的日期形式转换,或者也可以提供字典形式的列名和转换日期的格式, 我们用PyMysql..."\t",需要将sep参数也做相应的设定 pd.read_csv('data.csv', sep='\t') index_col: 我们在读取文件之后,可以指定某一作为DataFrame的索引 pd.read_csv

3K20

Python数据分析的数据导入和导出

这就需要将分析结果易于理解和使用的形式导出,供其他人使用。数据导出通常包括生成报告、制作图表、提供数据接口等方式,以便将分析结果直观地展示给决策者、业务人员或其他相关人员。...你可以查阅pandas官方文档了解更多详细信息。 ps:read_excel方法返回的结果是DataFrame, DataFrame的一对应着Excel的一。...read_html()函数是pandas的一个功能,它可以用于从HTML文件或URL读取表格数据并将其转换为DataFrame对象。...返回值: 如果HTML文件只有一个表格,则返回一个DataFrame对象。 如果HTML文件中有多个表格,则返回一个包含所有表格的列表,每个表格都以DataFrame对象的形式存储列表。...对象df保存为名为’data.xlsx'的Excel文件,Sheet1写入数据,不保存索引,保存列名,数据从第3行第2开始,合并单元格,使用utf-8编码,使用pandas的默认引擎。

13510

直观地解释和可视化每个复杂的DataFrame操作

操作数据帧可能很快会成为一项复杂的任务,因此Pandas的八种技术均提供了说明,可视化,代码和技巧来记住如何做。 ?...结果是ID的值(a,b,c)和值(B,C)及其对应值的每种组合,列表格式组织。 可以像在DataFrame df上一样执行Mels操作 : ?...诸如字符串或数字之类的非列表项不受影响,空列表是NaN值(您可以使用.dropna()清除它们 )。 ? DataFrame dfExplode“ A ” 非常简单: ?...合并不是pandas的功能,而是附加到DataFrame。始终假定合并所在的DataFrame是“左表”,函数作为参数调用的DataFrame是“右表”,并带有相应的键。...为了防止这种情况,请添加一个附加参数join ='inner',该参数 只会串联两个DataFrame共有的。 ? 切记:列表和字符串,可以串联其他项。

13.3K20

媲美Pandas?Python的Datatable包怎么用?

Frame 对象,datatable 的基本分析单位是 Frame,这与Pandas DataFrame 或 SQL table 的概念是相同的:即数据以行和的二维数组排列展示。...提供多线程文件读取功能,获得最大的速度。 在读取大文件时包含进度指示器。 可以读取 RFC4180 兼容和不兼容的文件。...() pandas_df = datatable_df.to_pandas() 下面,将 datatable 读取的数据帧转换为 Pandas dataframe 形式,并比较所需的时间,如下所示: %...,然后将其转换为 Pandas dataframe比直接读取 Pandas dataframe 的方式所花费的时间更少。...统计总结 Pandas ,总结并计算数据的统计信息是一个非常消耗内存的过程,但这个过程 datatable 包是很方便的。

7.2K10

媲美Pandas?Python的Datatable包怎么用?

对象,datatable 的基本分析单位是 Frame,这与Pandas DataFrame 或 SQL table 的概念是相同的:即数据以行和的二维数组排列展示。...提供多线程文件读取功能,获得最大的速度。 在读取大文件时包含进度指示器。 可以读取 RFC4180 兼容和不兼容的文件。...() pandas_df = datatable_df.to_pandas() 下面,将 datatable 读取的数据帧转换为 Pandas dataframe 形式,并比较所需的时间,如下所示: %...,然后将其转换为 Pandas dataframe比直接读取 Pandas dataframe 的方式所花费的时间更少。...统计总结 Pandas ,总结并计算数据的统计信息是一个非常消耗内存的过程,但这个过程 datatable 包是很方便的。

6.7K30
领券