首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Pandas 25 式

目录 查看 pandas 及其支持项版本 创建 DataFrame 重命名列 反转行序 反转列序 按数据类型选择字符串换为数值 优化 DataFrame 大小 用多个文件建立 DataFrame...这样就可以生成 DataFrame 了,但如果要用非数字形式列名,需要强制把字符串换为列表, 再把这个列表传给 columns 参数。 ?...rename()方法改列名是最灵活方式,它参数是字典字典 Key 是原列名,值是列名,还可以指定轴向(axis)。 ? 这种方式优点是可以重命名任意数量,一、多、所有都可以。...还可以使用 exclude 关键字排除指定数据类型。 ? 7. 把字符串换为数值 再创建一个 DataFrame 示例。 ?...这个 DataFrame数字其实是以字符串形式保存,因此,类型是 object。 ?

8.4K00

数据分析篇 | PyCon 大咖亲传 pandas 25 式,长文建议收藏

目录 查看 pandas 及其支持项版本 创建 DataFrame 重命名列 反转行序 反转列序 按数据类型选择字符串换为数值 优化 DataFrame 大小 用多个文件建立 DataFrame...这样就可以生成 DataFrame 了,但如果要用非数字形式列名,需要强制把字符串换为列表, 再把这个列表传给 columns 参数。 ?...rename()方法改列名是最灵活方式,它参数是字典字典 Key 是原列名,值是列名,还可以指定轴向(axis)。 ? 这种方式优点是可以重命名任意数量,一、多、所有都可以。...还可以使用 exclude 关键字排除指定数据类型。 ? 7. 把字符串换为数值 再创建一个 DataFrame 示例。 ?...这个 DataFrame数字其实是以字符串形式保存,因此,类型是 object。 ?

7.1K20
您找到你想要的搜索结果了吗?
是的
没有找到

python数据科学系列:pandas入门详细教程

考虑series和dataframe兼具numpy数组和字典特性,那么就不难理解二者以下属性: ndim/shape/dtypes/size/T,分别表示了数据维数、形状、数据类型和元素个数以及置结果...或字典(用于重命名行标签和标签) reindex,接收一个序列与已有标签匹配,当原标签不存在相应信息时,填充NAN或者可选填充值 set_index/reset_index,互为逆操作,...例如,当标签类型(可通过df.index.dtype查看)为时间类型时,若使用无法隐式转换为时间字符串作为索引切片,则引发报错 ? 切片形式返回行查询,且为范围查询 ?...需注意是,这里字符串接口与python普通字符串接口形式上很是相近,但二者是不一样。...时间类型向量化操作,如字符串一样,在pandas另一个得到"优待"数据类型是时间类型,正如字符串列可用str属性调用字符串接口一样,时间类型可用dt属性调用相应接口,这在处理时间类型时会十分有效。

13.8K20

【精心解读】用pandas处理大数据——节省90%内存消耗小贴士

Dataframe对象内部表示 在底层,pandas会按照数据类型将分组形成数据块(blocks)。...这对我们原始dataframe影响有限,这是由于它只包含很少整型。 同理,我们再对浮点型进行相应处理: 我们可以看到所有的浮点型都从float64换为float32,内存用量减少50%。...你可以看到这些字符串大小在pandasseries与在Python单独字符串是一样。...dtype参数接受一个以列名(string型)为键字典、以Numpy类型对象为值字典。 首先,我们将每一目标类型存储在以列名为键字典,开始前先删除日期,因为它需要分开单独处理。...总结 我们学习了pandas如何存储不同数据类型,并利用学到知识将我们pandas dataframe内存用量降低了近90%,仅仅只用了一点简单技巧: 将数值型降级到更高效类型 将字符串列转换为类别类型

8.6K50

猿创征文|数据导入与预处理-第3章-pandas基础

如下所示: "二维数组"Dataframe:是一个表格型数据结构,包含一组有序,其值类型可以是数值、字符串、布尔值等。...Dataframe数据以一个或多个二维块存放,不是列表、字典或一维数组结构。...pandas中使用reindex()方法实现重新索引功能,该方法会参照原有的Series类对象或DataFrame类对象索引设置数据:若该索引存在于对象,则其对应数据设为原数据,否则填充为缺失值...colums:表示索引。...figsize:表示图表尺寸大小,接收形式如(宽度,高度)元组。 title:表示图表标题。 xlabel:表示x轴标签。 ylabel:表示y轴标签。

13.9K20

数据处理利器pandas入门

想入门 Pandas,那么首先需要了解Pandas数据结构。因为Pandas数据操作依赖于数据结构对象。Pandas中最常用数据结构是 Series 和 DataFrame。...inplace选项直接针对原DataFrame操作 ⚠️ 'date' 和'hour'都是整数,需要将这两转换成字符串之后连接起来,连接时候注意 date 形式是 '%Y%m%d',而 hour...: .apply 上面在创建时间索引时便利用了.apply 方法,对date 和 hour分别进行了数据类型转换,然后将两个字符串进行了连接,转换为时间。...索引切片: 可以理解成 idx 将 MultiIndex 视为一个 DataFrame,然后将上层索引视为行,下层索引视为,以此来进行数据查询。...data 所有行,idx['1001A', ['AQI', 'PM10', 'PM2.5']] 表示 data 指定,如果将 idx 看作 DataFrame,那么'1001A'则是 idx

3.6K30

Python数据分析模块 | pandas做数据分析(二):常用预处理操作

在数据分析和机器学习一些任务里面,对于数据集某些或者行丢弃,以及数据集之间合并操作是非常常见. 1、合并操作 pandas.merge pandas.merge(left, right, how...prefix : 字符串,或者字符串列表,或者字符串字典.默认为None,这里应该传入一个字符串列表,且这个列表长度是和将要被get_dummis那些数量是相等.同样,prefix选项也可以是一个把列名映射到...#对于一个Series来说,行数保持不变,数变为不同类个数 #但是每一行还是以编码形式表示原来类别 #这个函数返回是一个DataFrame,其中列名为各种类别 s = pd.Series(list...#每一个特征(原始形式列名)下面有几种不同类别,就会生成几列(比如A下面只有a和b两种形式,就会生成A_a和A_b两) #原始为数字那些特征,保持不变 #prefix表示你对于新生成那些想要前缀...4、处理缺失值 pandas使用浮点数NaN(not a number)表示浮点和非浮点数组缺失数据.

1.7K60

Pandas全景透视:解锁数据科学黄金钥匙

DataFrame就是Series,Series可以转化为DataFrame,调用方法函数to_frame()即可 Series 是 pandas 一种数据结构,可以看作是带有标签一维数组。...了解完这些,接下来,让我们一起探索 Pandas 那些不可或缺常用函数,掌握数据分析关键技能。①.map() 函数用于根据传入字典或函数,对 Series 每个元素进行映射或转换。...具体来说,map()函数可以接受一个字典或一个函数作为参数,然后根据这个字典或函数对 Series 每个元素进行映射或转换,生成一个 Series,并返回该 Series。...定义了填充空值方法, pad / ffill表示用前面行/值,填充当前行/空值; backfill / bfill表示用后面行/值,填充当前行/空值。axis:轴。...0或’index’,表示按行删除;1或’columns’,表示删除。inplace:是否原地替换。布尔值,默认为False。如果为True,则在原DataFrame上进行操作,返回值为None。

8810

Python常用小技巧总结

others Python合并多个EXCEL工作表 pandasSeries和Dataframe数据类型互转 相同字段合并 Python小技巧 简单表达式 列表推导式 交换变量 检查对象使用内存情况...合并字典 字符串分割成列表 字符串列表创建字符串 Python查看图片 itertools模块combinations itertoolsreduce 字典.get()方法 解压zip压缩包到指定文件路径.../archive/数据汇总.csv",index=False) pandasSeries和Dataframe数据类型互转 pandasseries和dataframe数据类型互转 利用to_frame...()实现SeriesDataFrame 利用squeeze()实现单列数据DataFrameSeries s = pd.Series([1,2,3]) s 0 1 1 2 2 3...关系好定义为共同参演电影数量最多 1 .字典get方法 D.get(key[,default=None]) key – 字典要查找键。

9.4K20

没错,这篇文章教你妙用Pandas轻松处理大规模数据

相比较于 Numpy,Pandas 使用一个二维数据结构 DataFrame表示表格式数据, 可以存储混合数据结构,同时使用 NaN 来表示缺失数据,而不用像 Numpy 一样要手工处理缺失数据...在这篇文章,我们将介绍 Pandas 内存使用情况,以及如何通过为数据框(dataframe)(column)选择适当数据类型,将数据框内存占用量减少近 90%。...对象(object columns)主要用于存储字符串,包含混合数据类型。为了更好地了解怎样减少内存使用量,让我们看看 Pandas如何将数据存储在内存。...category 类型在底层使用整数类型来表示值,而不是原始值。Pandas 用一个单独字典来映射整数值和相应原始值之间关系。当某一包含数值集有限时,这种设计是很有用。...首先,我们将每最终类型、以及名字 keys 存在一个字典。因为日期需要单独对待,因此我们先要删除这一

3.6K40

Pandas更改数据类型【方法总结】

例如,上面的例子,如何将2和3为浮点数?有没有办法将数据转换为DataFrame格式时指定类型?或者是创建DataFrame,然后通过某种方法更改每类型?...默认情况下,它不能处理字母型字符串pandas’: >>> pd.to_numeric(s) # or pd.to_numeric(s, errors='raise') ValueError: Unable...在这种情况下,设置参数: df.apply(pd.to_numeric, errors='ignore') 然后该函数将被应用于整个DataFrame,可以转换为数字类型将被转换,而不能(例如,它们包含非数字字符串或日期...软转换——类型自动推断 版本0.21.0引入了infer_objects()方法,用于将具有对象数据类型DataFrame换为更具体类型。...例如,用两对象类型创建一个DataFrame,其中一个保存整数,另一个保存整数字符串: >>> df = pd.DataFrame({'a': [7, 1, 5], 'b': ['3','2','1

20.1K30

Python数据分析数据导入和导出

默认为0,表示不跳过末尾行。 na_values:指定要替换为NaN值。可以是标量、字符串、列表或字典。 parse_dates:指定是否解析日期。默认为False。...read_html()函数是pandas一个功能,它可以用于从HTML文件或URL读取表格数据并将其转换为DataFrame对象。...如果HTML文件中有多个表格,则返回一个包含所有表格列表,每个表格都以DataFrame对象形式存储在列表。...函数是pandas一个方法,用于将DataFrame对象保存为CSV文件。...:在数据中代表缺失值字符串,默认为空字符串 float_format:浮点数格式,指定数据浮点数输出格式,默认为None(即按照默认格式输出) columns:指定保存,默认为None,表示保存所有

13510

python数据分析——数据分类汇总与统计

例如, DataFrame可以在其行(axis=0)或(axis=1)上进行分组。然后,将一个函数应用(apply)到各个分组并产生一个值。...关键技术:对于由DataFrame产生GroupBy对象,如果用一个(单个字符串)或一组(字符串数组)列名对其进行索引,就能实现选取部分列进行聚合目的。...使用函数分组 比起使用字典或Series,使用Python函数是一种更原生方法定义分组映射。 【例6】以上一小节DataFrame为例,使用len函数计算一个字符串长度,并用其进行分组。...具体办法是向agg传入一个从列名映射到函数字典: 只有将多个函数应用到至少一时,DataFrame才会拥有层次化 2.3.返回不含行索引聚合数据 到目前为止,所有例聚合数据都有由唯一分组键组成索引...label:表示降采样时设置聚合值标签。 convention:重采样日期时,低频高频采用约定,可以取值为start或end,默认为start。

15010

Pandas

index 揉进去(字典key作为列名,作为字典value写作{index:value}形式 ) 访问 DataFrame 简介: 使用字典方式访问 DataFrame。...),除了指明axis对行或者标签名字进行调整以外,还可以写成类似于index=mapper形式,默认情况下,mapper匹配不到值不会报错 更改 DataFrame 数据 更改值 更改值可以借助访问...pd 一个重要方法是 reindex(),可以用来重新定义行/索引顺序以及内容(也可以用来增加index,该或者行值可以按照某种规则填充): import pandas as pd import...在多数情况下,对时间类型数据进行分析前提就是将原本为字符串时间转换为标准时间类型。pandas 继承了 NumPy 库和 datetime 库时间相关模块,提供了 6 种时间相关类。...接收函数、字符串字典,或函数与字符串列表。

9.1K30

Python数据分析-pandas库入门

代码示例: import pandas as pd obj = pd.Series([1,4,7,8,9]) obj Series 字符串表现形式为:索引在左边,值在右边。...数据结构 DataFrame 是一个表格型数据结构,它含有一组有序,每可以是不同值类型(数值、字符串、布尔值等)。...DataFrame 既有行索引也有索引,它可以被看做由 Series 组成字典(共用同一个索引)。DataFrame 数据是以一个或多个二维块存放(而不是列表、字典或别的一维数据结构)。...虽然 DataFrame 是以二维结构保存数据,但你仍然可以轻松地将其表示为更高维度数据(层次化索引表格型结构,这是 pandas许多高级数据处理功能关键要素 ) 创建 DataFrame 办法有很多...另一种常见数据形式是嵌套字典,如果嵌套字典传给 DataFramepandas 就会被解释为:外层字典键作为,内层键则作为行索引,代码示例: #DataFrame另一种常见数据形式是嵌套字典

3.7K20

Day4.利用Pandas做数据处理

在NumPy数据结构是围绕ndarray展开, 那么在Pandas核心数据结构是Series和 DataFrame,分别代表着一维序列和二维表结构。...对象 DataFrame(数据框)是一种二维数据结构,数据以表格形式存储,分成若干行和。...调用DataFrame()可以将多种格式数据转换为DataFrame对象,它三个参数data、index和columns分别为数据、行索引和索引。...获取数据类型 print(df.dtypes) # 获取数据维度 print(df.ndim) # values属性 不以行列形式,直接查看所有的值 会以二维ndarray形式返回DataFrame...删除 ''' drop(lables,axis,inplace) lables:要删除数据标签 axis:0表示删除行,1表示删除,默认0 inplace:是否在当前df执行此操作 ''' df3

6K10

Python之PandasSeries、DataFrame实践

1.2 Series字符串表现形式为:索引在左边,值在右边。...2. pandas数据结构DataFrame是一个表格型数据结构,它含有一组有序,每可以是不同值类型(数值、字符串、布尔值)。...dataframe数据是以一个或者多个二位块存放(而不是列表、字典或者别的一维数据结构)。 3.索引对象 pandas索引对象负责管理轴标签和其他元素(比如轴名称等)。...排序和排名 要对行或索引进行排序(按字典顺序),可使用sort_index方法,它将返回一个已排序对象;对于DataFrame,则可以根据任意一个轴上索引进行排序。 8....处理缺失数据(Missing data) 9.1 pandas使用浮点值NaN(Not a Number)表示浮点和非浮点数组缺失数据。

3.9K50
领券