首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

python数据科学系列:pandas入门详细教程

为了沿袭字典访问习惯,还可以keys()访问标签信息,在series返回index标签,在dataframe中则返回columns列名;可以items()访问键值对,但一般用处不大。...这里提到了index和columns分别代表行标签和标签,就不得不提到pandas中另一个数据结构:Index,例如series中标签dataframe中行标签和标签均属于这种数据结构。...时间类型向量化操作,如字符串一样,在pandas中另一个得到"优待"数据类型是时间类型,正如字符串列可用str属性调用字符串接口一样,时间类型可用dt属性调用相应接口,这在处理时间类型时会十分有效。...对象,功能与python中普通map函数类似,即对给定序列中每个值执行相同映射操作,不同是series中map接口映射方式既可以是一个函数,也可以是一个字典 ?...例如,以某取值为重整后行标签,以另一取值作为重整后标签,以其他取值作为填充value,即实现了数据表行列重整。

13.8K20
您找到你想要的搜索结果了吗?
是的
没有找到

Python之数据规整化:清理、转换、合并、重塑

实例方法combine_first可以将重复数据编接在一起,一个对象中值填充另一个对象中缺失值。 2....数据风格DataFrame合并操作 2.1 数据集合并(merge)或连接(jion)运算时通过一个或多个键将行链接起来。如果没有指定,merge就会将重叠列名当做键,最好显示指定一下。...外连接求取是键并集,组合了左连接和右连接。 2.3 都对连接是行笛卡尔积。 2.4 mergesuffixes选项,用于指定附加到左右两个DataFrame对象重叠列名上字符串。...4.1 重塑层次化索引 层次化索引为DataFrame数据重排任务提供了良好一致性方式。主要两种功能: stack:将数据“旋转”为行。...unstack:将数据行“旋转”为。 5. 数据转换 5.1 利用函数或映射进行数据转换 Seriesmap方法可以接受一个函数或含有映射关系字典型对象。

3K60

Python进阶之Pandas入门(一) 介绍和核心

2 pandas和其它工具包关系 pandas不仅是数据科学工具箱中心组件,而且与该集合中其他工具包一起使用: pandas构建在NumPy包顶部,这意味着在pandas中使用或复制了许多NumPy...Series本质上是一个, 而DataFrame是一个由Series集合组成多维表: ?...DataFrame和Series在许多操作上非常相似,一个操作可以执行另一个操作,比如填充空值和计算平均值。...从头创建DataFrame有许多方法,但是一个很好选择是使用简单dict字典 假设我们有一个卖苹果和橘子水果摊。我们希望每个水果都有一,每个客户购买都有一行。...数据中每个(键、值)项对应于结果DataFrame一个。这个DataFrame索引在创建时被指定为数字0-3,但是我们也可以在初始化DataFrame时创建自己索引。

2.7K20

Pandas全景透视:解锁数据科学黄金钥匙

DataFrame就是Series,Series可以转化为DataFrame,调用方法函数to_frame()即可 Series 是 pandas 中一种数据结构,可以看作是带有标签一维数组。...底层使用C语言:Pandas许多内部操作都是Cython或C语言编写,Cython是一种Python超集,它允许将Python代码转换为C语言代码,从而提高执行效率。...了解完这些,接下来,让我们一起探索 Pandas 中那些不可或缺常用函数,掌握数据分析关键技能。①.map() 函数用于根据传入字典或函数,对 Series 中每个元素进行映射或转换。...具体来说,map()函数可以接受一个字典或一个函数作为参数,然后根据这个字典或函数对 Series 中每个元素进行映射或转换,生成一个新 Series,并返回该 Series。...定义了填充空值方法, pad / ffill表示前面行/值,填充当前行/空值; backfill / bfill表示用后面行/值,填充当前行/空值。axis:轴。

8910

如何在 Pandas DataFrame中重命名列?

DataFrame上最常见操作之一是重命名(rename)列名称。 分析人员重命名列名称动机之一是确保这些列名称是有效Python属性名称。...这意味着列名称不能以数字开头,而是带下画线小写字母数字。好列名称还应该是描述性,言简意赅,并且不应与现有的DataFrame或Series属性冲突。 本文中,我们将重命名列名称。...movies = pd.read_csv("data/movie.csv") 2)DataFrame重命名方法接收将旧值映射到新值字典。 可以为这些创建一个字典,如下所示。...movies.rename(columns=col_map).head() 原理 DataFrame.rename方法允许重命名列标签。可以通过给属性赋值来重命名列。...还可以使用.rename方法重命名索引,如果字符串值,则更有意义。 因此,我们可以将索引设置为movie_title(电影片名),然后将这些值映射为新值。

5.5K20

Python 数据处理:Pandas库使用

DataFrame是一个表格型数据结构,它含有一组有序,每可以是不同值类型(数值、字符串、布尔值等)。...另一种常见数据形式是嵌套字典,如果嵌套字典传给DataFrame, Pandas 就会被解释为:外层字典键作为,内层键则作为行索引: import pandas as pd pop1 = {'...字典键或Series索引并集将会成为DataFrame标 由列表或元组组成列表 类似于“二维ndarray" 另一DataFrameDataFrame索引将会被沿用,除非显式指定了其他索引...它们可以让你类似 NumPy 标记,使用轴标签(loc)或整数索引(iloc),从DataFrame选择行和子集。...Python 属性,我们还可以更简洁语法选择: print(returns.MSFT.corr(returns.IBM)) 另一方面,DataFramecorr和cov方法将以DataFrame

22.7K10

Python数据分析-pandas库入门

pandas使用最多数据结构对象是 DataFrame,它是一个面向(column-oriented)二维表结构,另一个是 Series,一个一维标签化数组对象。...看成是一个定长有序字典,因为它是索引值到数据值一个映射。...数据结构 DataFrame 是一个表格型数据结构,它含有一组有序,每可以是不同值类型(数值、字符串、布尔值等)。...DataFrame 既有行索引也有索引,它可以被看做由 Series 组成字典(共用同一个索引)。DataFrame数据是以一个或多个二维块存放(而不是列表、字典或别的一维数据结构)。...另一种常见数据形式是嵌套字典,如果嵌套字典传给 DataFrame,pandas 就会被解释为:外层字典键作为,内层键则作为行索引,代码示例: #DataFrame另一种常见数据形式是嵌套字典

3.7K20

征文|数据导入与预处理-第3章-pandas基础

(dict本身不存在顺序),其索引原理与字典相似(一个key,一个index) Seriesname属性 # Series 名称属性:name s1 = pd.Series(np.random.randn...如下所示: "二维数组"Dataframe:是一个表格型数据结构,包含一组有序,其值类型可以是数值、字符串、布尔值等。...print(df1) # 由字典组成字典创建Dataframe,columns为字典key,index为子字典key df2 = pd.DataFrame(data, columns = ['Jack...输出为: 1.4.3 Dataframe:索引 Dataframe既有行索引也有索引,可以被看做由Series组成字典(共用一个索引) 选择 / 选择行 / 切片 / 布尔判断 选择行与...除了可以添加索引外,也可以替换已经存在索引。比如您也可以把 Series 或者一个 DataFrme 设置成另一DataFrame 索引。

13.9K20

Python之Pandas中Series、DataFrame实践

1.2 Series字符串表现形式为:索引在左边,值在右边。...2. pandas数据结构DataFrame是一个表格型数据结构,它含有一组有序,每可以是不同值类型(数值、字符串、布尔值)。...dataframe数据是以一个或者多个二位块存放(而不是列表、字典或者别的一维数据结构)。 3.索引对象 pandas索引对象负责管理轴标签和其他元素(比如轴名称等)。...函数应用和映射 NumPyufuncs(元素级数组方法)也可用操作pandas对象 DataFrame中将函数应用到由各或各行所行成一维数组上可用apply方法。 7....排序和排名 要对行或索引进行排序(按字典顺序),可使用sort_index方法,它将返回一个已排序新对象;对于DataFrame,则可以根据任意一个轴上索引进行排序。 8.

3.9K50

pandas transform 数据转换 4 个常用技巧!

转换数值 pd.transform(func, axis=0) 以上就是transform转换数值基本用法,参数含义如下: func是指定用于处理数据函数,它可以是普通函数、字符串函数名称、函数列表或轴标签映射函数字典..._10) 或者,也可以lambda函数简洁实现,效果是一样。...字符串函数 也可以传递任何有效pandas内置字符串函数,例如sqrt: df.transform('sqrt') 3. 函数列表 func还可以是一个函数列表。...轴标签映射函数字典 如果我们只想将指定函数作用于某一,该如何操作? func还可以是轴标签映射指定函数字典。...一个例子说明: df = pd.DataFrame({ 'restaurant_id': [101,102,103,104,105,106,107], 'address': ['A','B',

25920

【精心解读】pandas处理大数据——节省90%内存消耗小贴士

有个BlockManager类 会用于保持行列索引与真实数据块映射关系。他扮演一个API,提供对底层数据访问。...每种数据类型在pandas.core.internals模块中都有一个特定类。pandas使用ObjectBlock类来表示包含字符串数据块,FloatBlock类来表示包含浮点型数据块。...category类型在底层使用整型数值来表示该值,而不是原值。Pandas一个字典来构建这些整型数据到原数据映射关系。当一只包含有限种值时,这种设计是很不错。...dtype参数接受一个以列名(string型)为键字典、以Numpy类型对象为值字典。 首先,我们将每一目标类型存储在以列名为键字典中,开始前先删除日期,因为它需要分开单独处理。...总结 我们学习了pandas如何存储不同数据类型,并利用学到知识将我们pandas dataframe内存用量降低了近90%,仅仅只用了一点简单技巧: 将数值型降级到更高效类型 将字符串列转换为类别类型

8.6K50

(数据科学学习手札69)详解pandas中map、apply、applymap、groupby、agg

genderF、M转换为女性、男性,可以有以下几种实现方式: ● 字典映射   这里我们编写F、M与女性、男性之间一一映射字典,再利用map()方法来得到映射: #定义F->女性,M->男性映射字典...● 多数据   apply()最特别的地方在于其可以同时处理多数据,譬如这里我们编写一个使用到多数据函数用于拼成对于每一行描述性的话,并在apply()lambda函数传递多个值进编写好函数中...2.3  applymap()   applymap()是与map()方法相对应专属于DataFrame对象方法,类似map()方法传入函数、字典等,传入对应输出结果,不同是applymap()...当变量为1个时传入名称字符串即可,当为多个时传入这些变量名称列表,DataFrame对象通过groupby()之后返回一个生成器,需要将其列表化才能得到需要分组后子集,如下面的示例: #按照年份和性别对婴儿姓名数据进行分组...、最大值、最小值操作,下面几个简单例子演示其具体使用方式:  ● 聚合Series   在对Series进行聚合时,因为只有1,所以可以不使用字典形式传递参数,直接传入函数名列表即可: #求count

5K60

Python数据分析实战之技巧总结

Q2:注意保证字段唯一性,如何处理 #以名称作为筛选字段时,可能出现重复情况,实际中尽量以字段id唯一码与名称建立映射键值对,作图时候尤其注意,避免不必要错误,可以做以下处理: 1、处理数据以id...为字段,最后统计建立key-value映射 X.index = X.index.map(_dict) X1=X1.rename(columns=_dict) 2、加上区分字段 p1=list(X1...keys()用来获取字典所有键 #values()用来获取字典内所有值 #items()用来得到一组组键值对 # df1.append(df2) # 往末尾添加dataframe # pd.concat...#pandas库中使用.where()函数 # df5_13=df5.where((df5.月份=="1月")&(df5.动力用电>5)).dropna(axis=0) # 或pandas库中query...方法一:使用一个名为np.select()函数,给它提供两个参数:一个条件,另一个对应等级列表。

2.4K10

《利用Python进行数据分析·第2版》第7章 数据清洗和准备7.1 处理缺失数据7.2 数据转换7.3 字符串操作7.4 总结

fillna函数参数 7.2 数据转换 本章到目前为止介绍都是数据重排。另一类重要操作则是过滤、清理以及其他转换工作。 移除重复数据 DataFrame中出现重复行有多种原因。...对于许多数据集,你可能希望根据数组、Series或DataFrame值来实现转换工作。...'corned beef': 'cow', 'honey ham': 'pig', 'nova lox': 'salmon' } Seriesmap方法可以接受一个函数或含有映射关系字典型对象...Name: 2, dtype: float64 要选出全部含有“超过3或-3值”行,你可以在布尔型DataFrame中使用any方法: In [96]: data[(np.abs(data) > 3...如果DataFrame某一中含有k个不同值,则可以派生出一个k矩阵或DataFrame(其值全为1和0)。

5.2K90
领券