首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

数据科学 IPython 笔记本 7.6 Pandas 中的数据操作

NumPy 的一个重要部分是能够执行快速的逐元素运算,包括基本算术(加法,减法,乘法等),和更复杂的运算(三角函数,指数函数和对数函数等)。...通用函数:索引保留 因为 Pandas 为兼容 NumPy 而设计,所以任何 NumPy ufunc都可以用于 Pandas Series和DataFrame对象。...''' 如果使用NaN值不是所需的行为,则可以使用适当的对象方法代替运算符来修改填充值。...1 13.0 6.0 NaN 2 NaN NaN NaN 请注意,索引是正确对齐的,无论它们在两个对象中的顺序如何,并且结果中的索引都是有序的。...0.0 NaN 1 -1.0 NaN 2.0 NaN 2 3.0 NaN 1.0 NaN 索引和列的保留和对齐意味着,Pandas 中的数据操作将始终维护数据上下文,这可以防止在处理原始 NumPy

2.7K10

pandas学习-索引-task13

参考链接: Pandas的布尔索引 一、索引器  表的列索引 列索引是最常见的索引形式,一般通过 [] 来实现。...前面提到了多级索引表的结构和切片,那么除了使用 set_index 之外,如何自己构造多级索引呢?...# 1002    80.0     NaN # 1003    70.0     NaN # 1004     NaN     NaN 这种需求常出现在时间序列索引的时间点填充以及 ID 编号的扩充...# 1002    80.0     NaN # 1003    70.0     NaN # 1004     NaN     NaN 四、索引运算  集合的运算法则 经常会有一种利用集合运算来取出符合条件行的需求...dtype='object') print(id1.symmetric_difference(id2)) # Index(['a', 'c'], dtype='object') 上述的四类运算还可以等价的符号表示代替如下

87600

精心整理 | 非常全面的Pandas入门教程

作者:石头 | 来源:机器学习那些事 pandas是基于NumPy的一种数据分析工具,在机器学习任务中,我们首先需要对数据进行清洗和编辑等工作,pandas库大大简化了我们的工作量,熟练并掌握pandas...如何安装pandas 2. 如何导入pandas库和查询相应的版本信息 3. pandas数据类型 4. series教程 5. dataframe教程 6. 小结 1....Max.Price']].head()) # 全局变量 d = {'Min.Price': np.nanmean, 'Max.Price': np.nanmedian} # 列名Min.Price的缺失值平均值代替...,Max.Price的缺失值中值代替 df[['Min.Price', 'Max.Price']] = df[['Min.Price', 'Max.Price']].apply(lambda x, d...dataframe 我们利用元组(Tuple)构建多级索引,然后定义dataframe. # 如何构建多级索引的dataframe # 先通过元组方式构建多级索引 import numpy as np

9.9K53

Pandas知识点-算术运算函数

一、Pandas算术运算函数介绍 基本的算术运算是四则运算(加、减、乘、除)和乘方等。...其他算术运算函数与加法的用法一样,也都可以对应的运算符代替。 在进行除法运算时,如果被除数是0,得到的结果可能是inf(表示无穷大,与Python的浮点数精度有关),也可能是NaN(空值)。...每一个算术运算函数都有一个r字母开头的对应函数,起到的作用是交换运算数字的位置,如交换两个加数的位置、交换被除数与除数的位置、交换底数与指数的位置。 三、Series与数字的算术运算 ?...两个Series相加,如果形状和索引不完全一样,只会将行索引对应的数据相加,生成一个形状能兼容两个Series的新Series,在没有运算结果的位置填充空值(NaN)。 ?...以上就是Pandas中的算术运算函数介绍,如果需要本文代码,可以点击关注公众号“Python碎片”,然后在后台回复“pandas07”关键字获取完整代码。

1.9K40

python数据分析笔记——数据加载与整理

sep=””来指定。 2、当文件没有标题行时 可以让pandas为其自动分配默认的列名。 也可以自己定义列名。 3、将某一列作为索引,比如使用message列做索引。...5、文本中缺失值处理,缺失数据要么是没有(空字符串),要么是某个标记值表示的,默认情况下,pandas会用一组经常出现的标记值进行识别,如NA、NULL等。查找出结果以NAN显示。...(2)对于pandas对象(如Series和DataFrame),可以pandas中的concat函数进行合并。...(2)将‘长格式’旋转为‘宽格式’ 2、转换数据 (1)数据替换,将某一值或多个值新的值进行代替。(比较常用的是缺失值或异常值处理,缺失值一般都用NULL、NAN标记,可以新的值代替缺失标记值)。...一对一替换:np.nan替换-999 多对一替换:np.nan替换-999和-1000. 多对多替换:np.nan代替-999,0代替-1000. 也可以使用字典的形式来进行替换。

6K80

【Python量化投资】基于技术分析研究股票市场

但是,首先需要数据才能开始工资,这里我们主要靠pandas库,因为NumPy库比较常用,所以还是把该库导入。 (PS:除NumPy和SciPy,pandas也是Python的重要库之一) ? ?...这里我们读取了从2000年的第一个交易日到结束日期的S&P500指数事件序列数据,而且自动地TimeStamp对象生成一个时间索引。 收盘价的时间序列图如下: ? ?...所以先在pandas DataFrame对象上添加一个新列,用于两个趋势之间的差值。 此处的趋势策略是基于两个月(42个交易日)和一年(252个交易日)的趋势(也就是两种期间指数水平的移动平均数)。...尽管两个趋势列中的项目数量不相等,pandas通过在相应的指数位置放入NaN处理这种情况: ? 现在生成我们的投资机制,此处假定信号阈值为50: ?...其中,shift方法按照所需指数输入项数量移动时间序列----这里,每移动一个交易日,就能得到每日的对数收益率: 而基于趋势的投资策略的收益,将Regime列乘以下一天的Returns列(“昨天”的头寸得出今天的收益

1.8K90

Pandas

多级索引 多级索引提供了一种以一个较低维度的形式访问高维数据的方法,每次一个维度的索引都相当于对原数据进行一次降维。...,也可以指定 level 参数 调整 as_index 参数返回不带行标签的索引结果(取消两个及以上分组键的分组结果的多级索引) 调整 group_keys 参数,决定是否显示分组键索引 一般分组键的取值作为行索引...感觉 series.str 就可以看成是一个字符串对象,然后就可以对这个对象调用一些字符串的方法,包括索引什么的(通过装饰器把函数当属性)。...import numpy as np a = pd.Series([np.nan, 2.5, np.nan, 3.5, 4.5, np.nan], index=['f', '...的局部数据进行统计分析的场景,这时就需要用到所谓的“窗口函数”,可以理解为在整体数据集上创建窗口来进行运算,pd 中提供的几种窗口函数有: rolling(移动函数) expanding(扩展函数) ewm(指数加权函数

9.1K30

Python数据科学(六)- 资料清理(Ⅰ)1.Pandas1.资料筛选2.侦测遗失值3.补齐遗失值

接下来就让我们一起学习使用Pandas!...1.Pandas 什么是Pandas 百度百科:Python Data Analysis Library 或 pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。...Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。...根据索引取值 # 使用ix取值,通过行号索引 df.ix[[101,103,105]] # 使用loc取值,即使用标签索引行数据 df.loc[[101,103,105]] 2.侦测遗失值 缺失值是指数据中有特定或者一个范围的值是不完全的...填补缺失值 df.fillna(0) 平均数缺失值 df['age'].mean()是age这个字段平均值 df['age'].fillna(df['age'].mean()) 各性别年龄平均填缺失值

2.2K30
领券