首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

统计学与pandas学习(六)—— 夏普比率

就此意义上来说,金融商品优劣性的评价基准是夏普比率(SPM)。夏普比率的公式(X的夏普比率)= [((X的回报)-(国债的收益率)] )/ (X的风险) 来计算。...夏普比率计算假设正在使用的回报是正态分布(即高斯)。不幸的是,市场往往高于正常分布的峰度。相比高斯分布将导致我们相信的来说,回报的分配存在“长尾效应”,极端事件有可能发生。...练习 获取数据(使用alpha_vantage库,读取ALPHA VANTAGE股票数据): import pandas as pd import numpy as np from alpha_vantage.timeseries...import TimeSeries ts = TimeSeries(key='******',output_format='pandas') # 使用000680股票为例子 data, meta_data...,假设年化收益率为3.9%,每年252个交易日 data['excess_daily_ret'] = data['daily_ret'] - 0.039/252 # 计算年化夏普比率,默认为252个交易日

1.6K30

python科学计算Pandas使用(三)

前两天介绍了 最常见的Pandas数据类型Series的使用,DataFrame的使用,今天我们将是最后一次学Pandas了,这次讲的读取csv文件。...Python 中还有一个 csv 的标准库,足可见 csv 文件的使用频繁了。 ? 什么时候也不要忘记这种最佳学习方法。从上面结果可以看出,csv 模块提供的属性和方法。...用 Pandas 读取 如果对上面的结果都有点不满意的话,那么看看 Pandas 的效果: ? 看了这样的结果,你还不感觉惊讶吗?你还不喜欢上 Pandas 吗?这是多么精妙的显示。它是什么?...可以说,当你已经掌握了通过 dir() 和 help() 查看对象的方法和属性时,就已经掌握了 pandas 的用法,其实何止 pandas,其它对象都是如此。...它们都可以使用 pandas 来轻易读取。 .xls 或者 .xlsx 在下面的结果中寻觅一下,有没有跟 excel 有关的方法? ?

1.4K10
您找到你想要的搜索结果了吗?
是的
没有找到

python科学计算Pandas使用(一)

导读基本的数据结构 Pandas 有两种自己独有的基本数据结构。...读者应该注意的是,它固然有着两种数据结构,因为它依然是 Python 的一个库,所以,Python 中有的数据类型在这里依然适用,也同样还可以使用类自己定义数据类型。...并且如果你跟我一样是使用 ipython notebook,只需要开始引入模块即可。 Series Series 就如同列表一样,一系列数据,每个数据对应一个索引值。...Pandas 的优势在这里体现出来,如果自定义了索引,自定的索引会自动寻找原来的索引,如果一样的,就取原来索引对应的值,这个可以简称为“自动对齐”。 ?...Pandas 有专门的方法来判断值是否为空。 ? 此外,Series 对象也有同样的方法: ? 其实,对索引的名字,是可以从新定义的: ?

62820

Python科学计算Pandas

在数据分析工作中,Pandas使用频率是很高的,一方面是因为Pandas提供的基础数据结构DataFrame与json的契合度很高,转换起来就很方便。...如果我想知道哪列存在空值,可以使用df.isnull().any(),结果如下: ? 使用apply函数对数据进行清洗 apply函数是Pandas中自由度非常高的函数,使用频率也非常高。...事实上,在Python里可以直接使用SQL语句来操作Pandas。 这里给你介绍个工具:pandasql。...argument_list是参数列表,expression是关于参数的表达式,会根据expression表达式计算结果进行输出返回。...Pandas包与NumPy工具库配合使用可以发挥巨大的威力,正是有了Pandas工具,Python做数据挖掘才具有优势。 ?

1.9K10

Excel与pandas使用applymap()创建复杂的计算

标签:Python与Excel,pandas 我们之前讨论了如何在pandas中创建计算列,并讲解了一些简单的示例。...通过将表达式赋值给一个新列(例如df['new column']=expression),可以在大多数情况下轻松创建计算列。然而,有时我们需要创建相当复杂的计算列,这就是本文要讲解的内容。...记住,我们永远不应该循环遍历pandas数据框架/系列,因为如果我们有一个大的数据集,这样做效率很低。...pandas applymap()方法 pandas提供了一种将自定义函数应用于列或整个数据框架的简单方法,就是.applymap()方法,这有点类似于map()函数的作用。...图3 我们仍然可以使用map()函数来转换分数等级,但是,需要在三列中的每一列上分别使用map(),而applymap()能够覆盖整个数据框架(多列)。

3.8K10

快速入门Tableau系列 | Chapter09【计算字段与表计算:粒度、聚合与比率

29、粒度、聚合与比率 1、粒度 粒度:源于Tableau的散点图,它表示数据的可理浓度 示例图形: ①创建粒度图形:利润->列,销售额->行,市场->颜色 ?...3、比率 步骤: ①创建分层结构:右键->类别->分层结构->创建分层结构 ? ②完善分层结构:子类别->类别,行ID->类别,并调整顺序 ? ③创建计算字段: ? ?...关键字总共又三种: ==1、INCLUDE:==在其他任何维度的基础之上使用指定的维度计算值。 ==2、FIXED:==使用指定的维度计算值,不参考其他视图中的任何维度。...==3、EXCLUDE:==忽略指定的维度,即使在视图中使用该维度也要忽略。 前两个如果不能理解,可以看下面的例子: ?...31、表计算 31.1 快速表计算 我们采用比率的图片继续往下讲: ? 步骤: ①右键利润->创建->计算字段,双击筛选器中的度量名称->添加利润2和销售额 ? ?

2K10

Python科学计算Pandas

而Scipy(会在接下来的帖子中提及)当然是另一个主要的也十分出色的科学计算库,但是我认为前三者才是真正的Python科学计算的支柱。...所以,不需要太多精力,让我们马上开始Python科学计算系列的第三帖——Pandas。如果你还没有查看其他帖子,不要忘了去看一下哦! 导入Pandas 我们首先要导入我们的演出明星——Pandas。...如果你仔细查看其他人使用Pandas的代码,你会发现这条导入语句。 Pandas的数据类型 Pandas基于两种数据类型:series与dataframe。...将数据导入Pandas 在我们开始挖掘与分析之前,我们首先需要导入能够处理的数据。幸好,Pandas在这一点要比Numpy更方便。 在这里我推荐你使用自己所感兴趣的数据集来使用。...上述代码会将你的数据存入一个csv文件以备下次使用。 到此为止,我们简单介绍了Pandas。正如我之前说的,Pandas是非常好用的库,而我们仅仅是接触了一点皮毛。

2.9K00

使用Dask DataFrames 解决Pandas中并行计算的问题

大多数Dask API与Pandas相同,但是Dask可以在所有CPU内核上并行运行。它甚至可以在集群上运行,但这是另一个话题。 今天你将看到Dask在处理20GB CSV文件时比Pandas快多少。...处理单个CSV文件 目标:读取一个单独的CSV文件,分组的值按月,并计算每个列的总和。 用Pandas加载单个CSV文件再简单不过了。...处理多个CSV文件 目标:读取所有CSV文件,按年值分组,并计算每列的总和。 使用Pandas处理多个数据文件是一项乏味的任务。简而言之,你必须一个一个地阅读文件,然后把它们垂直地叠起来。...如果notebook 完全崩溃,使用少量的CSV文件。 让我们看看Dask提供了哪些改进。它接受read_csv()函数的glob模式,这意味着您不必使用循环。...结论 今天,您学习了如何从Pandas切换到Dask,以及当数据集变大时为什么应该这样做。Dask的API与Pandas是99%相同的,所以你应该不会有任何切换困难。

4K20

换个角度谈边缘计算:电力供给压力与计算能力占比率不高,它是过度炒作吗?

从功耗看边缘计算 为什么网络边缘计算的领域很小?下面从不同的角度来观察:功率。边缘计算计算行业顶端和底端人员使用的指标,但很少被中间的人使用,例如网络所有者。这意味着它们忽略了几个数量级。...数据中心的大功率负载 云计算涉及大量数据,比如服务器、处理器、标准尺寸设备机架、占地空间之类的数量指标。但数据中心用户使用最多的数字可能是以瓦特为单位的功耗,或者更常见的是kW、MW和GW。...比如: 传感器在空闲时的使用可能不到10mW,在主动处理数据时可能使用100mW Raspberry Pi可能会使用0.5W 智能手机处理器可能使用1-3W 物联网网关(控制各种本地设备)可能是5-10W...汽车空调可能会使用2kW。 当然,边缘设备计算平台有很多。当我们拥有数十亿的手机、数以亿计的车辆以及个人电脑时,潜在的,我们也将会有数十亿的传感器,但大多数并不协调。...基于区块链的边缘“雾”也不可能真正解决这个问题,即使它们也使用分散的、基于区块链的供电和管理。 这0.1%-1%的计算工作量将具有如此重要的作用,它们需要把所有的东西带入其轨道和间接控制。

76120

Pandas使用 (一)

What is pandas Pandas是python中用于处理矩阵样数据的功能强大的包,提供了R中的dataframe和vector的操作,使得我们在使用python时,也可以方便、简单、快捷、高效地进行矩阵数据处理.../ENCFF289HGQ.tsv', 'pandas_data/gencode.v24.ENS2SYN', 'pandas_data/ENCFF262OBL.tsv', 'pandas_data/...,既可以减少文件数目、压缩使用空间,又可以方便多次快速读取,并且可以在不同的程序语言如Python与R中共同使用。...# 写入模式打开一个HDF5文件,使用压缩格式以节省空间 store = pd.HDFStore("pandas_data/ENCODE.hdf5", "w", complib=str("zlib"),...# 写入模式打开一个HDF5文件,使用压缩格式已节省空间 store = pd.HDFStore("pandas_data/ENCODE.hdf5", "w", complib=str("zlib"),

2.4K90

30个函数玩转Pandas统计计算

我在进行数据处理的时候除了清洗筛选处理外还会涉及到统计计算处理,这里我们就来介绍一些常见的统计计算函数吧。 1....内蒙古自治区 17359.8 17212.5 16140.8 14898.1 13789.3 In [2]: df.info() # 查看各字段数据类型、条数及空值数 <class 'pandas.core.frame.DataFrame...categorical rather than numeric in `.describe` is deprecated and will be removed in a future version of pandas...统计计算 这里我们演示常见的统计计算函数方法,默认情况下都是按列统计,我们也可以指定按行,具体见下方演示 # 最大值 In [11]: df.max(numeric_only=True) Out[11...2683.66 29 3432.18 30 12198.96 31 NaN Length: 32, dtype: float64 以下部分不做具体演示,仅介绍函数功能,所有这些在使用的时候都要注意下原始数据类型

54620

资源|Pandas科学计算速查表

本次带来的是科学计算Pandas的速查表。 pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。...Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。...Pandas基础: Pandas Pandas数据结构 输入/输出 使用帮助 选择 删除数据 排序和排名 查询序列与数据框的信息 应用函数 数据对齐 ?...Pandas进阶: 数据结构 迭代 高级索引 重复数据 数据分组 缺失值 合并数据 日期 可视化 b 资 源 分 享 资源分享 为了方便大家,我把资料已经打包好,欢迎下载收藏。 获取方式: 1....后台回复"Pandas速查表"即可获取PDF速查表~(建议复制,避免错字)

45520
领券