专栏首页产品研究所【利用Python进行金融数据分析-06】统计

【利用Python进行金融数据分析-06】统计

import pandas as pd import datetime import numpy as np

pd.set_option('display.width',1000)

url = 'https://raw.githubusercontent.com/guipsamora/pandas_exercises/master/06_Stats/Wind_Stats/wind.data' data = pd.read_table(url,sep='\s+',parse_dates=[[0,1,2]]) print(data.head())

2061年?这个数据明显错误,创建函数处理该问题

def fix_century(x): year = x.year - 100 if x.year > 1989 else x.year return datetime.date(year, x.month, x.day)

data['Yr_Mo_Dy'] = data['Yr_Mo_Dy'].apply(fix_century) print(data) data.Yr_Mo_Dy = pd.to_datetime(data.Yr_Mo_Dy) data = data.set_index('Yr_Mo_Dy') print(data.head(5))

对应每一个location 一共有多少个缺失值 print(data.isnull().sum())

对应每一个location ,一共由多少完整的数据值 shape[0]获取行数,shape[1]获取列数 print(data.shape[1]-data.isnull().sum())

对于全体数据,计算风速的平均值 print(data.mean().mean())

创建一个名为loc_stats的数据框去计算并存储每一个location的最小值、最大值、平均值、标准差。 loc_satas = pd.DataFrame() loc_satas['min'] = data.min() loc_satas['max'] = data.max() loc_satas['mean'] = data.mean() loc_satas['std'] = data.std() print(loc_satas)

创建一个名为day_stats 的数据框去计算并存储所有locataion的风速最小值、最大值、平均值和标准差 day_stats = pd.DataFrame()

day_stats['min'] = data.min(axis =1) day_stats['max'] = data.max(axis =1) day_stats['mean'] = data.mean(axis =1) day_stats['std'] = data.std(axis =1) print(day_stats)

对于每一个location,计算一月份的平均风速

`data['date'] = data.index

data['month'] = data['date'].apply(lambda date: date.month) data['year'] = data['date'].apply(lambda date: date.year) data['day'] = data['date'].apply(lambda date: date.day)

january_winds = data.query('month == 1')

print(january_winds.loc[:,'RPT':'MAL'].mean())`

对于数据记录安年频率取样 print(data.query('month == 1 and day == 1'))

按月为频率取样 print(data.query('day >= 1 and day <= 5'))

本文由 所长 创作,采用 知识共享署名4.0 国际许可协议进行许可 本站文章除注明转载/出处外,均为本站原创或翻译,转载前请务必署名 最后编辑时间为: Apr 23, 2018 at 11:25 am

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • golang基础之初识

    很久以前,有一个IT公司,这公司有个传统,允许员工拥有20%自由时间来开发实验性项目。在2007的某一天,公司的几个大牛,正在用c++开发一些比较繁琐但是核心的...

    程序员同行者
  • 2019年python、golang、java、c++如何选择?

    2019年python、golang、java、c++如何选择?那我们就这几门语言详细的比一比呗。

    李海彬
  • 人人都应该懂Python的时代,再不学习就晚了

    Python是一门计算机编程语言,类似Java,PHP,C++等编程语言。Python本身面向对象语言,具有丰富和强大的库,轻松地使用C语言、C++、Cytho...

    腾讯NEXT学位
  • 网易杭州游戏研发实习面经

    在牛客混了一段时间,看了很多大佬的面经,学习了很多,国内面试套路跟美国不大一样,写点东西也回馈下牛友

    牛客网
  • 「Python调试器」,快速定位各种疑难杂症!!!

    现在很多的编辑器其实都带着「调试程序」的功能,比如写 c/c++ 的 codeblocks,写 Python 的 pycharm,这种图形界面的使用和显示都相当...

    一墨编程学习
  • Python在手,天下我有!

    说来也奇怪,N妹周围互联网同事最近纷纷开始学Python,N妹没跟上这波步伐,感觉就要被时代抛弃了?

    腾讯NEXT学位
  • 太極:MIT华人学神开源的计算机图形库

    太極(Taichi)是一个开源的计算机图形库,它旨在提供易于使用的计算机图形学基础架构,并提供了 40 多份计算机图形学重要研究的实现。出于效率的考虑,太極本身...

    机器之心
  • 昨天去面试,这5个Python面试题都被考到了,Python面试题No6

    这个考点考了python的解压赋值的知识点,即 a,b,c,middle,d,e,f = list, middle = [1,2,3,4,5]。

    梦想橡皮擦
  • 一图看懂编程语言迁移模式:终点站是Python、Go、JS

    铁打的程序员,流水的编程语言。时代在发展,编程语言也与时俱进,不断有新的、更好或者更时髦的语言出现,程序员也会或主动、或被动去学习一门新的、”更好“的编程语言。

    新智元
  • Kotlin 中的 Lambda 与 Inline

    在Kotlin中,有很多很酷很实用的特性,比如Lambda和高阶函数,利用这些特性,我们可以更加快速的实现开发,提升效率。

    Android技术干货分享

扫码关注云+社区

领取腾讯云代金券