【利用Python进行金融数据分析】开始了解和获取数据

import pandas as pd import numpy as np

获取数据集

url = 'https://raw.githubusercontent.com/justmarkham/DAT8/master/data/chipotle.tsv'

导入数据集至chipo

chipo = pd.read_csv(url,sep = '\t')

设置打印宽度

pd.set_option('display.width',1000)

查看前10行数据

print(chipo.head(10))

了解数据集中有多少个观察值

print(chipo.info())

了解数据集中有多少列

print(chipo.shape[1])

打印出全部列的名称

print(chipo.columns)

输出数据集的索引

print(chipo.index)

被下单数最多的商品(item)是什么

print(chipo.item_name.value_counts().head(1))

在item_name这一列中总共有多少商品被下单

print(chipo.item_name.nunique())

在choic_description中,下单次数最多的商品是什么

print(chipo.choice_description.value_counts().head(1))

一共有多少商品下单?

print(chipo.quantity.sum())

将item_price转换为浮点数

dollarizer = lambda x: float(x[1:-1]) chipo.item_price = chipo.item_price.apply(dollarizer) print(chipo.item_price)

在该数据集对应的时期内,收入是多少

print(chipo.item_price.sum())

在该数据集内,一共有多少订单

print(chipo.order_id.value_counts().count())

每一单的对应评价总价时多少

order_grouped = chipo.groupby(by=['order_id']).sum() avgsum = order_grouped.mean()['item_price'] print(avgsum)

print(chipo.groupby(by=['order_id']).sum().mean()['item_price'])

一共有多少种不同的商品被售出

print(chipo.item_name.value_counts().count())

本文由 所长 创作,采用 知识共享署名4.0 国际许可协议进行许可 本站文章除注明转载/出处外,均为本站原创或翻译,转载前请务必署名 最后编辑时间为: Apr 21, 2018 at 10:22 am

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

扫码关注云+社区

领取腾讯云代金券