专栏首页行者常至005.python科学计算库pandas(下)

005.python科学计算库pandas(下)

版权声明:本文为博主原创文章,允许转载,请标明出处。 https://blog.csdn.net/qwdafedv/article/details/82706521

测试数据 fandango_score_comparison.csv


series

import pandas as pd
from pandas import Series

fandango = pd.read_csv('fandango_score_comparison.csv')
series_film = fandango['FILM']
print(series_film[0:5])
print("----------------------------------")
series_rt = fandango['RottenTomatoes']
print(series_rt[0:5])
print("----------------------------------")
film_names = series_film.values
rt_scores = series_rt.values
# 带轴标的一维ndarray(包括时间序列)。
series_custom = Series(rt_scores, index=film_names)
print(series_custom[['Minions (2015)', 'Leviathan (2014)']])
print("----------------------------------")
print(series_custom[4:6])

sort

import pandas as pd
from pandas import Series

fandango = pd.read_csv('fandango_score_comparison.csv')
series_film = fandango['FILM']
series_rt = fandango['RottenTomatoes']
film_names = series_film.values
rt_scores = series_rt.values
# 带轴标的一维ndarray(包括时间序列)。
series_custom = Series(rt_scores, index=film_names)
original_index = series_custom.index.tolist()
# sorted 以升序返回一个包含迭代中所有项的新列表。
sorted_index = sorted(original_index)
print(sorted_index)
print("----------------------------------")
# 按照已排序后的sorted_index来排序series_custom (sorted_index 和 series_custom.index 元素需保持一致)
sorted_by_index = series_custom.reindex(sorted_index)
print(sorted_by_index)
import pandas as pd
from pandas import Series

fandango = pd.read_csv('fandango_score_comparison.csv')
series_film = fandango['FILM']
series_rt = fandango['RottenTomatoes']
film_names = series_film.values
rt_scores = series_rt.values
# 带轴标的一维ndarray(包括时间序列)。
series_custom = Series(rt_scores, index=film_names)
sc2 = series_custom.sort_index()
print(sc2[0:4])
print("----------------------------------")
sc3 = series_custom.sort_values()
print(sc3[0:4])

series算术运算

import pandas as pd
from pandas import Series
import numpy as np

fandango = pd.read_csv('fandango_score_comparison.csv')
series_film = fandango['FILM']
series_rt = fandango['RottenTomatoes']
film_names = series_film.values
rt_scores = series_rt.values
# 带轴标的一维ndarray(包括时间序列)。
series_custom = Series(rt_scores, index=film_names)
print(series_custom[0:3])
print("----------------------------------")
# 将每个值相加
print(np.add(series_custom, series_custom)[0:3])
print("----------------------------------")
# 对每个值应用正弦函数
print(np.sin(series_custom)[0:3])
print("----------------------------------")
# 返回最高值(将返回单个值而不是一系列值)
print(np.max(series_custom))
import pandas as pd
from pandas import Series

fandango = pd.read_csv('fandango_score_comparison.csv')
series_film = fandango['FILM']
series_rt = fandango['RottenTomatoes']
film_names = series_film.values
rt_scores = series_rt.values
# 带轴标的一维ndarray(包括时间序列)。
series_custom = Series(rt_scores, index=film_names)
# series_custom > 50 会为每个film返回一个带有布尔值的系列对象
series_greater_than_50 = series_custom[series_custom > 50]
print(series_greater_than_50[0:5])
print("-----------------------------------")
both_criteria = series_custom[(series_custom > 50) & (series_custom < 75)]
print(both_criteria[0:5])
import pandas as pd
from pandas import Series

fandango = pd.read_csv('fandango_score_comparison.csv')
rt_critics = Series(fandango['RottenTomatoes'].values, index=fandango['FILM'])
print(rt_critics[0:3])
rt_users = Series(fandango['RottenTomatoes_User'].values, index=fandango['FILM'])
print(rt_users[0:3])
rt_mean = (rt_critics + rt_users) / 2
print(rt_mean[0:3])

set_index

import pandas as pd
from pandas import Series

fandango = pd.read_csv('fandango_score_comparison.csv')
# set_index 使用一个或多个现有列设置DataFrame索引(行标签)。默认情况下,生成一个新对象。
#       drop : boolean, default True 删除要用作新索引的列
fandango_films = fandango.set_index('FILM', drop=False)
print(fandango_films[0:3])
  • 当选择多个行时,返回一个DataFrame, 但当选择单个行时,返回的是一个Series对象
import pandas as pd

fandango = pd.read_csv('fandango_score_comparison.csv')
fandango_films = fandango.set_index('FILM', drop=False)
# 使用括号表示法或loc[]进行切片
sub_films = fandango_films["Avengers: Age of Ultron (2015)":"Ant-Man (2015)"]
print(sub_films)
print(type(sub_films))
print("----------------------------------------------------")
sub_films = fandango_films.loc["Avengers: Age of Ultron (2015)":"Ant-Man (2015)"]
print(sub_films)
print(type(sub_films))
print("----------------------------------------------------")
# 查找特定的 movie
film = fandango_films.loc['Kumiko, The Treasure Hunter (2015)']
print(type(film))
print("----------------------------------------------------")
# 查找特定的 movie 列表
movies = ['Kumiko, The Treasure Hunter (2015)', 'Do You Believe? (2015)']
print(fandango_films.loc[movies])
print(type(fandango_films.loc[movies]))
# 当选择多个行时,返回一个DataFrame,
# 但当选择单个行时,返回的是一个Series对象
import pandas as pd
import numpy as np

fandango = pd.read_csv('fandango_score_comparison.csv')
fandango_films = fandango.set_index('FILM', drop=False)
# panda中的apply()方法允许我们指定Python逻辑
# apply()方法需要传入一个矢量化操作
# 可以应用于每个系列对象。
# 以Series的形式返回数据类型
types = fandango_films.dtypes
# print(types) 返回所有的列名称
print(type(types))
print("----------------------------------------------------")
# 过滤数据类型为floats,索引属性只返回列名
float_columns = types[types.values == 'float64'].index
# 使用括号表示法过滤列,使其只是float列
float_df = fandango_films[float_columns]
print(float_df[0:3])
print(type(float_df))
print("----------------------------------------------------")
# “x”是表示列的系列对象
# numpy.std 计算沿指定轴的标准差。
deviations = float_df.apply(lambda x: np.std(x))
print(deviations[0:3])
print(type(deviations))
print("----------------------------------------------------")
rt_mt_user = float_df[['RT_user_norm', 'Metacritic_user_nom']]
deviations = rt_mt_user.apply(lambda x: np.std(x), axis=1)
print(deviations[0:3])

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 《动物魔法学校》儿童学编程Scratch之“外观”部分

    导读:本文通过一个案例《动物魔法学校》来学习Scratch语言的“外观”部分。之后通过一系列其他功能的综合运用对作品功能进行了扩展。

    一石匠人
  • 一张图理清《梅花易数》梗概

    学《易经》的目的不一定是为了卜卦,但是了解卜卦绝对能够让你更好地了解易学。今天用一张思维导图对《梅花易数》的主要内容进行概括,希望能够给学友们提供帮助。

    一石匠人
  • 复杂业务下向Mysql导入30万条数据代码优化的踩坑记录

    从毕业到现在第一次接触到超过30万条数据导入MySQL的场景(有点low),就是在顺丰公司接入我司EMM产品时需要将AD中的员工数据导入MySQL中,因此楼主负...

    haifeiWu
  • 什么样的人生才是有意义的人生——没有标准的标准答案

    【导读】其实我们可以跳出这个小圈圈去更加科客观地看一下这个世界。在夜晚的时候我们仰望天空,浩瀚的宇宙中整个地球只是一粒浮尘,何况地球上一个小小的人类?在漫长的历...

    一石匠人
  • 儿童创造力教育与编程教育的碰撞——MIT雷斯尼克教授最新理论梗概

    儿童编程教育已经在我国各一线二线城市疯狂出现,颇有“烂大街”的趋势。我们不禁要问很多很多问题:

    一石匠人
  • SQL中GROUP BY用法示例

    GROUP BY我们可以先从字面上来理解,GROUP表示分组,BY后面写字段名,就表示根据哪个字段进行分组,如果有用Excel比较多的话,GROUP BY比较类...

    Awesome_Tang
  • 我不是算命先生,却对占卜有了疑惑——如何论证“占卜前提”的正确与否

    事出有因,我对《周易》感兴趣了很多年。只是觉得特别有趣,断断续续学习了一些皮毛。这几天又偶然接触到了《梅花易数》,觉得很是精彩,将五行八卦天干地支都串联了起来。...

    一石匠人
  • 【系统设置】CentOS 修改机器名

    ken.io
  • 声音功能让儿童编程更有创造性

    导读:Scratch中声音功能非常强大,除了常规的音效,你甚至可以模拟各种乐器的各个发音、设置节拍、休止……如果你愿意,甚至可以用它创作一个交响乐。我们可以引导...

    一石匠人
  • 天干地支五行八卦的对应关系

    一石匠人

扫码关注云+社区

领取腾讯云代金券