首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

数学建模学习笔记(十一)三大相关系数(pearson、spearman 和 kendall)

三大相关系数分别是pearson[皮尔森]、spearman[斯皮尔曼] 和 kendall[肯德尔] 反应都是两个变量之间变化趋势方向以及程度,其值范围为-1到+1,0表示两个变量不相关,正值表示正相关...,负值表示负相关,值越大表示相关性越强。...比如评委对选手评分(优、中、差等),我们想看两个(或者多个)评委对几位选手评价标准是否一致;或者医院尿糖化验报告,想检验各个医院对尿糖化验结果是否一致,这时候就可以使用肯德尔相关性系数进行衡量。...pandas代码: # coding: utf-8 import numpy as np import pandas as pd def Pearson(df): # 计算 Pearson 相关系数...Spearman(df): # 计算 Spearman 秩相关 return df.corr('spearman') if __name__ == "__main__": df = pd.DataFrame

1.4K20

熟练掌握 Pandas 离散差分,数据变化一目了然

你是否遇到过这种情况:有一串数据,你想知道每两个相邻数据之间差值是多少?比如你记录了每天气温,想看看今天和昨天温差有多大。这时候,pandas.diff() 这个方法就派上用场了。...比如股票价格日线走势,通过计算相邻两天价差,就能更清楚地观察到价格涨跌幅度。 计算变量值在相邻时间点或索引点之间变化量和变化率,方便你追踪变量走势。 检测异常值。...这是 pandas 快速上手系列第 7 篇文章,希望对你有帮助。...如果是正值n, 表示当前元素与n行之前元素差分。 如果是负值-n, 表示当前元素与n行之后元素差分。...示例: import pandas as pd In [37]: df = pd.DataFrame({'A': [1, 3, 6, 10, 15],

7600

夏普比率

夏普指数代表投资人每多承担一分风险,可以拿到几分超额报酬;若为正值,代表基金报酬率高过波动风险;若为负值,代表基金操作风险大过于报酬率。...举例而言,假如国债回报是 3%,而您投资组合预期回报是 15%,您投资组合标准偏差是 6%,那么 15%-3%, 可以得出 12%(代表您超出无风险投资回报),再用 12%/6%=2,代表投资者风险每增长...import numpy as np import pandas as pd from pandas_datareader import data as wb import matplotlib.pyplot...宝洁 美国标普500强 assets = ["PG","^GSPC"] assets = ['PG', '^GSPC'] assets = ['PG', '^GSPC'] adata = pd.DataFrame...如果夏普比率为正值,说明在衡量期内基金平均净值增长率超过了无风险利率,在以同期银行存款利率作为无风险利率情况下,说明投资基金比银行存款要好。 夏普比率越大,说明基金单位风险所获得风险回报越高。

95730

Pandas数据分析包

(obj4) print('替换index') obj.index = ['Bob', 'Steve', 'Jeff', 'Ryan'] print(obj) DateFrame DataFrame...数组修改元素 print(frame2) print('Series指定要修改索引及其对应值,没有指定默认数据NaN。')...如果两个 变量变化趋势一致,也就是说如果其中一个大于自身期望值时另外一个也 大于自身期望值,那么两个变量之间协方差就是正值;如果两个变量变 化趋势相反,即其中一个变量大于自身期望值时另外一个却小于自身期望...值,那么两个变量之间协方差就是负值。...,它在修正数据,一个DataFrame来填补前面的DataFrame中NAN数据 Merge, join, and concatenate官方文档说明:http://pandas.pydata.org

3.1K71

20个能够有效提高 Pandas数据分析效率常用函数,附带解释和例子

Pandas是一个受众广泛python数据分析库。它提供了许多函数和方法来加快数据分析过程。pandas之所以如此普遍,是因为它功能强大、灵活简单。...本文将介绍20个常用 Pandas 函数以及具体示例代码,助力你数据分析变得更加高效。 ? 首先,我们导入 numpy和 pandas包。...Replace 顾名思义,它允许替换dataframe值。第一个参数是要替换值,第二个参数是新值。 df.replace('A', 'A_1') ? 我们也可以在同一个字典中多次替换。...例如,我们可以使用pandas dataframesstyle属性更改dataframe样式。...以下代码将负值颜色设置为红色: def color_negative_values(val): color = 'red' if val < 0 else 'black' return

5.5K30

Pandas可视化详解 | 轻松玩转Pandas(12)

教你学会 Pandas 不是我目的,教你轻松玩转 Pandas 才是我目的。我会通过一系列实例来带入 Pandas 知识点,让你在学习 Pandas 路上不再枯燥。...声明:我所写轻松玩转 Pandas 教程都是免费,如果对你有帮助,你可以持续关注我。...("ggplot") %matplotlib inline np.random.seed(100) Pandas 数据可视化实现底层依赖于 matplotlib,所以画图时很多基础知识需要涉及到...别怕,Pandas 非常方便为我们提供了参数 x 和 y。 df.plot(x="A", y="C") <matplotlib.axes....默认情况下,区域图是堆积,要生成堆积区域图图,每列必须全部为正值或全为负值。 df.abs().plot(kind="area") <matplotlib.axes.

2.6K20

Pandas 50题练习

受到numpy100题启发,我们制作了pandas50题。 Pandas 是基于 NumPy 一种数据处理工具,该工具为了解决数据分析任务而创建。...Pandas 纳入了大量库和一些标准数据模型,提供了高效地操作大型数据集所需函数和方法。这些练习着重DataFrame和Series对象基本操作,包括数据索引、分组、统计和清洗。...摩拳擦掌想做题试试手感 参考资料 | 100-pandas-puzzles - GitHub | Pandas 百题大冲关 基本操作 导入 Pandas 库并简写为 pd,并输出版本号 import...].index.tolist() 给定DataFrame,将负值代替为同组平均值 df = pd.DataFrame({'grps': list('aaabbcaabcccbbc'),...,但是我们希望每个数字被录入成单独一列,delay_1, delay_2, ...没有的NAN替代。

2.9K20

pandas100个骚操作:一行 pandas 代码搞定 Excel “条件格式”!

一是使用了pandasstyle方法,二是要得益于pandas链式法则。 下面我们来一起看个例子,体验一下这个组合操作有多骚。...可以看到,现在这个dataframe是空白,什么都没有的,现在要给表格添加一些条件。 1、比如我们想让Fare变量值呈现条形图,以清楚看出各个值得大小比较,那么可直接使用bar代码如下。...以上就是pandasstyle条件格式,用法非常简单。下面我们链式法则将以上三个操作串起来,只需将每个方法加到前一个后面即可,代码如下。...其它操作 上面仅仅是列举了三个style中常用操作,还有很多其他操作比如高亮最大值、给所有负值标红等等,通过参数subset还可以指定某一列或者某几列小范围内进行条件格式操作。..."Coulumn": lambda x: "±{:.2f}".format(abs(x))}) # 使用subset进行dataframe切片,选择指定列 applymap(color_negative_red

2.6K30

一行 pandas 代码搞定 Excel 条件格式!

本次给大家介绍pandas表格可视化几种常用技巧。 条件格式 Excel “条件格式” 是非常棒功能,通过添加颜色条件可以让表格数据更加清晰凸显出统计特性。...一是使用了pandasstyle方法,二是要得益于pandas链式法则。 下面我们来一起看个例子,体验一下这个组合操作有多骚。...import pandas as pd df = pd.read_csv("test.csv") df 可以看到,现在这个dataframe是空白,什么都没有的,现在要给表格添加一些条件。...df.style.highlight_null() 以上就是pandasstyle条件格式,用法非常简单。下面我们链式法则将以上三个操作串起来,只需将每个方法加到前一个后面即可,代码如下。...其它操作 上面仅仅是列举了三个style中常用操作,还有很多其他操作比如高亮最大值、给所有负值标红等等,通过参数subset还可以指定某一列或者某几列小范围内进行条件格式操作。

21630

解决TypeError: read_excel() got an unexpected keyword argument ‘parse_cols or ‘she

这些错误消息通常是由于​​pandas​​版本更新导致,某些参数已被弃或更改。...bashCopy codepip show pandas确保安装版本是最新版本,如果不是最新版本,我们可以使用以下命令来更新​​pandas​​:bashCopy codepip install --...upgrade pandas更新代码如果我们​​pandas​​版本是最新,但仍然遇到​​TypeError​​错误,那么我们需要检查我们代码,并更改使用了被弃参数地方。...首先检查​​pandas​​版本,如果不是最新版本就升级,然后检查代码中使用了被弃参数地方,将它们替换为新参数名。 通过以上步骤,我们可以成功解决这个错误,继续正常地处理Excel文件。...以下是Pandas一些主要特性:数据结构:Pandas提供了两种主要数据结构,即​​Series​​和​​DataFrame​​。​​

75450

数据分析最常用18个概念,终于有人讲明白了

偏斜度(Skewness) 偏斜度是关于表现数据分布对称性指标。如果其值是0,则代表一个对称性分布;若其值是正值,代表分布峰值偏左;若其值是负值,代表分布峰值偏右。...在图2-2中给出了偏斜度示例。 ? ▲图2-2 Skewness含义 Skewness绝对值(不论是正值还是负值)如果大于1是个很明显信号,你数据分布有明显不对称性。...峰态(Kurtosis) 标准正态分布峰态值是3,但是在很多数据分析工具中对峰态值减去3,使得:0代表是正态分布;正值代表数据分布有个尖尖峰值,高于正态分布峰值;负值代表数据有个平缓峰值,且低于正态分布峰值...Python PandasDataFramedescribe方法默认只统计连续性字段最大值、最小值、均值、标准差、四分位数,如果想获取其他特征值,需要调用相应函数来获得。...▲表2-5 分类型变量数据探索示例代码运行结果 应用Python Pandas相关函数能够非常容易得到分类型变量探索结果,表2-5所示就是数据探索示例代码运行结果。

1.1K10

手把手教你plotly绘制excel中常见16种图表(下)

上一期咱们介绍《手把手教你plotly绘制excel中常见16种图表(上)》演示了8种常见图表,今天我们继续演示另外8种常见图表绘制。...旭日图 pd.Dataframe类型数据下绘制 旭日图 # pd.Dataframe类型数据下绘制 旭日图 import plotly.express as px df = px.data.tips(...瀑布图 瀑布图显示加上或减去值时累计汇总,在理解一系列正值负值对初始值(例如,净收入)影响时,这种图表非常有用。 列采用彩色编码,可以快速将正数与负数区分开来。...基础漏斗图 多漏斗图对比 这里我们演示直接从pd.Dataframe类型数据操作绘制情况 # 构建测试数据 pd.Dataframe类型 import pandas as pd stages = [...plotly地图绘制形式有很多种,这里不做更详细介绍,我们后续再找个时间详细讲解。 这里此前《Python爬取贝壳找房8万+二手房源,看看普通人在北京买房是有多难!》

2.2K30

数据分析最常用18个概念,终于有人讲明白了

偏斜度(Skewness) 偏斜度是关于表现数据分布对称性指标。如果其值是0,则代表一个对称性分布;若其值是正值,代表分布峰值偏左;若其值是负值,代表分布峰值偏右。...在图2-2中给出了偏斜度示例。 ? ▲图2-2 Skewness含义 Skewness绝对值(不论是正值还是负值)如果大于1是个很明显信号,你数据分布有明显不对称性。...峰态(Kurtosis) 标准正态分布峰态值是3,但是在很多数据分析工具中对峰态值减去3,使得:0代表是正态分布;正值代表数据分布有个尖尖峰值,高于正态分布峰值;负值代表数据有个平缓峰值,且低于正态分布峰值...Python PandasDataFramedescribe方法默认只统计连续性字段最大值、最小值、均值、标准差、四分位数,如果想获取其他特征值,需要调用相应函数来获得。...▲表2-5 分类型变量数据探索示例代码运行结果 应用Python Pandas相关函数能够非常容易得到分类型变量探索结果,表2-5所示就是数据探索示例代码运行结果。

1.2K11

从小白到大师,这里有一份Pandas入门指南

这是一篇最佳实践教程,既适合用过 Pandas 读者,也适合没用过但想要上手小白。 通过本文,你将有望发现一到多种 pandas 编码新方法。...Pandas 的当前最新版本是 v0.25.0 (https://github.com/pandas-dev/pandas/releases/tag/v0.25.0) ?...这种分类类型允许索引替换重复值,还可以把实际值存在其他位置。教科书中例子是国家。和多次存储相同字符串「瑞士」或「波兰」比起来,为什么不简单地 0 和 1 替换它们,并存储在字典中呢?...'].astype(np.float64) df = df.apply(lambda _df: _df.replace(4, np.nan)) df = df.dropna(how='all') 下面的链替换...norm_df() 将一个 DataFrame MinMaxScaling 扩展列列表当做输入。

1.7K30

从小白到大师,这里有一份Pandas入门指南

这是一篇最佳实践教程,既适合用过 Pandas 读者,也适合没用过但想要上手小白。 通过本文,你将有望发现一到多种 pandas 编码新方法。...Pandas 的当前最新版本是 v0.25.0 (https://github.com/pandas-dev/pandas/releases/tag/v0.25.0) ?...这种分类类型允许索引替换重复值,还可以把实际值存在其他位置。教科书中例子是国家。和多次存储相同字符串「瑞士」或「波兰」比起来,为什么不简单地 0 和 1 替换它们,并存储在字典中呢?...'].astype(np.float64) df = df.apply(lambda _df: _df.replace(4, np.nan)) df = df.dropna(how='all') 下面的链替换...norm_df() 将一个 DataFrame MinMaxScaling 扩展列列表当做输入。

1.8K11

Pandas | 数据统计

前言 本次我们介绍Pandas数据统计函数,如针对数值类型统计(获取样本个数、平均值、标准差、极值等);针对非数值类型统计(获取每个类型个数)以及计算相关系数和协方差。 本文框架 0....导入Pandas 1. 读取数据与数据预处理 2. 汇总类统计 3. 获取唯一值与按值计数 4. 相关系数与协方差 0. 导入Pandas import pandas as pd 1....优 1 -------------------------------------------------------------------------------- # 替换掉温度后缀...℃,便于后续按数值计算 # 先将数据转化成字符串,再将"℃"替换为空,最后再转化为数值 data["bWendu"] = data["bWendu"].str.replace("℃", "").astype...相关系数与协方差 相关系数(corr):检查两个变量之间变化趋势方向以及程度,值范围-1到+1,0表示两个变量不相关,正值表示正相关,负值表示负相关,值越大相关性越强。

72910
领券