当一个组有多个观测值时，组“加权”滚动平均值，同时排除自己的组值_当组的观测值不足时，按组评估滚动平均值 - 腾讯云开发者社区

您找到你想要的搜索结果了吗？

是的

没有找到

Stata中的治疗效果：RA：回归调整、 IPW：逆概率加权、 IPWRA、 AIPW

多类别问题的绩效衡量：F1-score 和广义AUC

对于分类问题，通常根据与分类器关联的混淆矩阵来定义分类器性能。根据混淆矩阵，可以计算灵敏度（召回率），特异性和精度。

数据的描述性统计与python实现

mpl.rcParams['font.sans-serif'] = ['SimHei'] # 指定默认字体

中心极限定理通俗介绍

中心极限定理是统计学中比较重要的一个定理。本文将通过实际模拟数据的形式，形象地展示中心极限定理是什么，是如何发挥作用的。

Python用 PyMC3 贝叶斯推理案例研究：抛硬币和保险索赔发生结果可视化

在这里，我们将帮助客户将 PyMC3 用于两个贝叶斯推理案例研究：抛硬币和保险索赔发生。

Python用 PyMC3 贝叶斯推理案例研究：抛硬币和保险索赔发生结果可视化

在这里，我们将帮助客户将 PyMC3 用于两个贝叶斯推理案例研究：抛硬币和保险索赔发生（点击文末“阅读原文”获取完整代码数据）。

你不知道的 - “平均值”

今天和大家聊聊统计学里最基础的“平均值”，可能很多同学一听到平均值，就开始想，这个有什么好讲的，小学生都知道平均值是什么。今天我们就和你聊聊你不知道的平均值。

Pandas 和 Numpy 中的统计

np.max() / np.min() / np.ptp()：返回一个数组中最大值/最小值/极差（最大值减最小值）

【MIG专项测试组】如何准确评测Android应用的流畅度？

叶方正，2008年加入腾讯，就职于无线研发部【专项测试组】。曾经负责多个产品的性能优化工作，积累大量的移动终端平台优化以及评测经验。怎样获取SM值？前文我们分析了通过测量应用的帧率FPS并不能准确评价App的流畅度（如何量化Android应用的“卡”？流畅度原理&定义篇），FPS较低并不能代表当前App在UI上界面不流畅，而1s内VSync这个Loop运行了多少次更加能说明当前App的流畅程度。那么我们可以直接在App代码中通过Choreographer的回调FrameCallback来计算Loo

R语言中的多类别问题的绩效衡量：F1-score 和广义AUC

对于分类问题，通常根据与分类器关联的混淆矩阵来定义分类器性能。根据混淆矩阵，可以计算灵敏度（召回率），特异性和精度。

优化算法之指数移动加权平均

从没有白费的努力，也没有碰巧的成功。只要认真对待生活，终有一天，你的每一份努力，都将绚烂成花。

统计学如何用少量数据概括数据（相关概念)

用少量数据来概括大量数字是日常生活中常见的。那么可以用少量所谓汇总统计量或概括统计量(summary statistic)来描述定量变量的数据。任何样本的函数，只要不包含总体的未知参数，都称为统计量(statistic)，那么样本的随机性决定了统计量的随机性。

测试时间序列的40个问题

时间序列预测与建模在数据分析中起着重要的作用。时间序列分析是统计学的一个分支，广泛应用于计量经济学和运筹学等领域。这篇技能测试文章是为了测试你对时间序列概念的了解程度。

因果推断文献解析|A Survey on Causal Inference(5)

本系列，我们介绍因果推断的经典综述论文《A Survey on Causal Inference》，上一篇ZZ介绍了本篇综述的第二个因果推断方法：“分层方法“；

生态学建模：增强回归树（BRT）预测短鳍鳗生存分布和影响因素

本文是一个简短的教程，在R中拟合BRT（提升回归树）模型。我们的目标是使BRT（提升回归树）模型应用于生态学数据，并解释结果。

独家 | 115个A/B测试的分析结果︰平均提升为4%，大部分缺乏统计检定力

从115个公开的A/B测试中你能够得到什么信息？通常情况下并不会太多，原因在于大部分情况下，你只能看到有关被测对象的基本数据和A/B测试结果。另一方面，置信区间、p值以及其他针对不确定性的度量则往往被遗忘，而即使有，它们的计算也不尽人意，又或者背后的统计过程没有分享出来，使得它们实际上难以使用。一个数据来源︰GoodUI.org有稍微好一点的方法，在他们网站上发布的每一个测试都附上了基本的统计信息︰用户数量、每个测试变量的转换以及被试对象是什么。

贝叶斯自举法Bayesian Bootstrap

来源：Deephub Imba本文约3800字，建议阅读5分钟本文中我们介绍了贝叶斯自举法，它的关键的想法是，每当我们的估计量以加权估计量表示时，自举过程就等于用多项式权重随机加权。 “自举”（翻译自bootstrap）这个词汇在多个领域可能见到，它字面意思是提着靴子上的带子把自己提起来，这当然是不可能的，在机器学习领域可以理解为原样本自身的数据再抽样得出新的样本及统计量，也有被翻译为自助法的。 Bayesian Bootstrap是一个强大的方法，它比其他的自举法更快，并且可以给出更紧密的置信区间，并

全新池化方法AdaPool | 让ResNet、DenseNet、ResNeXt等在所有下游任务轻松涨点

池化方法将空间输入采样到更低的分辨率。目标是通过捕捉最重要的信息和保留结构方面，如对比度和纹理，最大限度地减少信息的损失。池化操作在图像和视频处理方法中是必不可少的，包括那些基于卷积神经网络的方法。在cnn中，池化操作有助于减少计算负担，同时增加较深部分卷积的感受野。池化实际上就是所有流行的CNN架构中的一个关键组件，它们具有较低的计算和内存开销。

R语言KMEANS均值聚类和层次聚类：亚洲国家地区生活幸福质量异同可视化分析和选择最佳聚类数

《世界幸福报告》是可持续发展解决方案网络的年度报告，该报告使用盖洛普世界民意调查的调查结果研究了150多个国家/地区的生活质量。报告的重点是幸福的社交环境。在本项目中，我将使用世界幸福报告中的数据来探索亚洲22个国家或地区，并通过查看每个国家的阶梯得分，社会支持，健康的期望寿命，自由选择生活，慷慨，对腐败的看法以及人均GDP，来探索亚洲22个国家的相似和不同之处。我将使用两种聚类方法，即k均值和层次聚类，以及轮廓分析来验证每种聚类方法。

KMEANS均值聚类和层次聚类：亚洲国家地区生活幸福质量异同可视化分析和选择最佳聚类数

生态学建模：增强回归树（BRT）预测短鳍鳗生存分布和影响因素|附代码数据

在本文中，在R中拟合BRT（提升回归树）模型。我们的目标是使BRT（提升回归树）模型应用于生态学数据，并解释结果。（点击文末“阅读原文”获取完整代码数据******** ）

生态学建模：增强回归树（BRT）预测短鳍鳗生存分布和影响因素|附代码数据

最近我们被客户要求撰写关于增强回归树的研究报告，包括一些图形和统计输出。在本文中，在R中拟合BRT（提升回归树）模型。我们的目标是使BRT（提升回归树）模型应用于生态学数据，并解释结果。

生态学建模：增强回归树（BRT）预测短鳍鳗生存分布和影响因素|附代码数据

在本文中，在R中拟合BRT（提升回归树）模型。我们的目标是使BRT（提升回归树）模型应用于生态学数据，并解释结果。

生态学建模：增强回归树（BRT）预测短鳍鳗生存分布和影响因素|附代码数据

最近我们被客户要求撰写关于增强回归树（BRT）的研究报告，包括一些图形和统计输出。

MySQL（五）汇总和分组数据

工作中经常需要汇总数据而不是将它们全部检索出来（实际数据本身：返回实际数据是对时间和处理资源的浪费），这种类型的检索有以下特点：

【时间序列】时序预测竞赛之异常检测算法综述

本文将介绍在时间序列预测相关问题中常见的异常检测算法，可以很大程度上帮助改善最终预测效果。

时序预测竞赛之异常检测算法综述

本文将介绍在时间序列预测相关问题中常见的异常检测算法，可以很大程度上帮助改善最终预测效果。

一文讲解Python时间序列数据的预处理

时间序列数据随处可见，要进行时间序列分析，我们必须先对数据进行预处理。时间序列预处理技术对数据建模的准确性有重大影响。

时间序列数据的预处理

来源：Deephub Imba本文约2600字，建议阅读5分钟在本文中，我们将看到在深入研究数据建模部分之前应执行的常见时间序列预处理步骤和与时间序列数据相关的常见问题。时间序列数据随处可见，要进行时间序列分析，我们必须先对数据进行预处理。时间序列预处理技术对数据建模的准确性有重大影响。在本文中，我们将主要讨论以下几点：时间序列数据的定义及其重要性。时间序列数据的预处理步骤。构建时间序列数据，查找缺失值，对特征进行去噪，并查找数据集中存在的异常值。首先，让我们先了解时间序列的定义：时间序列是在

KMEANS均值聚类和层次聚类：亚洲国家地区生活幸福质量异同可视化分析和选择最佳聚类数|附代码数据

贝叶斯自举法Bayesian Bootstrap

“自举”（翻译自bootstrap）这个词汇在多个领域可能见到，它字面意思是提着靴子上的带子把自己提起来，这当然是不可能的，在机器学习领域可以理解为原样本自身的数据再抽样得出新的样本及统计量，也有被翻译为自助法的。

生态学建模：增强回归树（BRT）预测短鳍鳗生存分布和影响因素|附代码数据

在本文中，在R中拟合BRT（提升回归树）模型。我们的目标是使BRT（提升回归树）模型应用于生态学数据，并解释结果。

生态学建模：增强回归树（BRT）预测短鳍鳗生存分布和影响因素|附代码数据

最近我们被客户要求撰写关于增强回归树（BRT）的研究报告，包括一些图形和统计输出。

软件测试|Python科学计算神器numpy教程（十二）

NumPy是Python中用于科学计算的一个强大的库，其中包含了丰富的数学和统计函数。这些统计函数允许用户对数组进行各种统计计算，例如平均值、标准差、方差、最大值、最小值等。在本文中，我们将详细介绍NumPy中一些常用的统计函数及其用法。

ArcGIS空间分析笔记（汤国安）

2.在ArcCatalog 目录树中，右键单击载入数据库的要素类或表，选择加载——加载数据，打开简单数据加载程序向导。

技能 | 基于树的建模-完整教程(R & Python)

简介: 基于树的学习算法被认为是最好的方法之一，主要用于监测学习方法。基于树的方法支持具有高精度、高稳定性和易用性解释的预测模型。不同于线性模型，它们映射非线性关系相当不错。他们善于解决手头的任何问题（分类或回归）。决策树方法，随机森林，梯度增加被广泛用于各种数据科学问题。因此，对于每一个分析师(新鲜)，重要的是要学习这些算法和用于建模。决策树、随机森林、梯度增加等方法被广泛用于各种数据科学问题。因此，对于每一个分析师(包括新人)，学习这些算法并用于建模是非常重要的。本教程是旨在帮助初学者从头学习基于

基于树的预测模型-完整教程

基于树的学习算法被认为是最好的方法之一，主要用于监测学习方法。基于树的方法支持具有高精度、高稳定性和易用性解释的预测模型。不同于线性模型，它们映射非线性关系相当不错。他们善于解决手头的任何问题（分类或回归）。决策树方法,随机森林,梯度增加被广泛用于各种数据科学问题。因此,对于每一个分析师(新鲜),重要的是要学习这些算法和用于建模。决策树、随机森林、梯度增加等方法被广泛用于各种数据科学问题。因此,对于每一个分析师(包括新人)，学习这些算法并用于建模是非常重要的。本教程是旨在帮助初学者从头学习基于树

干货：基于树的建模-完整教程(R & Python)

来源：“数盟社区” 原文链接：http://dataunion.org/23697.html 简介基于树的学习算法被认为是最好的方法之一，主要用于监测学习方法。基于树的方法支持具有高精度、高稳定性和易用性解释的预测模型。不同于线性模型，它们映射非线性关系相当不错。他们善于解决手头的任何问题（分类或回归）。决策树、随机森林、梯度增加等方法被广泛用于各种数据科学问题。因此,对于每一个分析师(包括新人)，学习这些算法并用于建模是非常重要的。本教程是旨在帮助初学者从头学习基于树的建模。在成功完成本教程之后,

图像处理常用插值方法总结

在做数字图像处理时，经常会碰到小数象素坐标的取值问题，这时就需要依据邻近象素的值来对该坐标进行插值。比如：做地图投影转换，对目标图像的一个象素进行坐标变换到源图像上对应的点时，变换出来的对应的坐标是一个小数，再比如做图像的几何校正，也会碰到同样的问题。以下是对常用的三种数字图像插值方法进行介绍。 1、最邻近元法　　这是最简单的一种插值方法，不需要计算，在待求象素的四邻象素中，将距离待求象素最近的邻象素灰度赋给待求象素。设i+u, j+v(i, j为正整数， u, v为大于零小于1的小数，下同)为待求象素坐

010

测试数据科学家聚类技术的40个问题（能力测验和答案）（下）

【AI100 导读】本次测试的重点主要集中在概念、聚类基本原理以及各种技术的实践知识等方面。本文为下部，包括21-40题。上部请查看：测试数据科学家聚类技术的40个问题（能力测验和答案）（上） Q

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐