腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9128)
视频
沙龙
1
回答
测试和训练良好
的
实践wrt摘要功能
data-science
、
cross-validation
当数据集
的
一个特征是整个数据池
的
汇总
统计数据时,将训练数据包括在测试数据中以
计算
用于验证
的
特征是一种良好
的
实践吗? 例如,假设我有1000个数据点,分为800个训练条目和200个用于验证
的
条目。我用800个条目创建了一个特征,用于训练等级
四分
位数
(也可以是任何东西),它
的
数字为0-3,即其他特征所在
的
四分
位数
。因此,在训练集中,每个
四分
位
浏览 15
提问于2020-02-13
得票数 0
回答已采纳
3
回答
如何用Python
计算
四分
位数
范围?
python
、
statistics
、
median
、
percentile
、
wolframalpha
我有一个数字列表[1, 2, 3, 4, 5, 6, 7],我希望有一个函数来返回这个数字列表
的
四分
位数
范围。
四分
位数
区间是上
四分
位数
与
下
四分
位数
之间
的
差。我尝试使用NumPy函数和Wolfram
计算
四分
位数
范围。我发现所有的答案,从我
的
手册,到NumPy
的
答案,到Wolfram,都是
不同
<e
浏览 3
提问于2014-12-14
得票数 8
回答已采纳
1
回答
基R
汇总
()和概要工具descr()函数结果之间
的
奇数差异
r
、
statistics
、
package
、
summarytools
让我们将向量存储为x,当我运行
汇总
(X)和descr(x)时,在概要工具包中,我对最小值、中值值、均值值和最大值达成一致。然而,我
的
第一和第三
四分
位数
不同
。这是我第一次看到这两个函数结果之间
的
差异。对于
为什么
和如何发生这种情况,有什么想法吗? 我已经开始研究descr()源代码,但是我还没有取得多大进展,也没有能够访问
汇总
()源代码来查看其中是否存在差异。然而,当我看一些累积百分比时,我认为它们在
计算
分
位数
的
浏览 1
提问于2019-06-13
得票数 1
回答已采纳
1
回答
使用ggplot2(盒图)
的
高效方法&一个“反应性”子集函数
r
、
ggplot2
、
google-visualization
、
plyr
、
shiny
数据集是静态
的
,因此我查看以下解决方案: 但是,当我试图
计算
材料组合图时遇到了问题,因为有100多个材料,
计算
各种材料(数据<-
汇总
(数据))
的
四分
位数
范围,然后创建一个矩阵来存储每个材料
的
汇总
数据
的
行号(最小、中、最大、
浏览 4
提问于2013-11-16
得票数 2
回答已采纳
1
回答
Stata中属于分
位数
的
代码观察
stata
在Stata中,我希望能够根据特定
的
变量将观察结果放入桶中,或者将观察结果等效为属于某个分
位数
的
代码。我四处寻找一些能够完成这项任务
的
现有代码,但没有完全找到我想要
的
。我写了以下简单
的
文章: version 13 local= `n'-`i' if `varlist' > `x' drop
浏览 4
提问于2014-09-24
得票数 0
回答已采纳
1
回答
R
汇总
函数
r
、
iqr
我正在遵循KhanAcademy.com
的
一个关于箱形图
的
例子。Max. KA
的
Sal表示,有两种方法可以获得
四分
位数
,区别在于在
计算
第一个和第三个
四分
位数
时,是否有一个因素在中
位数
中有没有办法告诉
汇总
函数,在
计算
其他
四分
位数
时,您想要排除中
位数
。 如
浏览 4
提问于2014-09-29
得票数 1
1
回答
每列底部
的
计算
excel
、
rows
、
calculation
我在这些列
的
底部(第15、16、17行)
计算
每列
的
中
位数
和
四分
位数
。但是,我希望能够在不更改中
位数
/
四分
位数
公式
的
范围
的
情况下,继续向列中添加新值。我知道,如果我将公式放在
与
正在进行
计算
的
列
不同
的
单元格中,则可以在公式中选择整个列。 我想知道是否有一种方法可以从我
的
计算</e
浏览 0
提问于2017-09-29
得票数 1
1
回答
具有可变数组条件
的
Excel
四分
位函数(如countif)
arrays
、
excel
、
variables
、
quartile
我在一列中有数据,但我想限制从该列中使用
的
数据。 我在A栏中有工作部门,在B栏中有人
的
薪水(在其他栏中有其他数据,例如姓名)。我想使用我
的
一个主数据列表(大约2000行)来挑选出我拥有的大约10个部门
的
四分
位数
,但我不想必须创建10个特定
的
列表来
计算
每个部门
的
四分
位数
。是否有使用countif或类似函数
的
选项,以便我可以拥有10个部门
的
下拉列表,并根据我选择<em
浏览 31
提问于2016-09-01
得票数 0
1
回答
为什么
汇总
的
四分
位数
与
手动
计算
的
四分
位数
不同
?
r
为什么
我在R中
计算
数据集
的
四分
位数
时会得到一个
不同
的
值?这些值是
不同
的
x <- c(66,72,79,84,102,110,123,144,162,169,414) lowerQ <- median(c(66,72,79,84,102)) ; lowerQ
浏览 53
提问于2019-03-15
得票数 1
回答已采纳
2
回答
用R中
的
ggplot2根据盒子大小重新排序盒形图
r
、
ggplot2
我使用盒图来显示5个
不同
数据集之间
的
分布情况。我要找
的
是根据第一个
四分
位数
和第三个
四分
位数
之间
的
差异来排列它们。显然,我不想通过重新排序级别来
手动
安排它们。 我已经使用tidyverse group_by修复了这个问题,并总结和
计算
了所需
四分
位数
之间
的
差异,并使用它来排列方框。如果有人需要密码或者有更好<
浏览 0
提问于2019-01-16
得票数 0
回答已采纳
1
回答
将
汇总
统计信息列表删除为R中
的
数据
r
、
r-raster
我提取了38个
不同
多边形
的
栅格像素
的
汇总
统计数据(min,1
四分
位数
,平均值等),如下图所示。(每个元素代表一个多边形),其中包含
汇总
统计信息。我想要一个数据,38行代表38个多边形,列是最小,1
四分
位数
,平均值等等。我怎么做呢?我试过以下几种方法但是我得到了一个含有一个颜色
的
数据,其中包含了
汇总
统计数据,即5
浏览 0
提问于2018-03-16
得票数 1
回答已采纳
1
回答
如何快速
计算
数组
的
四分
位数
均值?
ios
、
swift
来自: 中间
四分
位数
(IQM)是一种基于
四分
位数
区间截断均值
的
中心趋势
的
统计度量。IQM非常类似于由评审小组评估
的
体育比赛中使用
的
评分方法:放弃最低和最高
的
分数;
计算
其余分数
的
平均值。在
计算
IQM时,只使用第二和第三
四分
位数
中
的
数据(如在
四分
位数
范围内),丢弃最低25%和最高25%
的
浏览 3
提问于2016-09-02
得票数 1
2
回答
如何使用R ggplot stat_summary绘制中
位数
和
四分
位数
?
r
、
ggplot2
、
statistics
如何将此统计
汇总
图中
的
上下点更改为25%
四分
位数
和75%
四分
位数
?
浏览 3
提问于2016-12-10
得票数 9
2
回答
如何为属于最高
四分
位数
的
观测生成累积变量
stata
我有4个变量 我想要创建一个变量(new_var),它是一个
汇总
数,等于我观察到
的
每一个变量
的
最高
四分
位数
。例如,如果您在上面的变量中有一个(而且只有一个)在最高
四分
位数
中得分,您在new_var中
的
值将是一个。如果你在两个变量中得分最高
的
四分
位数
(我不在乎第二和第五是第一和第二),那么在new_var中你
的
分数将是2,依此类推。有几
浏览 9
提问于2016-06-02
得票数 0
回答已采纳
1
回答
在谷歌单张中只识别异常值
的
功能是什么?
google-sheets
我知道TRIMMEAN函数可以帮助将异常值自动排除在平均值之外,但是是否有一个只会识别哪些数据点是真正
的
离群点呢?我
的
工作是在经典定义
的
离群值为3 SD,远离平均值,在25%
的
底部和25%
的
数据。我需要这样做,以验证我
的
R代码确实正在删除真正
的
异常值,因为我们正在为我们
的
研究目的在我
的
实验室中定义它们。对于识别和移除异常值
的
工作,r可能很奇怪,而且由于我们
的
数据是混合
的
(我们有按因
浏览 3
提问于2021-04-12
得票数 0
回答已采纳
1
回答
如何自定义R Leaflet中
的
图例标签
r
、
shiny
、
leaflet
我有一个R脚本,使一个闪亮
的
应用程序
与
传单地图。地图包括一个基于
四分
位数
计算
的
图例。图例显示了每个
四分
位数
的
范围,但我想让它显示“第一个
四分
位数
”、“第二个
四分
位数
”等。
浏览 2
提问于2017-11-21
得票数 4
1
回答
创建一个
四分
位数
列,使用每个观测值
的
平均值,而不是行值。
r
、
dataframe
、
grouping
、
quartile
我有面板数据时间序列,我想用给定变量平均值
的
四分
位数
来创建一个变量,这样一个公司只能在给定
的
四分
位数
中找到。3 2015 20 3 3 4 2015 40 4 4
浏览 0
提问于2017-08-31
得票数 0
回答已采纳
1
回答
警告:在用
四分
位范围字符替换数字列表中
的
数字时,强制引入NAs。
r
0.0488、-0.1711、0.1053、0.1202、0.0715、0.1258、-0.01910.0946,0.0607 ,0.0826,0.0613,-0.0113) Q1命令:没有错误?向量似乎在任何地方都不包含N
浏览 5
提问于2014-09-11
得票数 0
回答已采纳
1
回答
R中分
位数
的
定义
r
、
quantile
主要问题:假设您有一个离散
的
有限数据集$d$。然后命令摘要(D)返回Min、1
四分
位数
、中
位数
、平均值、第3
四分
位数
和最大值。我
的
问题是:R用来
计算
第一个
四分
位数
的
公式是什么?背景:我
的
数据集是:d=c(1,2,3,3,4,9)。summary(d)作为第一个
四分
位数
返回2.25。现在,
计算
第一个
四分
位
浏览 2
提问于2015-01-08
得票数 8
回答已采纳
1
回答
使用cut作为R中函数
的
一部分来
计算
五分
位数
r
、
function
、
quantile
我被要求在R中使用"cut“为数据库nhefs中
的
变量wt71创建
四分
位数
。下面是我
的
代码:cut(x, breaks =c(quantile(nhefs$wt71,probs=seq(0,1, by=0.25}head(mean_weights)下面是我
的
输出:
浏览 0
提问于2020-01-24
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
数据信息汇总的7种基本技术总结
《数据挖掘:概念与技术》笔记
教程:Origin绘制Box-plot箱线图
学以致用:单变量数据描述——利用Excel解决统计学问题|郝乐琪、叶欣欣、夏涛
使用OmicsTools电脑软件零代码绘制各种类型的箱式图
热门
标签
更多标签
活动推荐
运营活动
广告
关闭
领券