腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
在
SQL
中
计算
分组
数据
的
LQ
、
UQ
和
IQR
、
、
、
我正在努力弄清楚如何在
SQL
中
获得
分组
数据
的
上/下四分位数
和
IQR
。假设我有一些类似于下面的
数据
: ID Data 1 37 1 1 1 77 2 15 3 12 3 54 3 10 我希望能够从每个ID
的
数据
列
中
获得
LQ
浏览 64
提问于2021-08-26
得票数 0
回答已采纳
1
回答
一种消除阵列中极端离群点
的
算法
、
我有一个数组,用于D3图中
的
x轴,它会爆炸,因为图表
的
大小对于数组
的
大小来说太小了。我看了一下
数据
,
数据
中有极端
的
离群值。见下图。
数据
在
0左右(不是完全为零,而是0.00972等等)。
数据
开始变得有趣
的
大约70,然后巨大
的
峰值约100。
数据
然后继续,然后
在
另一边类似的事情,大约200。 有人能帮我解决一些离群点
的
问题吗?例如,给我95%或
浏览 4
提问于2014-03-26
得票数 6
回答已采纳
2
回答
用data.table实现
分组
操作
的
性能
、
首先,我将描述我正在执行
的
任务。我必须反复
计算
一个
分组
和
,通常在5到10倍之间。
在
每次迭代时,执行
分组
和
的
列
中
的
值都会随着每次迭代而改变,但我所
分组
的
列不会。下面是一个示例表,其中w、x
和
y共同构成
分组
,z是值将被求和
的
列。然而,据我所知,
在
data.table
中
没有一种方法能够提供比这更好<
浏览 11
提问于2022-04-22
得票数 6
回答已采纳
1
回答
评估大小data.table比data.frame快
的
大小
、
有人能帮我评估使用data.table
的
数据
帧
的
大小对搜索速度更快吗?
在
我
的
用例
中
,
数据
帧将是24,000行
和
560,000行。40行
的
块总是被挑出来供进一步使用。示例: DF是一个
数据
框架,有120行,7列(x1到x7);"string“占据x1
的
前40行。 DF2是DF => 12万行
的
1000倍。对于DF data.table
的
大小比较慢,对
浏览 1
提问于2013-11-24
得票数 13
回答已采纳
1
回答
从
分组
数据
中
删除异常值
、
我有一个
数据
框架如下:A 70B 75B 50C 60#Summary before removing outliers summaryBy(Value ~ ID, data = df, FUN
浏览 1
提问于2016-04-26
得票数 0
回答已采纳
1
回答
根据特定于每个列
和
阈值( R)
的
几个列
和
阈值进行筛选
、
我有一份有600栏
的
数据
。我希望根据变量对
数据
进行
分组
,并根据每个列
和
组
的
特定阈值对这些“感兴趣
的
列”(通常是列总数
的
一小部分)
的
n进行筛选。 我已经开始用dplyr做这个了。这将
计算
我
的
阈值(每组
和
每列),并将它们放入名为Petal.Length_threshold
和
Petal.Width_threshold
的
新列
中
。[2])
浏览 0
提问于2018-10-05
得票数 1
回答已采纳
1
回答
如何合并
分组
聚合
的
df?
我对每个帐号
的
事务进行了
分组
和
聚合(以
计算
每月
的
统计量),现在我想将输出与帐号上
的
另一个
数据
帧合并。但是,帐号不再位于索引/列
中
。按账户
和
月度对交易进行
分组
,并执行汇总
计算
df1 = df.groupby(['AcctNr','Month']).sum().groupby(level=0).agg({'Amount':
浏览 0
提问于2019-05-29
得票数 0
1
回答
在
data.table中使用分位函数
、
、
我试图
计算
data.table
中
某些值
的
平均值。平均值应该在没有异常值
的
情况下
计算
,这意味着我必须先过滤
数据
。为了
在
我
的
数据
中
定义异常值,我使用了“默认框图”方法。(test$x)[1] -6113.136test <
浏览 2
提问于2015-08-05
得票数 2
回答已采纳
1
回答
基因组覆盖作为滑动窗口
、
、
我使用bwa mem算法将读取映射到程序集,并使用samtools depth提取每个基
的
读取数(= samtools depth)。(因为它是多个contig文件,这个ID会更改)-位置(基本)-映射
的
读取数(覆盖率)。现在,我想
计算
滑动窗口中
的
覆盖率(第三列);窗口大小为3,幻灯片为2,作为平均每个连体(第一列)。1091900001
浏览 2
提问于2018-02-10
得票数 1
回答已采纳
2
回答
将RSQLite查询结果保存到csv
中
,而不将其读入R
中
、
、
我正在使用一个大型SQLite
数据
库,并且使用RSQLite
和
Rstudio同时运行许多不同
的
查询。很多时候,查询
的
结果相当大,我不想浪费资源,将它们读入R,然后将它们保存到CSV。我更愿意让
数据
库本身来管理这个问题。然而,这是行不通
的
,我不知道还能尝试什么。<- dbConnect(RSQLite::SQLite(), "test.sqlite") dbListTables(
浏览 5
提问于2020-11-02
得票数 4
回答已采纳
2
回答
透明度较高
的
钻石
的
平均透明度价格较低
、
我一直
在
努力弄明白,为什么我得到
的
钻石平均价格更低,透明度更高?透明度更高
的
钻石不是更贵吗?有人能从基础
数据
科学
的
层面向我解释一下吗? summarise( mean = mean(price),
uq
= quantile(price, 0.75)
浏览 1
提问于2018-05-27
得票数 1
回答已采纳
1
回答
如何提取前n行,并使用子集
计算
每个组函数,然后
计算
不同组
的
平均值?
、
,其中函数
的
输出依赖于子集
的
数据
帧。然后,我想用一个不同
的
分组
变量对结果data.table进行
分组
,并取一个简单
的
均值。 我是否要先在子集
的
行上按group1
计算
函数,然后列出结果,然后按group2
计算
均值?或者我想先rbindlist我
的
整个
数据
,预先选择子集
的
行,然后用group1
计算
我
的
函数,然后再用group2<em
浏览 2
提问于2018-10-23
得票数 5
1
回答
使用
分组
/切割列
计算
geom_boxplot
IQR
、
、
、
我想使用geom_boxplot()
在
我
的
数据
上显示
IQR
。 如果我有一个按
数据
块
计算
stat
分组
变量,我需要用ddply预先
计算
一个包含所有
数据
(
IQR
等)
的
数据
帧。对于每个
数据
块?或者,
在
geom_boxplot()自动显示统计信息之前,我可以使用一些group=指令强制
计算
所有统计信息吗?我
的
数据
浏览 0
提问于2012-12-04
得票数 0
回答已采纳
2
回答
如何编写输入为向量而输出为基于分位数信息
的
字符向量
的
函数
、
、
我正在写一个函数,它
的
输入是向量,输出是三个级别的字符向量:低于Avg,Avg,高于Avg。我希望字符向量是根据给出
的
向量
的
第1
和
第3分位数
计算
出来
的
。当我调用我
的
函数时,只
在
Avg下面返回,这是我理解它为什么返回
的
,但不知道如何修复。理想情况下,我想要一个新
的
向量,使Avg以下
的
值对应于第1分位数以下
的
值,Avg以上
的
值对应于3分位数以上
的
值,
浏览 0
提问于2018-11-21
得票数 0
回答已采纳
1
回答
分类
数据
的
四分位数范围
、
、
、
、
我被要求用
IQR
和
中位数来报告我
的
结果
的
描述性统计
数据
,但是我不知道我怎么能做到!我知道逻辑,但
数据
是连续
的
。 有人能解释如何在分类变量上
计算
吗?
在
R里怎么做呢?
浏览 8
提问于2022-01-19
得票数 0
回答已采纳
3
回答
在
大型
数据
帧上,Group_by
和
变异速度较慢
、
、
、
我正在使用大型(至少800万行) dataframes,并希望根据几个
分组
变量
和
rmultinom进行一些基本
计算
。就我
的
代码而言,完成
计算
至少需要~1秒,这不是问题,但我需要做数千次,所以我真的想加快速度。library(tidyverse) # cre
浏览 0
提问于2018-10-09
得票数 8
2
回答
用*pply替代替换循环
、
我试图通过用tapply ()替换一些查找循环来加速我
的
代码,我偶然发现了这个代码片段: DF<-data.frame(id=c(rep("A", 5),rep("B", 7),rep("C", 9))或者其他加速
的
方法?
浏览 1
提问于2014-03-09
得票数 1
回答已采纳
1
回答
从data.table
和
data.frame对象
中
获取单个元素所需
的
时间
、
、
、
在
我
的
工作
中
,我经常使用几个表(客户详细信息、交易记录等)。由于它们
中
的
一些非常大(数百万行),我最近切换到了data.table包(感谢马修)。但是,它们
中
的
一些非常小(几百行
和
4/5列),并且被多次调用。因此,我开始考虑
在
检索
数据
时
的
[.data.table开销,而不是像?set
中
已经清楚描述
的
那样设置()值,其中,无论表
的
大小如何
浏览 22
提问于2013-06-02
得票数 17
回答已采纳
2
回答
和
或矩阵乘法更快吗?
、
、
、
、
我有一个非常简单
的
问题,是用sum或矩阵乘法来加速
和
一个大向量吗?(X%*%y)rep(1, d)%*%(X%*%y)testSum <- function(d, its){ y <- rnorm(
浏览 3
提问于2015-06-23
得票数 2
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
SQL server在大数据中数据库分析和使用趋势
浅谈:数据分析中Pyhon和SQL的重要性
浅析SQL Server数据库在搅拌站控制系统中的设计与应用
在量子计算中,数据中心或云有什么可期待的?
在计算机视觉系统中应用Unity合成数据的优势
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
对象存储
云直播
活动推荐
运营活动
广告
关闭
领券