腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
计算
按
dataframe
R
中
的
另一个
变量
分组
的
最大
连续
重复
非
NA
值
r
、
dplyr
、
count
、
rle
我想确定每个ADM2_PCODE
的
连续
重复
非
NA
Valor
值
的
最大
计数。因此,我们
的
想法是
按
ADM2_PCODE
分组
,过滤掉
NA
值
,为每个Valor
值
计算
连续
事例
的
最高计数,并选择它们之间
的
最大
出现次数。,
NA
, 30, 30, <em
浏览 26
提问于2021-07-29
得票数 0
回答已采纳
1
回答
Revo,Scale
R
,rxCube和其他开源并行软件包?
r
、
parallel-processing
、
revolution-r
它有两列,my_id和my_rand
变量
。该数据帧有大约600万个唯一
的
my_id。我需要用my_rank (
按
my_id
分组
)
计算
平均值。avg_rank_by_id<-aggregate(
dataframe
1["my_rank"],by=
dataframe
1["my_id"], mean,
na
.rm=TRUE) 有没有办法运行Revo我是
R
的
新手,除了Revo之外,
浏览 4
提问于2015-07-06
得票数 0
2
回答
dplyr:如何在
分组
变量
中
忽略
NA
r
、
dplyr
、
grouping
、
na
使用dplyr,我尝试
按
两个
变量
进行
分组
。现在,如果一个
变量
中有
NA
,但
另一个
变量
匹配,我仍然希望看到这些行被
分组
,
NA
取
非
NA
值
的
值
。所以如果我有一个像这样
的
数据框: variable_A <- c("a", "a", "b",
NA
, &qu
浏览 1
提问于2018-06-29
得票数 1
2
回答
在
R
中
按
行获得
重复
的
连续
值
的
摘要
r
、
apply
、
na
、
summary
我试图在
R
中
逐行获得
重复
值
的
一些统计数据(最小、
最大
、平均)。我
的
dataframe
看起来类似于以下内容: c(3,
NA
,
NA
,4,5,
NA
,7,6,
NA
,7,
NA
,8,9,
NA
,
NA
,4,6,
NA
,
N
浏览 0
提问于2018-05-04
得票数 1
回答已采纳
3
回答
从:
按
列
计算
非
NA
值
,
按
其中一列
分组
r
、
dataframe
我保证有更简单
的
方法来完成我
的
目标。我需要
计算
数据帧
的
非
NA
值
,
按
所述数据帧
中
的
一列
分组
。*这是我关于堆叠溢出
的
第一个问题,请耐心点。')litmus <- data.frame(grouping, column1, column2, co
浏览 2
提问于2018-07-05
得票数 2
回答已采纳
1
回答
如何根据每个行
中
某些
变量
的
单个平均值创建一个新
变量
?
r
我有以下数据:我想在
R
中
做以下几点:预期产出(
R
):以下是我尝试过
的
工作: 我尝试创建一个for循环,循环遍历每一行,以计数
非
空白
变
浏览 2
提问于2020-08-12
得票数 0
回答已采纳
1
回答
消除数据集中
的
特定行
r
我有一个.csv格式
的
数据帧。该数据帧包括34500行。在此文件
中
,显示了RNAseq分析结果
的
列表。这里
的
问题是一些基因有多个结果,我应该为每个基因选择一个条目,这个条目应该具有
最大
的
p
值
。我编辑了我
的
数据,我只有“基因符号”和“p
值
”信息。提前谢谢。
浏览 6
提问于2019-08-05
得票数 1
回答已采纳
2
回答
同一组
非
连续
记录行间
的
data.table差异
r
、
data.table
、
run-length-encoding
我需要
计算
变量
的
非
连续
记录之间
的
差异,
按
另一个
变量
分组
。也就是说,我希望在运行
中
获取
变量
的
最后一个
值
,并从下一次运行
中
的
第一个
值
中
减去它(如果有)。我知道我可以使用rleid和shift来
计算
连续
行
中
的
差
浏览 3
提问于2017-08-31
得票数 0
回答已采纳
2
回答
R
如何在group_by之后仅替换列
中
连续
的
重复
值
r
、
group-by
、
duplicates
在下面的两列数据框
中
,我们如何通过
按
第一列
分组
来仅替换第二列
中
连续
重复
的
值
df <- data.frame(A = c( 1, 1, 1, 2, 2, 3, 3, 3, 3, 3), B = c(100,100,200,100,200,200,200,300,300,200)) 对于组3,它将是200,
NA
, 300,
NA
, 200
浏览 30
提问于2020-11-07
得票数 0
回答已采纳
2
回答
熊猫:如何删除
重复
行,但保留所有行
的
最大
值
python
、
python-3.x
、
pandas
、
dataframe
、
pandas-groupby
如何删除
重复
行,但保留
最大
值
的
所有行。例如,我有一个4行
的
dataframe
: data = [{'a': 1, 'b': 2, 'c': 3},{'a': 7, 'b': 10, 'c': 2}, {'a': 7, 'b': 2, 'c': 20}, {'a': 7, 'b
浏览 0
提问于2018-11-02
得票数 4
回答已采纳
2
回答
将具有相同列
值
的
连续
行组合起来
python
、
pandas
我有一个像这样
的
东西。
浏览 2
提问于2014-08-06
得票数 12
1
回答
Pandas
Dataframe
中
的
列
分组
python
、
pandas
、
dataframe
如果有人能帮我解决我遇到
的
熊猫数据问题,我将不胜感激。
重复
列
Dataframe
------------------01-01 | | 1 | 7 | 1 | | ---------
浏览 0
提问于2017-02-22
得票数 2
回答已采纳
1
回答
地址范围
的
最小、
最大
和步长
python
、
pandas
、
range
、
sequence
、
street-address
我有一个包含16,000个地址
的
Pandas
Dataframe
,它们
按
街道和城市
分组
在一起。我需要找出地址
连续
范围之间
的
最小
值
、
最大
值
和步长。 例如,10号,12号,14号,16号大街。最小为10,
最大
为16,步长为2。 问题是范围并不总是那么简单,有些不是真正
的
地址范围,而是沿街分布
的
地址。 例如,大街4456,5567,6678。我希望能够识别
连续
的
浏览 27
提问于2020-11-04
得票数 0
回答已采纳
1
回答
使用小于2个
非
NA
值
的
svy分位数()
r
、
error-handling
、
survey
我试图
计算
由
另一个
变量
分组
的
一个(或多个)
变量
的
中值。我用
的
是svyby。问题是某些组
的
值
可以小于2个
非
NA
值
。我使用这个函数将
NA
返回到小于2个
非
NA
值
的
组,但它不起作用:exemplo <- data.frame(ID = 1:10
浏览 4
提问于2014-09-17
得票数 1
回答已采纳
1
回答
时间序列缺失
值
估算:如何在
na
_kalman中使用
最大
间隙?
r
、
interpolation
、
missing-data
、
imputation
、
imputets
因为我只是在寻找一种方法,以避免对时间序列
计算
中
的
前导零点进行缺失
值
估算。由于前导零通常是时间序列
中
丢失
值
的
最长序列,如果您使用全局模型预测面板数据,我希望使用maxgap参数来控制这些影响。
最大
间隙参数将
连续
NA
的
最大
值
设置为在估算过程
中
仍要替换
的
最大
值
。 但是,如果我想避免替换任何大于1<
浏览 5
提问于2021-12-08
得票数 0
回答已采纳
1
回答
如何通过条件突变添加新列,但保留原始数据?
r
、
dataframe
、
dplyr
、
count
、
mutate
我有一个包含500+行、50+列/
变量
的
大型
dataframe
(df),但只想以特定
变量
为目标。我想在原始
的
大型
dataframe
(df)
中
添加一个新
的
count列,其中包含任何
非
NA
值
的
行和,特别是"targ_vars“
中
那些选择
变量
的
行和。同样,我并不试图在每个
变量
中</em
浏览 1
提问于2022-12-01
得票数 0
回答已采纳
3
回答
R
群,计数
非
NA
值
r
、
na
我有一个有
NA
散射
的
数据# Y X1 X2 Label# 3
NA
2 B# 2
NA
6 B# Label Y X1 X2# B
浏览 6
提问于2016-12-14
得票数 9
回答已采纳
1
回答
如何在Python中将某些列
值
组合在一起,并使另一列
中
的
值
成为组合
的
值
的
手段?
pandas
、
dataframe
、
pandas-groupby
我有一个Panda
dataframe
,其中一列是一个数字序列(‘sequence’),其中许多数字
重复
,而其他列
值
(‘binary variable')要么是1,要么是0。我已经
按
sequences列
中
相同
的
值
进行了
分组
,并将binary
变量
中
的
列
值
设置为该组中非零条目的百分比。所以我
的
数据框看起来像这样: df =pd.
DataFrame</
浏览 18
提问于2020-09-20
得票数 0
3
回答
如果
变量
有
重复
值
,则从
dataframe
中
删除组。
r
、
dataframe
、
dplyr
我想问一下,是否有一种方法可以使用dplyr (或anz在该问题上
的
其他方式)从
dataframe
中
删除一个组,其方式如下。假设我有一个
按
变量
1
分组
的
以下形式
的
dataframe
:1 a2我只想删除
变量
2
中
有两个
连续
的
相同
值
的
浏览 0
提问于2018-05-10
得票数 0
回答已采纳
3
回答
在
R
中
查找每组
的
累积
最大
秒数
r
我有一个数据集,我想在其中创建一个新
变量
,该
变量
是
另一个
变量
的
累积第二大
值
,并且我希望
按
组执行此函数。,cum2ndmax,它是var1
的
累积第二大
值
,我想
按
患者#对此
变量
进行
分组
,并访问#。我想出了如何
计算
累积
的
第二个
最大
值
,如下所示: df1$cum2ndmax <- sapply(seq_along
浏览 41
提问于2020-10-26
得票数 4
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
快速掌握R语言中类SQL数据库操作技巧
每天读一本:利用Python进行数据分析
pandas.dataframe 专题使用指南
Python Pandas模块数据统计与分析常用方法
向右操作符及其相关函数的基本用法
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券