腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(6617)
视频
沙龙
1
回答
在
base
R
中有
没有
一种
快速
的
方法来
根据
操作
相关器
对
数据
帧
进行
子集
?(
例如
MPG
>
20
)
r
我相信使用Tidyverse这样
的
包可以更容易地处理这一点。然而,我试图通过简单地使用基数
R
来解决这个问题。为了说明这个问题,我使用了"mtcars“
数据
集。示例:仅针对
MPG
>
20
的
汽车
的
子集
1.)我
的
第一个直觉是尝试以下几点: mtcars[mtcars$
mpg
>
20
] 这并不令人惊讶,它不起作用。2.)其次,我意识到
在
使用以下命令时会得到输出: m
浏览 7
提问于2021-01-12
得票数 0
1
回答
在
R
中映射2个不相关
的
数据
帧
r
、
dataframe
、
dplyr
我需要使用
数据
帧
A中
的
数据
来填充
数据
帧
B中
的
一列。A 36 40 NA5 B 10 24 NA 我想要做
的
是
根据
来自
数据
帧
A
的
数据
填充B中
的
BelongToCount列,最终将
数据
帧<
浏览 21
提问于2020-11-04
得票数 1
2
回答
R
dplyr
对
只知道其字符串名称
的
列
进行
操作
。
r
、
dynamic
、
dplyr
、
quoting
、
rlang
我正在努力编写程序,
在
R
中使用dplyr对
数据
帧
的
列
进行
操作
,这些列只知道它们
的
字符串名。我
的
情况是,我只知道一个
数据
帧
的
列名,只有它
的
字符串名。因此,
在
函数或脚本中调用dplyr时,不能使用非标准
的
计算值,因为通常不能对未引用
的
(即“裸”)列名
进行
硬编码。
在
分析中,使用所使
浏览 3
提问于2017-09-19
得票数 3
回答已采纳
2
回答
从符合特定条件
的
数据
框中提取所有行
r
、
dataframe
我
在
R
中有
一个
数据
框,其中一列包含状态缩写,如'AL','MD‘等。 假设我想提取state = 'AL‘
的
数据
,那么下面的条件dataframe'AL’似乎只返回一行,而这个状态有多行。有人能帮我理解一下这种方法中
的
错误吗?
浏览 20
提问于2020-05-22
得票数 0
回答已采纳
3
回答
pandas使用自定义函数按索引
对
行
进行
排序
python
、
pandas
我经常需要处理
数据
帧
,其中
的
行名(pandas中
的
索引)类似于[a-z][0-9]+类型(
例如
,'a
20
','a21',...或'b1','b11','b2',...)我希望能够仅
根据
数字
对
行
进行
排序。
根据
我
对
该应用程序接口
的
了解,df.sort_index()不接受我可以定义排序函
浏览 1
提问于2018-02-06
得票数 2
1
回答
非常大
的
制表符分隔
的
文本文件
的
列选择
python
、
r
、
large-files
我正在处理一个非常大
的
以制表符分隔(大约20000行* 30000列)
的
.txt形式
的
表,这使得文件大于
20
tab。我检查了桌面的内存,似乎无法直接使用
R
中
的
read.delim或python中
的
pandas来读取该文件。我目前正在考虑基于列
的
过滤器制作表
的
一个小
子集
,新
的
文本文件将是20000行* 1200列。我已经将目标文件
的
列名保存在另一个文件中,我猜我
的
浏览 34
提问于2020-10-19
得票数 0
回答已采纳
4
回答
R
:在
数据
帧
的
子集
上
快速
执行
操作
,然后
在
没有
内部函数
的
情况下重新聚合结果。
r
、
dplyr
我们有一个非常大
的
数据
帧
df,可以被因素分割。在此拆分创建
的
数据
帧
的
每个
子集
上,我们需要执行一项
操作
来增加该
子集
的
行数,直到它是某个length为止。然后,我们对
子集
进行
rbind,以获得更大版本
的
df。 是否有
一种
无需使用内部函数就能
快速
完成此
操作
的
方法?假设我们
的
浏览 0
提问于2016-01-28
得票数 4
2
回答
故障减法
r
数据
帧
r
、
dataframe
、
subset
我正在尝试对
数据
进行
子集
,以便当人员ID发生超过67次时,我
根据
人
的
实例发生
的
位置获取
数据
的
子集
,然后
在
该
子集
上运行一系列
的
回归。我知道如何让每个达到这67个阈值的人(使用table()来获取每个pid
的
计数),但是如何
根据
他们
的
位置不知道位置得到
数据
帧
的
子集</em
浏览 1
提问于2016-04-25
得票数 0
回答已采纳
1
回答
大型
数据
帧
( pyspark)上
的
EMR笔记本会话在数秒内超时(使用pyspark)
python
、
amazon-web-services
、
apache-spark
、
pyspark
、
amazon-emr
我正在尝试
对
pyspark
数据
帧
执行一些
操作
。如果
数据
帧
很小,我使用
的
代码可以很好地对上面的
数据
帧
进行
进一步
的
操作
,
例如
,它可以很好地处理以下形状
的
数据
帧
:但是如果我增加
数据
帧
的
大小,
例如
: (21
浏览 0
提问于2019-03-29
得票数 4
1
回答
如何使用
R
对
仅共享某些公共元素
的
两个矩阵或
数据
帧
求和?
r
、
matrix
、
dataframe
、
merge
我有两个很大
的
数据
框,我想要对它们执行元素级
操作
。
在
我
的
例子中,我希望
对
列名和行名部分重叠
的
两个矩阵
进行
矩阵相加。="") a b
r
2 1 1 b c
r
3 10 10>S
r</em
浏览 0
提问于2017-06-06
得票数 0
3
回答
R
:为每列设置值
的
数量来筛选行
r
、
dataframe
、
split
、
subset
我有一个非常大
的
数据
帧
,其中包含2个重要
的
列,它们具有感兴趣
的
值,目前用逗号分隔。
例如
: ID Data1 Data22 3, 4 4 8035, 40, 30 5 50, 15 90 "12,5,6“
在
R
中读作一个字符。我需要对
数据
进行
子集
浏览 37
提问于2021-07-12
得票数 0
1
回答
R
:如何基于回归模型(glmm)对
数据
进行
子集
r
、
regression
、
subset
、
mixed-models
使用
的
许多变量都有丢失
的
数据
(我已经使用估算或其他方法(
在
适当情况下仍然有相当多
的
方法)来解释丢失
的
数据
),因此很明显,由于列表删除,许多行被排除
在
原始
数据
框架之外。我现在需要做一些描述性
的
统计工作(主要是由于许多变量是序数/标称
的
频率)。 是否有
一种
简单
的
方法来
对
原始
数据
框架
进行
<
浏览 0
提问于2019-06-19
得票数 0
回答已采纳
2
回答
在
转换后从列表中提取单独
的
数据
帧
(lapply)?
r
我正在学习
R
,并且正在寻找
一种
方法来
在
多个
数据
帧
之间
进行
相同
的
数据
转换,
例如
,重新编码每个
数据
帧
中出现
的
变量,而不必每次都为每个
数据
帧
键入代码。我创建了一个
数据
帧
列表,然后使用lapply()
在
一个函数中
对
它们
进行
转换,但是结果被存储<em
浏览 0
提问于2016-12-09
得票数 0
1
回答
通过响应频率减少交叉表大小
r
请原谅我
的
新手问题--我是
R
的
新手,
对
统计学很不了解。 我有一个简单
的
联想表,表示
在
一段时间内每个用户
对
一组网页
的
查询次数。总共大约有15,000个观察值。由于50x100矩阵很难可视化,因此我想给出这个表
的
一个
子集
,它按最大
的
聚合排序--列(页组)、行(用户),甚至可能是最大
的
逐列计数。
例如
,我可能选择前
20
个用户和前10个组,或者选择前99%
浏览 2
提问于2012-03-02
得票数 1
1
回答
在
循环中调用不同
的
数据
名称
r
下面是我如何为初始dim(
数据
)<-500(行)17(列)矩阵创建多个名称为data_1、data_2、data_3 .....and等
的
数据
集
的
方法 assign(paste("data", i, sep = "_"),subset(data[data$cluster == i,]))到目前为止,一切都很好for
浏览 1
提问于2017-03-02
得票数 1
回答已采纳
4
回答
如何使列由几行组成?
r
、
aggregate
、
reshape
我
对
R
和编程本身非常陌生,现在我
的
data.frame有一个问题,它不允许我继续我
的
工作。和Clare ),我有他们
在
3个不同场合(2009,2010,2011)提出
的
测试中
的
分数。请让我知道是否有办法实际结束于表2而不是表1,因为我有超过10000个观察结果,而表1
的
设置不会让我继续
进行
预期
的
提议。编辑:
数据
帧
如下所示
浏览 6
提问于2013-01-23
得票数 3
回答已采纳
3
回答
dplyr中
的
filter()如何计算自定义函数中
的
()中
的
内容?
r
、
dplyr
、
lazy-evaluation
、
tidyeval
、
non-standard-evaluation
我正在尝试编写一个函数,该函数接受两个列名以及每个列名
的
上界和/或下界,这样我就可以用我选择
的
列名和边界来
子集
数据
。以mtcar为例,如果我想通过说我只需要具有cyl > 4和
mpg
> 15
的
行来设置
数据
子集
,在这种情况下,我
的
函数将接受两个列名cyl和
mpg
,每个列名也有两个下限,分别为4和15。当然,
在
函数中,我可以选择为其分配一个上限,以将列名(变量)保持在一定范围内。
浏览 14
提问于2019-11-09
得票数 0
1
回答
对
大
数据
帧
进行
赋值
performance
、
r
、
for-loop
在
R
中,我用以下方式创建了一个
数据
框:data$number = 0当我运行一个为
数据
框赋值
的
为什么它在
R
中这么慢?我记得读过
R
逐列存储矩阵(
例如
,与C不同,它是逐行存储
的
)。但是,我仍然不明白为什么要花这么多时间。我
的
data.frame不应该舒适地放在内存中(避
浏览 0
提问于2013-05-24
得票数 0
1
回答
如何理解哪些内容可以放在花括号内或外面?
r
作为
R
的
初学者,我一直
在
努力阅读复杂
的
代码(至少
对
我来说,这是复杂
的
)。当我阅读简单
的
代码时,结构非常清晰。我能分辨出哪些是参数,哪些是变量,还有其他类似的东西。
例如
:for (i in seq_along(df)) { }我不知道为什
浏览 2
提问于2020-04-04
得票数 0
回答已采纳
1
回答
使用Mapply将函数
的
结果作为
数据
框行返回
r
我有一个相当大
的
R
数据
框架。我希望使用mapply从几列中获取输入,并将它们逐行传递给一个函数,从该函数返回
的
将是一个5位数字向量,我希望再次以逐行为基础将其分配给原始
数据
框中
的
10列。但另外,我希望能够在行
的
子集
上执行此
操作
。]<-mapply(my.function, my.df$a, my.df$b, my.df$c) 然而,如果我想在
数据
帧
的
一个大
的
浏览 0
提问于2016-12-22
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
交叉验证和超参数调整:如何优化你的机器学习模型
slowfast:facebook机器视觉视频理解的双模CNN
微软提出新预训练语言模型DeBERTa:仅需一半数据且效果优于BERT、RoBERTa
赛尔推荐 第21期
如何索引数以十亿计的文本向量?
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券