腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
使用
R
中
的
矢量化
函数填充数据
表
、
、
我正在尝试使用
矢量化
操作
来填充
R
中
的
数据
表
:x = 5Foo =
data.table
(Bar = 1:x)我认为对于每一行,rnorm(y,,Bar)将生成一个y长度向量(使用该行
的
Bar作为标准差),将其乘以该行
的
Bar值,然后填
浏览 2
提问于2017-12-13
得票数 0
1
回答
R
中
序贯计算步骤
的
矢量化
、
我有以下问题,如果可能的话,我想在
R
中用
data.table
向向量表示。由于
R
对于for循环来说是相当慢
的
,我认为在我
的
例子
中
,
矢量化
是必须
的
(超过500次观测)。下面,我展示了一个我想要向量化
的
虚拟例子。考虑以下代码:
浏览 1
提问于2018-09-27
得票数 0
回答已采纳
0
回答
R
data.table
中
的
矢量化
表
操作
、
基于给定
的
平均值和标准差,我正在尝试用各种样本运行来填充列。我现在有的是:A[, paste0("scenario", c(1:3)) := rnorm(2, ave0.1 20.2377 20.2377 20.2377很明显,它在一个向量上运行rnorm,然后对每一列重复相同
的
向量我试过像这样
的
东西 matrix(r
浏览 3
提问于2017-12-19
得票数 0
2
回答
基于pandas
中
的
其他列内容对列进行
操作
、
、
、
、
来自
R
,我不知道如何通过利用其他列在一个数据帧列上进行某种向量化
操作
,例如:df = pd.DataFrame({'s':['Big bear eats cat','cute cat sleeps'],'a':['bear','cat']})0
浏览 4
提问于2018-08-08
得票数 2
回答已采纳
1
回答
使用函数与
data.table
进行Crossproduct/join
、
我想知道,对于某些特定
的
任务,是否有可能对数据
表
进行有效
的
交叉连接。somevector <- rnorm(10, 5) return(x-somevector)是否可以用
data.table
生
浏览 1
提问于2012-11-09
得票数 3
2
回答
对于一个列
的
每个值,查找哪个值是另一个向量
的
最后一个值,该值较低。
找到小于给定值
的
向量
的
最后位置相当简单(例如,参见 )。set.seed(123)# [1] 6 8 15 16 17#
浏览 4
提问于2018-01-09
得票数 3
回答已采纳
1
回答
如何循环遍历整个数据帧/
R
中
的
每个单元?
、
、
、
、
我需要对表
中
的
每个单元格值执行for循环和true或false
操作
,如果
操作
返回true,则函数将用0替换该值。但每当我试图运行代码时,
R
都会抛出错误 for (j in xxx(a number){ y[i,j] <- NA } [.
data.table</
浏览 0
提问于2019-07-26
得票数 0
1
回答
聚合和计数符合条件
的
行,按唯一值和转换
表
分组
、
、
在使用
data.table
包
的
R
中
,必须有一种简单而优雅
的
方法来实现这一点,但我很难搞清楚。
矢量化
手术更佳。library(
data.table
) d2 <- as.Date("12-31-2013", '%m-%- - 2 26 -
浏览 3
提问于2013-06-05
得票数 1
回答已采纳
4
回答
在
data.table
列
中
处理富对象
、
假设我有一个
data.table
,其中一列包含线性模型:set.seed(1014) g = c(1, 1, 2, 2runif(7),) 现在我想从每个模型中提取
r
平方
的
值models[, list(rsq = summary(mod[[1]])$<
浏览 1
提问于2014-04-10
得票数 4
1
回答
意外地-来自
data.table
::frollmean()
的
高内存使用率
、
我有一个由20M行和20个列组成
的
数据
表
,对其应用
矢量化
操作
,返回列表,它们本身是通过引用数据
表
中
的
其他列来分配
的
。在所有这些
操作
中
,内存使用量都会以可预见和适度
的
方式增加,直到我使用一个自适应窗口将(想必是高效
的
) frollmean()函数应用于包含长度为10
的
列表
的
列。在Windows 10 x64上运行
R
4.1.2<em
浏览 1
提问于2022-01-08
得票数 3
回答已采纳
3
回答
对数据
表
中
的
选择列进行重分类
、
我希望使用
矢量化
操作
来更改数据
表
中选定变量
的
类。我是
data.table
语法
的
新手,正在努力学习尽可能多
的
知识。我现在
的
问题是基本
的
,但它会帮助我更好地理解数据
表
的
思维方式!require(
data.table
) ### Create pseudo
浏览 0
提问于2013-04-26
得票数 6
回答已采纳
1
回答
R
:通过对函数
的
引用传递data.frame
、
、
我将一个data.frame作为参数传递给一个想要更改内部数据
的
函数:f <- function(d){ d$value[i] <-0 }} value2 04 0 但是,我传递
的
原始da
浏览 0
提问于2015-10-17
得票数 8
回答已采纳
2
回答
组
中
每个成员子集向量上
的
r
data.table
计算函数
、
、
、
我有一个数据
表
,它与 diag=sample(LETTERS[1:7],50,T),val=sample(1:100,50,F)) 对于相同
的
val,我想要计算任何比val大
的
概率,并将其放入
表
的
新列,比如prob (我知道这个概率不一定是正常
的
)。(dt大约是800 k行,大约有2k级别),所以我想要
矢量化
而不是循环。'
浏览 2
提问于2015-06-26
得票数 4
回答已采纳
3
回答
R
中
读取和比较CSV文件
的
最快方法
、
、
我知道堆栈溢出
中
还有其他关于以最快
的
方式读取
R
中
的
csv文件
的
问题--而且它们已经得到了回答;
data.table
似乎是最好
的
选择。但我还有额外
的
要求。我需要找到一个脚本来设置两个向量组之间
的
diff
操作
(以找到两个向量
中
匹配
的
值
的
计数)。这两组向量将从两个不同目录( dirA和dirB )
中
的
csv文件<em
浏览 4
提问于2021-08-11
得票数 0
回答已采纳
1
回答
使用with对高频时间序列进行子集(用
data.table
替换
data.table
功能)
、
、
我想所有的数据之间每天
的
特定时间使用
data.table
。
R
.data.table[Time > as.POSIXct('2016-09-18 08:00:00') & Time < as.POSIXct('2016-09-18
浏览 4
提问于2016-09-18
得票数 5
2
回答
快速搜索符合两个条件
的
行,例如哪一行(...&.)在
R
中
我希望加快
R
中
搜索与table2匹配
的
表
1元素
的
行#
的
一小段代码(见下文)。注意,哪个条件有一个&,因为我需要两个元素x&y是相同
的
,以便选择行。 我
的
数据集很大,这个循环非常慢。
浏览 1
提问于2019-01-11
得票数 0
回答已采纳
2
回答
优化嵌套for循环中
的
处理时间-
R
我使用嵌套
的
for循环来重写一些数据...然而,它永远需要计算运算。for(i in 1:length(data$kolicina)){ if(data$LIXcode[i] ==df$LIXcode[j]){ }}df <- data[grepl("
浏览 1
提问于2016-10-07
得票数 0
1
回答
data.table
中
循环
R
的
矢量化
、
我正在为不同
的
机器构建一个维护程序员,我有一些特定活动
的
例程,这些活动应该在特定
的
日期执行,由频繁事件和开始日期定义。我已经有了一个
data.table
,它
的
频率(以星期为单位),大型维护
的
最后一个已知日期,以及每个例程
的
预计日期,根据其频率和最后日期。简化后
的
版本如下所示: dt <- structure(list(id = c(1, 2, 3, 4, 5, 6, 7, 8, 9),
浏览 0
提问于2019-03-17
得票数 4
回答已采纳
1
回答
如何影响通过引用在
R
中
传递
的
对象?
、
、
、
我在
R
中使用
data.table
包,除其他外,
data.table
会通过引用传递
表
。} AddSquares(DT) x x22: 2 4x2是在DT byRef
中
创建
的
,因此我不必返回修改过
的
表
= 0] x x22: 2 4<-
操
浏览 2
提问于2015-04-02
得票数 2
回答已采纳
1
回答
用dplyr进行行向
操作
、
、
、
我正在研究一个大
的
数据,在
R
中有2300万条记录,其中包含用户在具有启动和停止时间
的
位置上
的
事务。我
的
目标是创建一个新
的
dataframe,其中包含每个用户/每个位置连接
的
时间。下面的代码显示了如何开发最终
的
数据,尽管总
的
代码要复杂得多。在Intel(
R
) Xeon(
R
) CPU E5-2630 v3 @ 2.40GHz上运行整个代码需要9个小时,16核128 v3内存。H")
浏览 2
提问于2016-01-26
得票数 15
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
云直播
活动推荐
运营活动
广告
关闭
领券