腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
提高
data.table
性
能为
列
分配
新
值
、
、
我有一个巨大的
data.table
,并且我需要基于现有
列
中的条件创建
新
列
。假设我的数据是这样的: library(
data.table
) dt=
data.table
(ID=rep(1:3,1000000),LABEL=rep(c("A","A","B"),1000000),COND=rep(c("C","D","D"),1000000),VALU
浏览 11
提问于2019-01-08
得票数 1
回答已采纳
1
回答
data.table
将生成的多个
列
分配
为
新
的
data.table
(或列表)而不重复名称
、
、
我的问题是在将多个
列
分配
给
data.table
时代码的错误倾向/可维护
性
。我有一个返回
data.table
的函数,如下所示:{} 我将此函数应用于另一个
data.table
浏览 1
提问于2018-08-15
得票数 5
2
回答
使用分位数箱的ID在
data.table
中的
新
列
值
、
quantile(X, prob = seq(0, 1, length = 5), type = 5) 如何将其转换为
data.table
操作,使用:=添加一个
新
列
,并为每个ID
分配
一个
值
,如果该
值
位于回收箱内,则为每个ID
分配
一个适当的有序
值
,如25%=1、50%=2等。
浏览 5
提问于2013-10-18
得票数 3
回答已采纳
1
回答
作为存储函数的
data.table
列
赋值
、
为了减小
分配
的大小,我从表中去掉了所有可以从其他列计算得到的
列
。例如,星期几可以从日期计算出来,所以我从包数据集中省略了星期几。但是,我想让使用该包的任何人都能方便地以标准方式重新计算这些
列
。为了
提高
效率,我想使用
data.table
就地赋值。我遇到的问题是,
新
列
的就地赋值似乎发生在较低级别的环境中,并且我传递给函数的
data.table
实际上并没有被修改。 有人知道如何存储
新
列
的完整公式吗?只需对用户传递给该函数的
浏览 0
提问于2017-06-20
得票数 0
1
回答
使用'lapply‘和' by’通过引用修改
data.table
将为分组
列
创建重复的行
、
、
我尝试按每个月的日期按
列
val进行分组。据我所知,在下面代码中的场景1中,由于我没有通过:=将lapply的
值
赋给任何
新
列
,因此将打印
data.table
。但是,在场景2中,当我使用:=通过引用
分配
新
的
列
变量时,会创建
新
的
列
(使用正确的
值
),但在一天中的每个小时都会重复该
值
,而我只需要每天的
值
。场景3也提供了所需的结果,但需要创建一个
新
的
浏览 1
提问于2018-11-06
得票数 0
1
回答
带分组的数据表中多行和多
列
的中值
、
我有一个包含90000多个观察
值
和1201个变量的数据表。除了最后一
列
以外的所有
列
都存储数值,最后一
列
是源文件的名称(超过100)的
列
。下面是数据表的一个小示例: library(
data.table
)V2=sample(0:100,20replace=TRUE), V7=sample(0:100,20,replace=TRUE), file=rep(c(&
浏览 6
提问于2019-06-12
得票数 1
回答已采纳
2
回答
在1.8.3版本之前的R {
data.table
}中使用`:=`时如何抑制输出?
、
有没有办法防止
data.table
在通过引用赋值
新
列
后打印
新
的
data.table
?我猜标准的行为是example(
data.table
)# x y v# 2: a 3 42#3: a 6 42 3# 5: b 3 11 5# 7: c 1 7 7# 9: c 6 9
浏览 0
提问于2012-07-06
得票数 28
回答已采纳
1
回答
将向量赋值给R中特定的现有数据表行
、
我一直在阅读教程和文档,但还没有弄清楚如何将所有
列
的
值
向量
分配
给
data.table
中的一个现有行。我从一个空的
data.table
开始,它已经有正确的
列
和行数:现在,我为
data.table
之外的一行计算一些
值
,并将它们放在向量vec中,例如:我如何在获得良好性能的同时将vec的
值
<e
浏览 8
提问于2016-06-04
得票数 6
回答已采纳
1
回答
R
data.table
:检查哪一
列
不是NA,并获取该
列
的
值
、
我有一个类似于这个的
data.table
: 1: 1136NA #FEE6CE NA NA它有一个ID
列
(gnr)和一些包含颜色代码的
列
。在每一行中,只有一个列有一个颜色
值
,其余的都是NA。 我想要的是一个只有两
列
的
新</em
浏览 0
提问于2016-07-22
得票数 1
回答已采纳
1
回答
在
data.table
中使用set更改多
列
、
为了
提高
效率,我试图在
data.table
中使用set更改行和
列
。set上的文档指出,参数j是:“列名称(S)(字符)或数字(S)(整数)在
列
(S)已经存在时被赋值,如果要创建列名,则只有列名(S)。”这是我正在犯的错误: set中的错误(iris,i= 1L,j= as.integer(1:3),value = list(1:3)):提供了3项,
分配</
浏览 4
提问于2020-04-17
得票数 1
回答已采纳
1
回答
日期间的时间差取决于id
、
、
我正在为一个简单的问题寻找一个
data.table
解决方案:我有这样的数据:data1 <-
data.table
( date= as.Date(c("2016-03-30", "2016-03-31", "2016-04-05")) id = rep(2,2), date= as.Date(c("2016-
浏览 5
提问于2022-02-11
得票数 0
1
回答
最低对顺序组合数据表
、
、
我有一套两
列
的。行是
值
对(a,b)。require(
data.table
) 我想给每一对
值
分配
最低的数字,但如果其中一个
值
再次出现在
新
行中,则必须再次将其与
新
对进行比较,并选择历史记录的最低
值
。其结果必须是: res.dt<-
data.table
(a=
浏览 2
提问于2016-12-15
得票数 2
回答已采纳
1
回答
检查
列
是否包含列表中的
值
,并将该
值
分配
给
新
列
、
然后我有一个
data.table
,我想在其中查找该
值
是否包含任何其他模式,然后将该
值
分配
给一个
新
列
: library(
data.table
)base_patters<- c("pat1","pat2","pat3") transformations <-
data.table
(mynames = c("HI_pat1_jo"
浏览 12
提问于2019-09-30
得票数 1
回答已采纳
1
回答
如果输出和
data.table
,r-
分配
我正在尝试根据条件(如果其他)将datatable
分配
给一个
新
变量。为什么第一种选择不起作用?library(
data.table
) DT1 =
data.table
(x=rep(c("a","b","c"),each=3),y=c(1,3,6),
浏览 0
提问于2018-04-11
得票数 0
回答已采纳
2
回答
R:从
data.table
中的字符
列
中提取最后N个单词
、
、
我希望能得到一些帮助,从
data.table
的一
列
中提取最后的N个单词。然后将其
分配
给一个
新
列
。test <-
data.table
(original = c('the green shirt totally brings out your eyes', 'ford focus hatchback'))original 1: the green shirt totally brings
浏览 0
提问于2016-04-20
得票数 1
回答已采纳
1
回答
data.table
列上的R-递归
、
我得到了data-table,其中(i+1)-th
列
依赖于前一个
列
,并且需要递归计算。data-table的头部由一个从0.`开始的序列组成。0 1 2 32: 2 NA NA NAdt <-
data.table
("0"=c(1,2,3),&quo
浏览 14
提问于2019-06-07
得票数 1
回答已采纳
1
回答
使用
data.table
x[y]语法复制dplyr::left_join()
列
顺序
、
、
由于性能的
提高
,我将我的很多数据操作管道从dplyr转换到
data.table
。我喜欢用于连接的a[b]语法的简洁
性
。dplyr::left_join(x, y)对应于
data.table
中的y[x]。但是,在这两种情况下,
列
顺序是不同的。有没有一种方法可以复制从dplyr left_join获得的
列
顺序,其中来自y的
新
列
被添加到x的右侧,使用y[x]的
data.table
语法?示例library(<e
浏览 2
提问于2021-05-21
得票数 1
回答已采纳
3
回答
根据从现有
列
派生的TRUE/FALSE设置
新
列
值
、
我希望在
data.table
对象中创建一个
新
列
,并且应该根据匹配范围内的数字来设置
值
。范围的from和to是现有
data.table
对象中的两
列
。数据set.seed(1)2: 3721 104874: 9080 10193 5:
浏览 0
提问于2015-08-05
得票数 3
回答已采纳
1
回答
在R中组合data.tables
、
我们使用机器学习预测职业代码,现在希望将预测的代码与预测的职业代码结合起来,这些代码不是在措辞上,而是在职业活动的相似
性
方面与预测的代码相似,以
提高
这些代码的准确
性
,这些代码将在稍后的面试中使用id<-rep(c(1:4), each=25) table<-
data.table
,
浏览 12
提问于2018-01-18
得票数 0
回答已采纳
2
回答
data.table
bug:当使用get()时,在.SD上重新排序列。可能的解决办法?
、
我发现
data.table
有一种奇怪的行为。我想知道是否有办法避免它,或一个解决办法。library(
data.table
)cols <- c("y",&quo
浏览 1
提问于2019-12-04
得票数 4
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
好强一个Julia!CSV数据读取,性能最高多出R、Python 22倍
Oracle表及保证数据的完整性
Oracle 19C入门到精通之数据完整性和约束性
谷歌发布广告报告新转化列,广告商可根据报告迅速调整预算和出价
Go应用中热路径的迭代优化
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券