我有一个数据帧,其中第一列包含活动的名称。我需要汇总所有活动名称包含特定字符串的行(它可以出现在名称中的不同位置,即有时出现在开头,有时出现在结尾)。数据帧如下所示:
Campaign Impressions
1 Local display 1661246
2 Local text 1029724
3 National display 325832
4 National Audio 498900
5 Audio local 597339
6 TV Regional 59
如何创建包含嵌套data.table的data.tables?
示例
set.seed(7908)
dt <- data.table(x=1:5)[,list(y=letters[1:x],z=sample(1:100,x)),by=x]
dt
## x y z
## 1: 1 a 13
## 2: 2 a 27
## 3: 2 b 87
## 4: 3 a 85
## 5: 3 b 98
## 6: 3 c 1
## 7: 4 a 53
## 8: 4 b 81
## 9: 4 c 64
## 10: 4 d 45
## 11: 5 a 28
## 12
我想要生成一个数据文件hminput,其中包含来自不同的较小数据(名为frqAFR、frqAMR、..。等等,如下所示)。因此,与其单独编写所有代码来提取每个列的三列,然后按列绑定它们,然后再按行绑定,我想知道是否可以使用列表中包含字符串的for循环对其进行一些优化。
所以,到目前为止,我的想法是:
listpop<-c("frqAFR","frqAMR","frqEUR","frqEAS","frqSAS","frqAFROURU","frqIND")
for (g in
我有一个数据集中,在一个列中,我有一个人的名字,在另一个列中,我有她为某项服务支付的金额。我想要建立一个名单,所有的人的名字,由他们的总金额,无论他们所做的服务。示例:
Ann 100
John 200
Matt 150
John 150
John 150
Ann 300
Erik 150
===========
John 500
Ann 400
Matt 150
Erik 150
我认为这需要查找个人姓名的所有重复实例,然后将支付的值存储在列中,最终汇总所有内容。问题是我的名单太大了,无法检查个人的名字。也就是说,我不
Q1:
我是否可以在数据表中搜索两个不同的列。我有200多万行数据,我想选择搜索这两列中的任何一列。一个有名字,另一个有整数。
示例:
x <- data.table(foo=letters,bar=1:length(letters))
x
want to do
x['c'] : searching on foo column
as well as
x[2] : searching on bar column
Q2:可以更改数据表中的默认数据类型吗?我是在一个矩阵中读取字符和整数列,但是所有内容都是作为字符读取的。
谢谢!-Abhi
我有一个很大的df,看起来像这样:
Name Year Runs Average
J. Doe 2016 432 44.5
J. Doe 2017 325 37.4
J. Bloggs 2016 289 54.3
我想要连接行,这样我就可以计算每个名称的总数,而不是按年份拆分。一些列,例如游程需要求和,而其他列,例如Average将需要依赖于其他列的其他公式。df太大了,不能手动完成,所以有没有一个函数可以让我在名字重复的时候组合这些行?