我最近一直在处理更大的数据集,并开始学习并迁移到data.table,以提高聚合/分组的性能。我一直无法将某些表达式或函数按预期进行分组。这是一个基本的group by操作的示例,我在使用它时遇到了问题。分组被忽略,我将函数/表达式应用于每一行。下面返回所有100行,而不是10个group by categories。dt[,scale(value),by="category"]
dt[,value-mean(value),b
这个包使用data.table和base R中的函数。我想利用data.table::setDTthreads()函数提供的并行计算的好处。当用户加载data.table包时,此函数会立即调用,但我在开发包时不会这样做。我现在所做的只是:(1)在描述文件中,我向Imports字段添加了导入;(2)在命名空间中,我包含了data.table (data.table)。因为我知道这和库( dat