我知道我们可以使用apply或lapply来执行在R中for循环可以做的事情,如果您有一个dataframe,您可以使用apply (dataframe,2,mean)来计算列的平均值,但是,如果我们有数据列表,那么我需要通过删除第一列并将数据转换为数字来进行以下调整。让我们说,数据的列表是列表,其中LIST[1]是第一个数据。
如何使用列表立即执行上述操作。如何使用lapply对列表中的数据进行操作?
lapply(LIST, function (x) some function)
将该操作应用于“不对数据文件进行列表”。以下是没有任何意义的:
lapply(LIST[], function
我有一个很大的文本语料库(~170kB),我想为NLP应用程序训练它。
然而,试图创建一个列表中所有元素的列表,一次一个地与同一列表中的所有其他元素配对,会导致程序退出,并返回退出代码137。
def wordsToBigrams(words):
totalSentenceBigrams = [(a,b) for b in words for a in words]
我有一个包含4列的数据帧,每列代表不同的处理方式。每一列上都填充了蛋白质数字,并且每列之间的行数不同。有一种方法可以比较所有4列,结果是第五列表明在哪一列中找到了值?我知道我有一些值将在两个甚至三个列中发生,我想知道是否有方法可以在新列中获得最终结果。
我尝试了Data$A %in% Data$B,但这只给出了两列之间的TRUE或FALSE。我在寻找一些选项,比如匹配或甚至包含,但所有的选项都只能给我一个正确或错误的答案。
我需要的是这样的东西。
A B C
1 DSFG DSFG DSGG
2 DDEG DDED DDEE
3 HU
这可能是一个简单的问题,但我正在努力解决它。我正在尝试使用for循环为我的数据框中的每一列生成密度图。我可以从列名创建一个列表,但当我尝试使用该列表时,我无法生成我的密度图。 df1 <- as.data.frame(mtcars)
list <- colnames(df1[1:11])
for (i in list){
ggdensity(df1$i)
}