我有一个有很多专栏的大文件。我希望在1列中计算每个值的出现数。因此,我使用cut -f 2 "file" | sort | uniq -c。我得到我想要的结果。但是,当我将这个文件读取给R时,它显示出我只有1列,但是数据与下面的示例类似:
123 Chelsea
65 Liverpool
77 Manchester city
2 Brentford
我想要的是两列,一列代表计数,另一列代表名字。不过,我只有一个。有人能帮我把列分割成2或更好的方法从大文件中提取吗?
提前谢谢!
抱歉,如果标题不清楚--如果有人能提出更好的措辞,我会修改它。我不知道如何把这个问题浓缩成一个句子。
我有一个包含三列的电子表格,我需要将它按所有三列排序,但是,A列中的一些值在C列中有多个与它们相关联的值,因此有多个条目,但是不同的条目不能在B列中有不同的值。
如果A列中的任何值出现在其他地方,而B列中出现了不同的关联值,则需要该行指示错误(以不同颜色的形式)。
例如:
Mike 7 Green
Mike 7 Blue
Patrick 7 Green
Sarah 12 Purple
Sarah 11
我想计算一下“?”的出现次数。“成人”数据帧中所有变量的值。
dataset.workclass[dataset.workclass == '?'].count()
给我'workclass‘列的出现次数。
然而,当我这样做的时候:
for column in dataset:
dataset.column[dataset.column == '?'].count()
给了我一个错误:
'DataFrame' object has no attribute 'column'
我有一个表,其中列出了以下值。对于同一客户,第1列中的一些值显示了两次(例如,apple可能显示2次或更多次)。
Column 1
Apples
Oranges
Bananas
我知道我可以使用它来获得每个值的计数。
SELECT column 1, COUNT(*)
FROM table
GROUP BY column 1
有没有办法编写一条SQL语句来查看同一个客户的其中一个值的计数出现两次的情况?
例如,我想要找出苹果为同一客户出现两次的次数。
我正在处理数据表,我有一个包含多个客户的专栏,每个客户可能不止一次出现。是否有一种方法可以让excel检查列,找到匹配的单元格,然后执行公式?
我的专栏可能是这样的:
Apple
Apple
Intel
Windows
Intel
我希望excel检查该列的副本,并计算每个客户的平均值。就像两个苹果公司的平均水平,然后是英特尔的新产品,以及Windows的新产品。