我正在使用mhddfs组合多个驱动器,通过网络安装使用NFS。
有三台机器
Server Name Dir Space
Server 1 /home 10 GB Space
Server 2 /home 10 GB Space
Server 3 /home 10 GB Space
使用NFS,我挂载了以下内容:
Server 1 /home to Server 3 /home/mount1
Server 2 /home to Server 3 /home/mount3
然后使用mhddfs合并或统一mount1和挂载2。
mhddfs /home/serv
我尝试创建一个自定义的并行提取器,但是我不知道如何正确地实现它。我有一个大文件(超过250 MB),每一行的数据存储在4行中。一个文件行存储一个列的数据。这有可能为大型文件创建并行提取器吗?恐怕一行的数据,在文件分割后会有不同的程度。
示例:
...
Data for first row
Data for first row
Data for first row
Data for first row
Data for second row
Data for second row
Data for second row
Data for second row
...
对不起我的英语。
我有一个有很多专栏的大文件。我希望在1列中计算每个值的出现数。因此,我使用cut -f 2 "file" | sort | uniq -c。我得到我想要的结果。但是,当我将这个文件读取给R时,它显示出我只有1列,但是数据与下面的示例类似:
123 Chelsea
65 Liverpool
77 Manchester city
2 Brentford
我想要的是两列,一列代表计数,另一列代表名字。不过,我只有一个。有人能帮我把列分割成2或更好的方法从大文件中提取吗?
提前谢谢!