我在做Hadoop with MongoDB as Database而不是HDFS的研究。所以,我需要一些关于性能和可用性的指导。我的场景
我可以从twitter和Facebook获得数据。为了进行hadoop处理,我需要存储。因此,我的问题是,使用Hadoop和Mongo存储诸如twitter提要、facebook帖子等社交网络数据是否可行(或有益)?还是更好地使用HDFS并将数据存储在
我有一个相当大的HDF5文件,其中存储了一个大型的时间序列数据集,其中包含150名参与者的眼球跟踪数据。我想做这样的事情--一次读一个参与者(参与者的列名是"name"),执行一些操作,然后保存到一个较小的数据帧:
for name in f['data_collection/events/eyetracker