我有一个大约1.85 GB的数据集,其中包含h5文件,我需要使用hadoop处理这些文件,为此,我可能需要将这些文件转换为文本或csv。hadoop有没有办法读取h5文件?或者有没有好的在线工具可以将h5文件转换成csv或文本文件?或者谁能给出一个链接,在那里我可以下载一个包含文本或csv文件的大型数据集?
提前感谢
发布于 2014-06-19 04:13:01
你有没有尝试过带有hdf5_handler模块的OPeNDAP Hyrax服务器?
例如,从示例HDF5文件1中,您可以获得以下ASCII数据2
Dataset: grid_1_2d.h5
temperature[0], 10, 10, 10, 10, 10, 10, 10, 10
temperature[1], 11, 11, 11, 11, 11, 11, 11, 11
temperature[2], 12, 12, 12, 12, 12, 12, 12, 12
temperature[3], 13, 13, 13, 13, 13, 13, 13, 13
...带有hdf5_handler的OPeNDAP Hyrax服务器是一个很好的工具/服务,因为您也可以使用HTML轻松地从HDF5文件中选择(和子集)一个数据集。3.您可以从4中找到有关OPeNDAP hdf5_handler的详细信息。
1
2
3
4
https://stackoverflow.com/questions/18494665
复制相似问题