我已经开始阅读有关hadoop的文章。我也想学习实践。由于hadoop是分布式环境,并被设计为在linux上运行,因此我不能在运行windows的本地计算机上实践它。互联网上有没有云或虚拟机,我可以自己搭建整个环境并开始学习?我可以预先配置hadoop集群,但我更喜欢自己配置。
发布于 2014-08-15 16:04:34
Cloudera ( cloudera.com)有一些预配置的单节点环境。它只有3 3GB,但你可以找到你需要的每一个BigData组件。
http://www.cloudera.com/downloads/quickstart_vms.html
Oracle 还有一个虚拟机,可免费用于开发和测试: BigData Lite
http://www.oracle.com/technetwork/database/bigdata-appliance/oracle-bigdatalite-2104726.html
Hortonworks也有一个预配置的沙箱。
我更喜欢Cloudera环境。如果你想测试Sqoop组件,Oracle是很好的。
发布于 2014-08-25 22:03:45
我也想学习一些关于Hadoop的东西,所以我买了一个树莓派,安装了树莓派的 wheezy和遵循these instructions的Hadoop。
它很好地解释了如何设置单节点集群。Raspberry Pi上的Hadoop不是很快,但在我看来,它足够快来学习Hadoop的基础知识。
如果您想在本地机器上设置单节点集群,我更喜欢使用发行版,正如user3341955已经提到的那样。我选择了Hortonworks,因为Virtualbox on Mac OS X有一个非常简单的安装指南。
和VMware Player on Windows的安装指南
享受Hadoop带来的乐趣:)
发布于 2014-08-26 21:29:21
既然您正在寻找一个基于云的环境,那么我建议您使用Cloudera Live demo,它实际上就是Hue demo。它基本上是一个真实的Hue实例(非管理员用户将使用和看到的UI ),它位于一个对公众开放的真实集群前面。您可以浏览文件系统、发布查询等。
如果你想探索更多的表面细节,是的,你应该运行你自己的玩具集群。如果你喜欢Cloudera发行版,请注意Cloudera Manager是免费的,它也是一个安装程序,可以在云中为你打开一个集群,就像在亚马逊EC2上一样。
https://stackoverflow.com/questions/25321533
复制相似问题