我有两台机器。一台机器在伪分布式模式下运行HBase 0.92.2,另一台使用Nutch2.x爬虫.我如何配置这两台机器,使一台具有HBase-0.92.2的机器充当后端存储,另一台使用Nutch-2.x充当爬虫?
发布于 2014-03-28 05:12:14
我终于做到了我很容易做到。我在这里分享我的经验。也许它能帮到某人。
1-将hbase-site.xml的配置文件更改为伪分布式模式。
2-最重要的是:在hbase机器上,用这样的真实网络ip替换/etc/主机中的本地主机ip
10.11.22.189主本地主机
hbase机器的ip = 10.11.22.189 (注意:如果不更改hbase机器的本地主机ip,远程nutch爬虫将无法连接到它)
4-复制/符号链接hbase-site.xml到$NUTCH_HOME/conf
5-启动你的爬行器,看它是否有效。
https://stackoverflow.com/questions/22678932
复制相似问题