前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Porn Data Anaylize — Hadoop安装

Porn Data Anaylize — Hadoop安装

作者头像
obaby
发布2023-02-24 15:48:36
2870
发布2023-02-24 15:48:36
举报
文章被收录于专栏:obaby@mars

这是一个系列的数据分析相关项目,包括环境搭建,数据分析,分析代码,分析报告等。目前数据来源于爬取到的100,000+数据 文章主要介绍相关的方法和原理,也算是自己对于大数据的一个初步的认识。

代码不会涉及具体的数据信息。如果需要相关的数据,可以参考以下文章自己爬取相关的数据信息:

某加密到牙齿的APP数据加密分析 攻城略地 再下一Porn

安装参考的是《Python + Spark 2.0+Hadoop机器学习与大数据实战》(林大贵 著),首先吐槽一下,林大贵的几本书前几章的内容完全一样,尤其是上面提到的这本与《Hadoop + Spark大数据巨量分析与机器学习实战》,两本书前7章内容完全一致。 买了两本书其实相当于买了一本半,并且重复的都是非常基础的部分。对于整本书来说倒是降低了写作的难度和时间,并且两本书的实例也基本一致,不过使用的语言略有不同。 书上介绍的安装版本比较老旧,也没有必要去安装一个老旧的版本。所以这里我安装的是3.3.0 具体的安装流程可以参考这个链接:http://hadoopspark.blogspot.com/2015/09/4-hadoop-26-single-node-cluster.html

不过需要注意的是里面的几条命令可能稍微有些问题: 使用下面的这条命令生成的key文件对应的host是本机的主机名:

代码语言:javascript
复制
ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa

如果系统没有设置hostname,可以使用下面的命令生成key:

代码语言:javascript
复制
ssh localhost ssh-keygen -t rsa

两者的区别在于第一条命令生成的是username@hostname,第二条名称生成的是username@localhost

另外一个需要注意的是,直接按照文件中的配置,最终hdfs web界面可能无法访问,需要修改hdfs-site.xml添加以下配置信息:

代码语言:javascript
复制
<property>
    <name>dfs.http.address</name>
    <value>0.0.0.0:50070</value>
</property>

这样hdfs web界面就可以正常访问了。 安装完成之后启动hdfs的时候,可能会出现如下错误:

Unable to load native-hadoop library for your platform 搜索以下会发现网上的各种说法,以及解决方案,但是这些解决方法基本都是一个瞎试的状态。可以参考这个链接:https://stackoverflow.com/questions/19943766/hadoop-unable-to-load-native-hadoop-library-for-your-platform-warning 修改l4j的配置文件,查看问题具体是出在什么地方,修改log4j.properties增加如下行:

代码语言:javascript
复制
log4j.logger.org.apache.hadoop.util.NativeCodeLoader=DEBUG

然后运行:

代码语言:javascript
复制
hadoop checknative -a

就可以看到具体的日志信息了:

代码语言:javascript
复制
hadoop checknative -a
2020-08-21 10:13:10,474 DEBUG util.NativeCodeLoader: Trying to load the custom-built native-hadoop library...
2020-08-21 10:13:10,478 DEBUG util.NativeCodeLoader: Failed to load native-hadoop with error: java.lang.UnsatisfiedLinkError: /usr/local/hadoop/lib/native/libhadoop.so.1.0.0: /usr/local/hadoop/lib/native/libhadoop.so.1.0.0: cannot open shared object file: No such file or directory (Possible cause: can't load AARCH64-bit .so on a AMD 64-bit platform)
2020-08-21 10:13:10,478 DEBUG util.NativeCodeLoader: java.library.path=/usr/local/hadoop/lib/:/usr/local/hadoop/lib/native
2020-08-21 10:13:10,478 WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable
Native library checking:
hadoop:  false 
zlib:    false 
zstd  :  false 
snappy:  false 
lz4:     false 
bzip2:   false 
openssl: false 
ISA-L:   false 
PMDK:    false 
2020-08-21 10:13:10,864 INFO util.ExitUtil: Exiting with status 1: ExitException

最终的原因在于电脑用的amd的处理器,Possible cause: can’t load AARCH64-bit .so on a AMD 64-bit platform,所以百度搜索到的解决方法都没啥用,也解决不了这个问题。虽然有个警告,但是实际的使用是没有问题的。

☆文章版权声明☆

* 网站名称:obaby@mars * 网址:https://h4ck.org.cn/ * 本文标题: 《Porn Data Anaylize — Hadoop安装》 * 本文链接:https://h4ck.org.cn/2020/08/porn-data-anaylize-hadoop%e5%ae%89%e8%a3%85/ * 转载文章请标明文章来源,原文标题以及原文链接。请遵从 《署名-非商业性使用-相同方式共享 2.5 中国大陆 (CC BY-NC-SA 2.5 CN) 》许可协议。


分享文章:

相关文章:

  1. Porn Data Anaylize — TS伪娘 分类数据浅析
  2. Porn Data Anaylize — 视频数据初探
  3. Porn Data Anaylize — Spark安装
  4. Porn Data Anaylize — 分类数据二次分析
  5. Porn Data Anaylize — 上传者 分类信息分析(github)
  6. Porn Data Anaylize — AI换脸 分类数据浅析(github)
  7. Porn Data Anaylize — 标签 模特信息分析(github)
  8. UnGzip Data(PyQt4) By obaby
  9. 上一篇文章的代码(开源Github)
  10. 攻城略地 再下一Porn
本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2020年8月21日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 相关文章:
相关产品与服务
大数据
全栈大数据产品,面向海量数据场景,帮助您 “智理无数,心中有数”!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档