专栏首页大数据技术学习学习大数据要有这样的学习思路才行?
原创

学习大数据要有这样的学习思路才行?

我们在系统学习大数据的之前,要先了解大数据开发是在什么系统平台下进行的。所以我们在学之前要先学习Linux的知识,这部分显得格外的重要。

1、Linux学习

学习如何使用VMware安装Linux镜像------认识linux的桌面环境、shell环境------在shell环境下进行文件系统的操作,掌握more、touch、cp、mv、rm等20多个常用命令------学习linux的网络管理,掌握ip、hostname等设置------学习vmware与linux的通信设置,掌握如何实现host-only、bridge、nat等网络连接方式------学习linux的进程管理,掌握如何查看、删除进程------学习linux的软件管理,掌握java、mysql等安装------学习环境变量配置,掌握如何设置环境变量------学习linux的ssh管理,掌握如何实现免密码登录------学习linux的防火墙管理,掌握如何关闭防火墙及开放指定端口------学习linux的调度管理,掌握crontab的使用

这些差不多就是Linux的学习要点了,只有掌握了这部分的内容,在学后面的知识点时才能更加的得心应手。

互联网科技发展蓬勃兴起,人工智能时代来临,抓住下一个风口。为帮助那些往想互联网方向转行想学习,却因为时间不够,资源不足而放弃的人。我自己整理的一份最新的大数据进阶资料和高级开发教程,大数据学习群:868847735 欢迎进阶中和进想深入大数据的小伙伴加入。

2、hadoop学习

搭建伪分布实验环境------HDFS体系结构及shell、java操作方式------MapReduce体系结构及各种算法

这里的hadoop知识点当然还有很多很多,像图片下方的知识都是重点学习的内容,想要系统学习的同学可以看一下学习路线系统学习

3、zookeeper学习

Zookeeper是什么------搭建zookeeper集群环境------如何使用命令行操作zookeeper------如何使用java操作zookeeper

4、HBase学习

hbase的概述------hbase的数据模型------hbase的表设计------hbase的伪分布式和集群安装------hbase的shell操作------hbase的JavaAPI操作------hbase的数据迁移------hbase的数据备份及恢复------Hbase结合Hive使用------hbase的集群管理------hbase的性能调优

5、CM+CDH集群管理学习

CM + CDH集群的安装------基于CM主机及各种服务组件的管理------CDH集群的配置和参数调优------CDH集群HA配置及集群升级------CM的监控管理------集群管理的注意事项

6、Hive学习

Hive支持的数据类型------Hive数据的管理------Hive的查询------Hive的函数------Hive的文件格式------项目实战

7、Sqoop学习

Flume的体系结构------flume的agent配置信息------flume如何动态监控文件夹中文件变化------flume如何把数据导入到hdfs中------讲解如何通过flume动态监控日志文件变化,然后导入到hdfs中

以上的知识点可以说是系统大数据学习中最重要的环节,我们可以把它们统筹归结到一个章节内,当然除了以上的知识点还有很多的知识要学习。

比如:

机器学习的知识:R语言------mahout

storm流式计算:kafka------srorm------redis

spark内存计算:scala编程------spark core------spark sql------spark streaming------spark mllib------spark graphx------python机器学习------spark python编程

云计算平台:docker------kvm------openstack云计算

等等....大数据是未来的发展方向,正在挑战我们的分析能力及对世界的认知方式,因此,我们与时俱进,迎接变化,并不断的成长!

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 大数据学习系列之五 ----- Hive整合HBase图文详解

    Hive与HBase整合的实现是利用两者本身对外的API接口互相通信来完成的,其具体工作交由Hive的lib目录中的hive-hbase-handler-*.j...

    用户2292346
  • 大数据学习过程中需要看些什么书?学习路线

    很多朋友对大数据行业心向往之,却苦于不知道该如何下手。作为一个零基础大数据入门学习者该看哪些书?今天给大家推荐一位知乎网友挖矿老司机的指导贴,作为参考。

    用户2292346
  • 在未来的大数据和机器学习领域,获得一份不错的工作?

    AI 的发展脚步会加快,这一年将是 AI 技术重生和数据科学得以重新定义的一年。对于雄心勃勃的数据科学家来说,他们如何在与数据科学相关的工作市场中脱颖而出?会有...

    用户2292346
  • Github项目推荐 | 比快更快!速度超越OpenCV的人脸检测库 libfacedetection 开源!

    libfacedetection是一个用于图像中人脸检测的开源库。人脸检测速度可达1500FPS。

    AI研习社
  • 秒级容灾,UCloud内网高可用服务之三代架构演进

    在无人化超市选购完成进行结账时,结账页面突然卡住,无法完成购买操作。这时该选择放弃手中的商品or继续等待?

    SDNLAB
  • (11)James Stewart Calculus 5th Edition:Infinite Sequences and Series

    哎,其实很多一样的东西 在不同学科,翻译成中文,都翻译得变样了 如果从小都学英文课本 该是多么好的一件事情啊!!

    dodo_lihao
  • python多线程学习

    1、函数式:调用thread模块中start_new_thread()函数来产生新线程。

    py3study
  • Java Wait错误用法

    为什么会是这样的结果呢?按道理来说, 应该是下面这个结果才对呀。它为什么会在1号线程等待的时候,2号线程运行了呢,它不应该是要等待1号线线程中的锁释放了...

    用户7046206
  • 吴琛:智慧工地——履约考勤系统的应用实践

    大家下午好,我主要是针对智慧工地履约考勤系统的应用实践跟大家进行一次交流。这次的讲解分六个部分,前沿,产品分析,系统架构,主要技术,功能分析,应用展望。做一款产...

    云加社区技术沙龙
  • 【iOS 开发】防止 UIWindow 延迟释放占用状态栏

    在展示 app 启动广告等情况下,我们可能需要在界面上叠加一个 UIWindow,但是实测情况下发现,由于 UIWindow 会被系统引用导致延迟释放,在 cu...

    KyXu

扫码关注云+社区

领取腾讯云代金券