首页
学习
活动
专区
工具
TVP
发布

EdisonTalk

本专栏主要聚焦.NET Core, 微服务, DevOps, 智能制造 及 MES/MOM 等内容,欢迎关注。
专栏作者
486
文章
414585
阅读量
58
订阅数
Hadoop学习笔记系列文章导航
  这是一个信息爆炸的时代。经过数十年的积累,很多企业都聚集了大量的数据。这些数据也是企业的核心财富之一,怎样从累积的数据里寻找价值,变废为宝炼数成金成为当务之急。但数据增长的速度往往比cpu和内存性能增长的速度还要快得多。要处理海量数据,如果求助于昂贵的专用主机甚至超级计算机,成本无疑很高,有时即使是保存数据,也需要面对高成本的问题,因为具有海量数据容量的存储设备,价格往往也是天文数字。成本和IT能力成为了海量数据分析的主要瓶颈。
Edison Zhou
2018-08-21
4430
Hadoop学习笔记—18.Sqoop框架学习
  Hadoop正成为企业用于大数据分析的最热门选择,但想将你的数据移植过去并不容易。Apache Sqoop正在加紧帮助客户将重要数据从数据库移到Hadoop。随着Hadoop和关系型数据库之间的数据移动渐渐变成一个标准的流程,云管理员们能够利用Sqoop的并行批量数据加载能力来简化这一流程,降低编写自定义数据加载脚本的需求。
Edison Zhou
2018-08-20
8010
Hadoop学习笔记—12.MapReduce中的常见算法
    "数据去重"主要是为了掌握和利用并行化思想来对数据进行有意义的筛选。统计大数据集上的数据种类个数、从网站日志中计算访问地等这些看似庞杂的任务都会涉及数据去重。
Edison Zhou
2018-08-20
1.1K0
Hadoop学习笔记—20.网站日志分析项目案例(一)项目介绍
  本次要实践的数据日志来源于国内某技术学习论坛,该论坛由某培训机构主办,汇聚了众多技术学习者,每天都有人发帖、回帖,如图1所示。
Edison Zhou
2018-08-20
7560
一朝入梦,终生不醒:再看红楼梦,也谈石头记
  红楼梦是我国四大名著之一,被众多学者冠以四大名著之首的美誉,也是我们从学生时代开始就被老师灌输需要阅读的经典书籍(虽然我们学生时代未必阅读或读完过)。古人曾说“开谈不说《红楼梦》,读尽诗书也枉然。”,你学的知识再多,看的诗书再多,如果没看过《红楼梦》,那也就不算真正的懂知识、不算真正的饱览群书。毛主席曾说:“不读五遍红楼梦,没必要发表评论”,也说“《红楼梦》不仅要当做小说看,而且要当做历史看”,而我才读两遍也有点感想,想无病呻吟发点文字(请原谅我的浅薄)。鲁迅也曾说“对于《红楼梦》,经学家看见《易》,道学家看见淫,才子看见缠绵,革命家看见排满,流言家看见宫闱秘事……”,再次说明一百个读者有一百个哈姆雷特,而对于红楼梦,我觉得应该是每个读者的每次阅读感受下来都是不同的哈姆雷特。我不是红学研究者,也不是文字高手,这里只是把我看到的东西,体会到的东西,写出来与各位分享,将来我还会阅读第三遍、第四遍以及第N遍。我坚信,在我人生的不同阶段去阅读我们国家的经典一定会有不同的感受,也会令我收获一些东西。
Edison Zhou
2018-08-07
9500
没有更多了
社区活动
RAG七天入门训练营
鹅厂大牛手把手带你上手实战
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档