首页
学习
活动
专区
工具
TVP
发布

华章科技

专栏成员
2207
文章
2433054
阅读量
126
订阅数
终于有人把HDFS架构和读写流程讲明白了
导读:HDFS(Hadoop Distributed File System)是一种分布式文件系统,可运行在廉价的硬件上,能够处理超大文件以及提供流式数据操作。HDFS具有易扩展、高度容错、高吞吐量、高可靠性等特征,是处理大型数据集的强有力的工具。
IT阅读排行榜
2023-02-13
2.5K0
盘点13种流行的数据处理工具
作者:所罗伯·斯里瓦斯塔瓦(Saurabh Shrivastava)、内拉贾利·斯里瓦斯塔夫(Neelanjali Srivastav)
IT阅读排行榜
2022-01-20
2.5K0
硅谷企业的大数据平台架构什么样?看看Twitter、Airbnb、Uber的实践
Twitter是最早一批推进数字化运营的硅谷企业之一,其公司运营和产品迭代的很多功能是由其底层的大数据平台提供的。图7-2所示为Twitter大数据平台的基本示意图。
IT阅读排行榜
2021-06-01
7170
【干货】全球大数据领域顶级开源工具汇总
Apache的Hadoop项目已几乎与大数据划上了等号。它不断壮大起来,已成为一个完整的生态系统,众多开源工具面向高度扩展的分布式计算。
IT阅读排行榜
2018-08-17
5820
成为大数据顶尖程序员,先过了这些Hadoop面试题!(附答案解析)
导读:在大数据开发岗位的需求下,工资待遇水涨船高,不少编程人员在面对职业瓶颈期的时候,会选择转编程方向发展。
IT阅读排行榜
2018-08-17
4450
巧用MapReduce+HDFS,海量数据去重的五大策略
重复数据删除往往是指消除冗余子文件。不同于压缩,重复数据删除对于数据本身并没有改变,只是消除了相同的数据占用的存储容量。重复数据删除在减少存储、降低网络带宽方面有着显著的优势,并对扩展性有所帮助。
IT阅读排行榜
2018-08-16
1.4K0
干货:Spark在360商业数据部的应用实践
随着数据规模的持续增长,数据需求越来越多,原有的以MapReduce为代表的Hadoop平台越来越显示出其局限性。主要体现在以下两点:
IT阅读排行榜
2018-08-16
7880
Hadoop没有消亡,它是大数据的未来
有人认为 Hadoop 正在失败,但硅谷数据管理公司 Hortonworks 的总经理 Vamsi K. Chemitiganti 并不这么看,为了反驳此前一篇文章《为什么 Hadoop 正在消亡?(Why Hadoop is Failing)》的观点,他在自己的博客上写了一篇论述自己看法的文章,他认为达尔文式的开源生态系统正在确保 Hadoop 成为稳固和成熟的技术平台。机器之心对这篇反驳文章进行了编译介绍,但本文内容并不代表机器之心的观点。
IT阅读排行榜
2018-08-16
2500
干货 | 从底层到应用,那些数据人的必备技能
目前很火,数据源头,各种炫酷新技术,搭建Hadoop、Hive、Spark、Kylin、Druid、Beam~,前提是你要懂Java,很多平台都是用Java开发的。
IT阅读排行榜
2018-08-16
2820
300亿条出租车数据里的五大秘密:上海8点13分最堵,司机凌晨喜欢把车停靠在…
上海强生出租车公司的出租车每隔10秒钟会自动向总部的服务器发送一条数据,记录自己所在的经纬度、车速、车内是否有人、行驶方向等信息。2015年上海政府公开了4月一整月的出租车数据,足足有300多亿条,占空间300多G。这些数据被导入了我们的Hadoop平台,以便后续研究。以下是我们初步探究发现的秘密。
IT阅读排行榜
2018-08-16
1.2K0
大数据投资人必读:中国大数据发展与投资分析报告
当前,全球已进入大数据时代,大数据正以一种革命风暴的姿态闯入人们视野,其技术和市场在快速发展,而驾驭大数据的呼声则一浪高过一浪。随着大数据蕴涵价值的逐步释放,使其成为IT信息产业中最具潜力的蓝海。鉴于在技术和产业层面,国际上在大数据领域还未形成技术和市场的垄断,技术应用创新机会较多;当前大数据技术和应用需求的蓬勃兴起,及开源技术提出的革命性挑战,各家IT厂商均需同等面对,这无形中缩短了彼此起步的差距,这意味着国内企业在开拓大数据市场上存在巨大的机遇!
IT阅读排行榜
2018-08-15
1.2K0
一文读懂大数据:Hadoop,大数据技术及相关应用
你想了解大数据,却对生涩的术语毫不知情?你想了解大数据的市场和应用,却又没有好的案例和解说?别担心,这本来自Wikibon社区的小书想要帮你。
IT阅读排行榜
2018-08-15
4590
IT屌丝如何成为数据科学家?
数据科学家被《财富》杂志誉为21世纪最性感的职业,但遗憾的是大多数企业里都没有真正的数据科学家人才。根据麦肯锡报告,仅仅在美国市场,2018年大数据人才和高级分析专家的人才缺口将高达19万。此外美国企业还需要150万位能够提出正确问题、运用大数据分析结果的大数据相关管理人才。
IT阅读排行榜
2018-08-15
2720
2分钟读懂大数据框架Hadoop和Spark的异同
谈到大数据,相信大家对Hadoop和Apache Spark这两个名字并不陌生。但我们往往对它们的理解只是停留在字面上,并没有对它们进行深入的思考,下面不妨跟我一块看下它们究竟有什么异同。
IT阅读排行榜
2018-08-15
3330
上班族每次在地铁上花费37分钟,经过9.78站|2号线是上海经济命脉|上海地铁数据趣味研究
副院长最近让我院的攻城狮订阅了上海交通卡一个月的刷卡数据到我们的服务器上。副院长用很高级的算法从这4.1亿条刷卡数据中归纳出了每个上班族的早高峰乘坐地铁的习惯,从中筛选出每个人上班的常规线路。废话不多说,直接上我们的干货结论:
IT阅读排行榜
2018-08-15
8150
Hadoop创始人Doug Cutting谈未来大数据的技术
Cloudera首席架构师就内存及云计算相关技术发表讨论,Hadoop将如何在大数据方面发挥更大价值。
IT阅读排行榜
2018-08-15
2770
创业者如何抓住大数据行业的风潮?
对于大数据项目,投资人到底看什么?在写这篇文章之前,我们与多家投行的投资人曾经做过访谈,下面是我们根据访谈内容整理出来的内容。
IT阅读排行榜
2018-08-15
2360
你的大数据项目的工具用对了吗?
工具/产品/解决方案是数据科学家洞察数据的利器。KDNuggets网站对此观点进行了年度调查,来分析数据科学家在用哪些类型的工具,并提供了调查的匿名原始数据。
IT阅读排行榜
2018-08-14
4950
大数据圈盘点:你不知道的15个新技术
下面一起来看看吸引眼球的十五项大数据公告。虽然罗列了很多,但还不是全部内容,只是最近在加利福尼亚州圣何塞市Strata + Hadoop World大会上亮相的部分技术。
IT阅读排行榜
2018-08-14
6930
大数据的理想与现实之间
我与数据打了25年的交道,经历了从电信、网通到联通的多次重组,亲身参与了数据专业线从弱势群体逐渐发展壮大的全过程。一直想找个机会,谈谈我的体会,但是没有下这个决心动笔。最近,受范总原创《“一篇文看懂H
IT阅读排行榜
2018-08-14
4790
点击加载更多
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档