2017大数据领域十大必读书籍

历史大浪淘沙经过5次信息革命,终于迎来大数据时代,给信息领域灌入了强劲的血液,催生了很多新生力量,而各行各业谁也无法离开数据存活。尤其近几年来,全球范围内掀起了一股“大数据”热,各地政府、大小企业都在布局大数据,抢占先机。这个局到底怎么设,很少有人能说出清晰的脉络。一个新事物的出现,除了带给人们惊喜之外,还有毫无思绪的迷茫。

据可靠数据显示,截止到2016年,全国的大数据人才只有46万,未来3-5年人才缺口高达150万之多。市面招聘网站上都在争抢大数据人才,有3-5年工作经验的数据分析师年薪直接高达50万元,但是能找到的确是寥寥。高校培养大数据人才仍是初步阶段,短期内无法快速输出人才。

相信身边有很多应届毕业生以及想转行大数据的,状态大多都是:万脸懵逼。

老司机教你:看书、写代码、多交流。  

2016年马上就过完,你看了几本书呢?小编为大家精心挑选了大数据领域里十本有价值的书,先干掉这几本书,再和老司机谈大数据!不过,像《大数据时代》、《数据之巅》等这些经典到“烂大街”的书我就不一一推荐了,很多人都看过,没看过的也都听说过。

一、《Presto技术内幕》

Presto是Facebook开发的数据查询引擎,基于Java语言开发的,专门为大数据实时查询计算而设计和开发的产品,更是大数据实时查询计算产品的佼佼者,比Spark、Impala更加简单、高效。

《Presto技术内幕》由浅入深地详细介绍了Presto的安装过程、内部运行原理机制、功能特性、性能优化方法,以及在应用过程中常见的问题及解决方案等,可用于多种数据源混合进行实时大数据分析计算,使一些使用其他大数据技术不能解决的业务场景有了一个全新有效的解决方案。

在最后的附录部分不仅对 Presto 使用过程中出现的各种问题给出了明确的解决方案,还对 Presto中的各个配置参数的含义和作用进行了详细的说明并给出了推荐配置值

作者: JD-Presto 研发团队 ,是京东众多研发团队中的一员,在开源软件领域获得多项大奖

适读人群: Presto技术狂热者&攻城狮、对京东技术内幕好奇的小伙伴

亮点:

市面上第一本详细介绍Presto技术的书籍,可单点突破。

浓缩了京东在开源领域深耕多年的实战经验

京东CTO张晨、京东首席技术顾问翁志等技术大牛重磅推荐

Presto 使用过程中的各种问题都给出明确的解决方案

对Presto中各个配置参数的含义和作用进行详细的说明并给推荐配置值

二、《为数据而生》

读完《为数据而生》,你会清楚的看到中国在大数据道路上所留下的轨迹,主要包括在智慧城市、科技、医疗、教育、商业、金融等领域的实践。书中分别阐述在大数据1.0、大数据2.0和大数据3.0时代下,相对应的数据分析需要做到分析、外化、集成:

分析,这里作者提供了一套基本的大数据分析框架:确定问题和指标, 清洗数据, 特征提取和选择, 模型训练, 模型融合。

外化,借助外部数据,将两个看起来毫不相干的事物通过数据挖掘建立联系。

集成,主要讲企业、政府如何收集数据、标准化数据,以及最后如何商业化。

未来中国的大数据发展提供一条清晰且可行性的路径指南!

简言之,看了这本书,不管是企业或者政府,都可以看到大数据比较清晰且可实现的一条路径。

作者:周涛,天才少年,电子科技大学最年轻教授,中国大数据领域的传奇人物,创办数之联、数联铭品、国信优易、DataCastle等20多家公司,公司总市值高达百亿。

适读人群:大数据爱好者、政府人员及苦于转型中的企业管理者

亮点:

手把手教企业如何蜕变成一个真正的大数据企业

大数据3.0时代究竟要如何应对

为数不多的把实操、理论都讲明白的书

三、《智能时代》

《智能时代》回顾了科学研究发展的四个范式,用实例证明了数据在科学发现中的位置。这本书作者分七章从不同角度对大数据进行介绍,分别以技术和思维方式的改变为主线,从工业革命这个角度嵌入,顺理成章的延伸出大数据与智能化,但是没有将过多笔墨放在技术的深究上,而是选择从应用层面体现大数据的理念。大数据应用则会渗透到各行各业,这正是作者的用心之处。

作者:吴军,原腾讯副总裁。吴军博士是当前Google中日韩文搜索算法的主要设计者。除了《智能时代》,还著有《数学之美》、《浪潮之巅》和《文明之光》。

适读人群:研究大数据应用的一线实践者、人工智能爱好者

亮点:

深入浅出,用吃瓜群众都能看懂的语言讲生涩难懂的大数据和人工智能

逻辑性强,你能想到问题,作者都备好了答案

雷军、罗振宇、涂子沛、李善友、邬贺铨院士联袂推荐

四、《R语言预测实战》

R语言横跨了金融、生物、医学、互联网等多个领域,主要用于统计、建模及可视化。由于上手快、效率高,备受技术人员青睐。预测是大数据挖掘的主要作用之一,借助R语言来做大数据预测,可以兼具效率与价值于一身。

《R语言预测实战》主要分为预测基础、预测算法、预测案例三大部分。从入门级的阐述逐渐过度到深入分析,抽丝剥茧般的讲明白了用R语言预测的诸多问题。

作者:游皓麟,知名高级数据分析师

适读人群:R语言数据分析师、R语言研究大数据预测的入门者

亮点:

市面上为数不多的系统讲解R语言预测专题的书籍

可以get到做R语言预测时的基本步骤和方法思路,还有更多技术细节

五、《医疗革命》

在医学大数据时代,数据技术带来了临床医学科研的革命性进步。《医疗革命》通过对医疗数据挖掘的基本理论的阐述,将现代统计学与数据挖掘技术有机结合,讲述了大量的医学数据挖掘的案例,提供了大量的医学数据挖掘的实操方法。本书以数据挖掘与模式识别的七大原理在临床医学中的运用案例为切入点,系统而全面地介绍了医学数据挖掘的基本方法与原理,对数据分析的常用算法进行了通俗易懂的讲解。

作者:邵学杰,中国医学大数据概念提出的实践者与先行者,医学数据挖掘的先行者

适读人群:医疗数据挖掘爱好者、临床研究者、 医疗大数据初学者

亮点:

将统计学与医学深度结合,首次提出医学数据模式识别的七大原理

实操技术与案例分析相结合,起到很好的技术示范作用

六、《大数据处理之道》

市面上流行的大数据处理技术已经有数十种了,从最初的Hadoop到Spark,再到Storm,到底哪个战斗力更强?《大数据处理之道》分析比较了当下流行的大数据处理技术的优劣及适用场景,包括Hadoop、Spark、Storm、Dremel、Drill等,详细分析了各种技术的应用场景和优缺点;同时阐述了大数据下的日志分析系统,重点讲解了ELK日志处理方案;最后分析了大数据处理技术的发展趋势,重点从各种技术的起源、设计思想、架构等方面阐述大数据处理之道。

在日志分析方案遍地开花的大数据时代,这本书能够帮助你更理性的做出决策。

作者:何金池, IBM高级软件工程师,熟悉大数据领域内的各项热门技术,具有多年的一线软件研发测试经验

适读人群:软件开发、大数据测试人员

亮点:

全。几乎涵盖所有的大数据处理热门技术

易懂。语言诙谐,大数据处理技术与应用场景并在,初学者好上手,专业人士可系统的扩展知识

预测。对未来新的大数据处理技术发展趋势进行了预测

七、《大数据基础与应用》

数据本身没有丝毫意义,通过统计、分类、萃取、特征抽取等一系列技术手段才能实现其价值。大数据技术是实践性比较强的技术,需要重视工具和应用方法的选择与研究。《大数据基础与应用》作为大数据技术入门的参考书,为小白读者提供了一次系统学习大数据理论知识的机会。

作者:陈明,中国计算机学会理事、中国人工智能学会理事。

适读人群:大数据技术小白

亮点:

基础≠不重要,大数据初级必须要掌握的理论知识都在这里

各章独立阐述,读者可根据自己的需求,有侧重的加强学习

八、《超越大数据》

把社交数据、移动数据、位置数据与主数据结合起来, 可以实现与现有客户建立更加密切的关系、采用合适的产品, 改进寻找的定位新客户的方法、更加深入地了解客户的想法以及对产品的看法等,而《超越大数据》将教你如何通过社交主数据管理深入了解客户。

作者:马丁·奥博欧佛,企业信息架构领域,面向全球大客户的执行架构师

适读人群:企业决策者、大数据架构师

亮点:颠覆了传统的业务数据处理

九、《爆发》

《爆发:大数据时代预见未来的新思维》揭开了人类行为背后隐藏的模式“爆发”,大胆的提出人类有93%的行为都是可预测的,是一本超越《黑天鹅》惊世之作。爆发模式的揭示,其影响力将与20世纪初期的物理学或者基因革命的影响力不相上下。你可以把它当成一本历史小说来看,也可以当成科技读物,社会是一个巨大的数据库,这里所有的数据、科学以及技术都联合起来共同对抗那个很大的谜题——我们的未来。

作者:巴拉巴西,全球复杂网络研究,无尺度网络的创立者。世界著名科技杂志《popularscience》杂志称,“他可以控制世界”。

适读人群:大数据爱好者、乐于探索历史与未来的人

亮点:

神秘色彩十足

观点极具颠覆性

十、《大数据技术概论》

《大数据技术概论》全书共分成11章分别介绍了大数据概论、大数据采集及预处理、大数据分析、大数据数据可视化、Hadoop概论、HDFS和Common概论、MapReduce概论、NoSQL技术介绍、Spark概论、云计算与大数据、大数据解决方案相关案例等内容。每一章中均附有相关术语的注释,方便读者查阅和自学。

作者:娄岩,海归三年,中国医科大学教授,IT专家,作家。

适读人群:大数据小白、培训机构、企划管理人员

亮点:适合自学

其实,上面的书整体都是偏入门的,希望大家认真读完,但这对于大数据来说仅仅是杯水车薪。大数据需要的是复合型的人才,只有不断学习新技术,不断拓展自己,方能跟上技术的脚步,不被时代变革所淘汰!别放弃,小编为大家整理了一部分的学习资源,根据需要可自行索取哟~

原文链接:http://bigdata.evget.com/post/761.html

编辑于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏PPV课数据科学社区

【应用】大连接-大数据下的社交网络

人类连接在一个巨大的社会网络上,我们的相互连接关系不仅仅是我们生命中与生俱来的、必不可少的一个组成部分,更是一种永恒的力量。正像大脑能够做单个神经元所...

2555
来自专栏腾讯研究院的专栏

“大数据”还不等于“大智慧”

  技术开发商和媒体早早地为我们描绘了一个即将来临的“大数据时代”。“大数据”无所不知无所不能;有了“大数据”的支持,公司运行效率突飞猛进;“大数据”还能帮你...

17510
来自专栏CSDN技术头条

不了解计算广告就难以真正理解大数据

大数据、人工智能技术变现的模式,当前首推在线广告。《计算广告》一书作者刘鹏(@北冥乘海生)近日接受了CSDN记者的专访,介绍了技术从业者需要如何响应计算广告的发...

1928
来自专栏机器人网

你的新同事——走出牢笼的机器人

下一代同事、新一代同事,无论你如何称呼,总之全球制造、仓储、物料搬运和供应链领域正掀起一场机器人革命。 —— 作者:艾斯本.奥斯特加, Universal R...

2694
来自专栏数据的力量

腾讯产品总监曹菲:为何我工作十年,内心仍无比恐慌?(强烈推荐)

17311
来自专栏华章科技

华为内部狂转好文,大数据,看这一篇就够了!

科技的进步在很多的时候总会超出我们的想象,试想如果未来我们一个人拥有的电脑设备超过现在全球现在计算能力的总和,一个人产生的数据量超过现在全球数据量的总和,甚至你...

561
来自专栏凌帅的阅读思考与实践

我们应该成长成什么样子?

随着互联网的发展,社会协作变得更加自由,每个人都变成了可以与任何人自由联接的一个节点。衡量一个人价值的方式,就和工业化时代有了根本性的变化:收入的增加不是由一个...

452
来自专栏互联网杂技

腾讯产品总监:为何我工作10年,内心仍无比恐慌?(强烈推荐)

很开心今天能够站在这里,做为馒头商学院开学典礼的第一位分享嘉宾。今天这个分享主题想过很久,做为早晨的第一课应该给大家醒醒脑,所以我的题目是《产品经理们,五年后,...

78516
来自专栏CDA数据分析师

为什么游戏遇上大数据后更易让人上瘾

本文转自网络,如涉及侵权,请及时联系我们 在一个学习编程的课堂上,老师让孩子们用类似“嗨,大家好,我是×××”的句式介绍自己,孩子们的介绍五花八门,李白、荆轲、...

2339
来自专栏服务端技术杂谈

独立开发者经验分享

作者:崔英杰 我曾经有9年做独立开发者,开发shareware,主要销往欧美,客户中不乏五角大楼,美国海军学院,微软,惠普, 美国众多州政府等等。(很可能有人觉...

2555

扫码关注云+社区