首页
学习
活动
专区
工具
TVP
发布

大数据文摘

专栏成员
5574
文章
4221462
阅读量
255
订阅数
Hadoop创始人聊数字化变革:性能和成本不再是唯二的考虑因素
在今年的腾讯全球数字生态大会上,腾讯介绍了AI、5G等技术领域的最新进展,还请出了Hadoop创始人Doug Cutting站台,讲述了他对于数字化变革的看法。
大数据文摘
2020-09-17
7690
3大技能助你成为超级数据科学家!(附链接)
令人惊讶的是,我得到了许多来自不同行业的顶级数据科学家的回应,他们都分享了他们的想法和建议,都很有意思且实用。
大数据文摘
2019-07-02
4480
专访Cloudera首席技术官:大数据创企,别再做底层基础平台了
按要求转载自36kr 作者 | 夜叶 几年前,大数据还只是新兴概念,现在数据早成行业和公司眼里的香饽饽,从底层基础平台,中间层通用技术,到上层行业应用,大数据产业链条日臻完善。 作为马云口中构建未来智能世界三个最主要要素之一,大数据自身是衍伸发挥的生产资料来源,而对数据的存储、计算又是整个大数据生态的基石,底层基础平台主要就解决这个问题。 而论及底层技术Hadoop领域,就得说到明星公司Cloudera,今年4月底已在纽交所上市。 Cloudera是首家将Hadoop商用的公司,以提供开源Hadoop发
大数据文摘
2018-05-25
6840
对话Hadoop之父Doug Cutting: Hadoop是无心插柳的惊喜,其在AI时代仍有想象力
大数据文摘作品,转载要求见文末 大数据文摘记者:钱天培 提到大数据, Doug Cutting可能是最应该被记住的角色。他十年前的作品Hadoop运用分布式存储、运算技术为大数据处理带来了巨大突破。 1985年毕业于斯坦福大学,Doug Cutting先后任职于Xerox、Architext、Yahoo和Cloudera,并开发了全球首个全文文本搜索的开源函数库Lucene、著名的开源搜索引擎Nutch,以及他最引人瞩目的作品Hadoop。 7月13日至15日,全球数据盛会Strata Data Con
大数据文摘
2018-05-24
7830
16位天才的思维创造让数据科学更简单
选文|姚佳灵 文字部分翻译|吴怡雯 图片翻译及制图|田晋阳 ◆ ◆ ◆ 前言 你知道回归的概念大约是在200年前提出来的吗? 直到我决定涉足分析学的光辉历史,我也是不知道的。是的!如今我们在用的一些概念都是几个世纪前提出的。在我回顾这段历史的时候,发现那些真正的天才,他们天生渴望分享知识和挑战那些改变世界未来的概念。 通过阅读他们的人生故事,我发现这些天才身上都有一个共同点。那就是所有的这些天才有着强烈的刨根问底的精神,比如:他们永远不会满足自己所知道的。相反,他们感兴趣的是为什么事情会如此这般地发
大数据文摘
2018-05-24
3370
在Twitter“玩”数据科学是怎样一种体验
作者:Robert Chang 转自:英明泰思基金会(Intetix) ◆ ◆ ◆ 引子 2015年6月17日是我在Twitter工作两周年的纪念日。回想起来,两年间,数据科学在Twitter的应用方式和范围发生了很大变化: 许多Twitter的非机器学习主导的核心产品中,机器学习的比重正在不断增加(例如“While you were away” 功能——Twitter把你下线时可能错过的头条推文推送到你的个人首页)。 工具的智能化上,Pig已经过时了,现在的数据流水线都是用Scalding(建立在串联
大数据文摘
2018-05-24
4760
[干货]手把手带你了解实时看板(50PPT)
来源|Slideshare 作者|Jen Underwood(微软高级程序经理) 翻译|王翕然 校对|康欣 编辑|Ivy 实时看板开发最佳实践 其他贡献者 本文有6个部分:现实中的实时
大数据文摘
2018-05-23
2.3K0
专访携程李亚锋:大数据技术融合下的Spark更具魅力
“大数据”作为当下最火热的IT行业词汇,在主流的数据处理工具当中Hadoop和Spark都被大家所熟悉。不过,目前基于内存计算的Spark适合各种迭代算法和交互式数据分析,能够提升大数据处理的实时性和
大数据文摘
2018-05-23
5200
Cloudera将于4月底登陆纽交所,基于Hadoop的商业公司前景何在?
大数据文摘作品,转载要求见文末 编译 | 姜范波,Yawei “ 当地时间2017年3月31日,Cloudera,这家建立在开源项目Hadoop之上的商业公司终于公布了其备受期待的IPO备案,在公布的文件中,曾经大力支持它的英特尔也成为了其最大的股东。 这将是继Snapchat之外,今年又一个备受瞩目的高科技IPO。 ” 虽然名字里有一个“云”,Cloudera并不是一个真正的云公司。它是一个建立在开放源代码Hadoop项目之上的商业产品,hadoop的公司吉祥物是一只可爱的大象。在数据量越来越大的时代(
大数据文摘
2018-05-22
4770
后Hadoop时代的大数据架构
感谢董飞先生投稿,推荐关注其知乎专栏 【董老师在硅谷 http://zhuanlan.zhihu.com/#/donglaoshi】 提到大数据分析平台,不得不说Hadoop系统,Hadoop到现在也超过10年的历史了,很多东西发生了变化,版本也从0.x进化到目前的2.6版本。我把2012年后定义成后Hadoop平台时代,这不是说不用Hadoop,而是像NoSQL (Not Only SQL)那样,有其他的选型补充。我在知乎上也写过Hadoop的一些入门文章 如何学习Hadoop - 董飞的回答,为了给大家
大数据文摘
2018-05-22
8790
对话Hadoop之父Doug Cutting|大数据和开源的未来
前言 对中国大数据产业来说,2016年是从垂直领域野蛮生长到爆发全国范围关注热潮的一个转折点。不论是人山人海巨头云集的贵阳数博会,还是首次在华举办的全球顶级大数据会议Strata + Hadoop World,都揭示了中国大数据产业发展的澎湃动力。 在Hadoop生态领域,Cloudera是规模最大、知名度最高的企业,也是当前大数据领域最强有力的解决方案服务商之一。带着对中国大数据市场的满满诚意,Cloudera创始人、董事长兼首席战略官Mike Olson以及Hadoop之父、Cloudera首席架构师
大数据文摘
2018-05-22
7340
Hadoop创始人Doug Cutting谈未来大数据的技术
图为Hadoop创始人Doug Cutting Cloudera首席架构师就内存及云计算相关技术发表讨论,Hadoop将如何在大数据方面发挥更大价值。 在Doug Cutting十年前创建Hadoop架构的时候,他从未想过这会为企业界带来如此超大规模的计算。“毫无疑问,我当初预想的情况比我们现在所看到的要稍微保守一些。“他在近期伦敦的Strata+Hadoop World大会上说。 在今天,Hadoop被很多家喻户晓的名字使用,它帮助Facebook分析其每月超过16亿的用户流量,帮助VISA发现了数十亿美
大数据文摘
2018-05-22
9150
德勤:大数据时代下的新商务战略
“一旦我们决定主动采取行动而非被动反应,可能性将数不胜数。” 乔治 ·萧伯纳 大数据蕴藏着各种可能性。但套用乔治·萧伯纳的上述名言,企业领导者应如何主动采取行动而非被动反应呢?追求价值最大化的过程中,企业应主动出击,未雨绸缪。在适当的时机,通过大数据能够及时洞察在小数据中难以发现的新兴趋势,使企业在制定战略时更具前瞻性。 大数据应用现状 大数据的发展空间 事实上,在竞争激烈的环境中,大数据可能会迫使企业采取行动,而非被迫做出反应。然而,假设企业已对大数据应用的优势与相应成本做出审慎权衡,
大数据文摘
2018-05-22
5260
大数据浪潮下,前端工程师眼中的完整数据链图
本文系投稿作品 作者 | 陈屹 版权归作者所有,转载请联系作者 大数据文摘欢迎各类优质稿件 请联系tougao@bigdatadigest.cn 马云曾经说过『人类正从IT时代走向DT时代』。正如他说言,今天几乎所有的互联网公司背后都有一支规模庞大的数据团队和一整套数据解决方案作决策,这个时代已经不是只有硅谷巨头才玩数据的时代,是人人都在依赖着数据生存,可以说如今社会数据价值已经被推到前所未有的高度。 我作为一名前端工程师在阿里巴巴数据团队工作多年,深入了解数据生产加工链路与产品化。我们这群前端是与界面最
大数据文摘
2018-05-21
9730
基于Hadoop集群的大规模分布式深度学习
转自|CSDN:http://www.csdn.net/ 前言 在过去的十年里,Yahoo一直持续投资建设和扩展Apache Hadoop集群,到目前为止共有超过4万台服务器和600PB数据分布在19
大数据文摘
2018-05-21
1.8K0
Hadoop如何通过IT审计(下)?
内容: 1. 决策摘要 2. IT和企业风险环境 3. 越来越多的IT规范 4. Hadoop的职能 a. 安全 b. 灾难恢复和业务连续性 c. 资料管理:监督和法律要求 5. 额外要求 6. 关键要点 接上文: 在企业IT中,与植根于存储环境的企业数据管理相关的风险控制和法规遵从是非常普遍的。在该情况下,一些基本功能可以直接应用于数据之上。这些基本功能包括: 1. 数据保护。在主要存储设备或更多得是在二级存储设备上创建并维护备
大数据文摘
2018-05-21
7270
[译]一图以蔽之:Hadoop在大数据企业应用中的崛起
大数据文摘翻译作品 翻译:孙沁 校对:康欣 欢迎个人转发朋友圈;其他机构或自媒体转载,务必后台留言,申请授权 对于试图分类和整理大数据科技,特别是 Hadoop的那些企业,这是一个振奋人心的全新信息图
大数据文摘
2018-05-21
5860
如何选择满足需求的SQL on Hadoop/Spark系统
作者|梁堰波 感谢“明略数据”的投稿,只要是“干货”大数据文摘就愿意发表,也欢迎各位读者参与评论,点击文末右下角“写评论”即可。 在批处理时代,Hive一枝独秀;在实时交互式查询时代,呈现出的是百花齐放的局面。Hive onTez, Hive on Spark, Spark SQL, Impala等等,目前看也没有谁干掉谁的趋势。引用今年图灵奖得主Michael Stonebraker的话说,现在的数据库领域已经不是”one size fit all”的时代了。那么面对这么多系统,我们改如何选择呢?这里谈谈
大数据文摘
2018-05-21
1.2K0
你必须知道的9大Hadoop公司
大数据文摘翻译:超伦,校译:甄艾庄(转载请保留) 如果你有大量的数据,那么Hadoop已然,或者即将应当进入你的视野。 当下最时髦且富有盛名的大数据管理系统原来只用在像谷歌、雅虎这样的互联网大咖,现在已经逐渐渗透到众多企业中。原因主要有以下两点:1)企业也在产生越来越多需要管理的数据,而Hadoop是一个非常棒的平台,特别是它能够合并遗留的旧数据,新数据和非结构化的数据。2)很多的围绕Hadoop提供支持和服务的供应商出现,促使Hadoop更适用于企业; “Hadoop作为一个开源平台自由成长,深入到企业数
大数据文摘
2018-05-21
4.2K0
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档