哒呵呵

LV0
发表了文章

一部《计算机简史》,也是基建与动能的历史

关于《计算机简史》这本书,第一次了解到还是在图灵教育这个公众号上读到了余晟以为为其写的书评《计算机简史这门课,现在补,并不晚》。对于这篇文章里面的观点,比如“但...

哒呵呵
发表了文章

一个典型的数据平台诞生和发展简史

为什么要搭建数据平台呢?这个问题的答案难也不难:对于小公司而言,数据量小、数据来源少,构建一个数据平台就有点杀鸡用牛刀了,博主认为使用传统的关系型数据库就可以解...

哒呵呵
发表了文章

写在 Python 3.9 即将出世的前夕

今天读 PyCoder's Weekly( PyCoder's Weekly 会收集和整理一周内关于 Python 的最新文章和讨论,并发送给订阅者的邮箱)时候...

哒呵呵
发表了文章

兢兢业业的日志不该被世人遗忘

前一篇文章聊了 Kafka 和日志,有读者希望我能更加深入的说下日志,解释下为什么没有日志这个概念,就没有现在的大数据,没有现在的数据库,为什么笔者会对日志这个...

哒呵呵
发表了文章

Kafka 和隐藏在它背后的幽灵

趁着周末简单聊下 Kafka。Kafka 基本上已经成为了大数据领域里的消息系统的标配,仿佛做实时处理不知道或者不懂 Kafka 就落伍了一样。不过也确实如此,...

哒呵呵
发表了文章

看得见的与看不见的 - 计算机科学里的 trade-off

政府或企业的每一个决策、每一次行动,甚至不经意间的个人行为都可能会对现实生活中造成影响,其中有些影响是立马可以感受到的,是看得见的,而有些影响是第一时间很难感受...

哒呵呵
发表了文章

计算应该与存储分离吗?

这篇文章构思了很久,因为我不是做计算机底层研究的,也没做过数据库,一直在应用层打转转,最多读过几篇相关的文章,所以担心我的知识储备不够写这么一篇比较严肃的话题,...

哒呵呵
发表了文章

不负责任的聊下 Apache Doris

应读者的要求,这篇文章简单聊聊 Apache Doris。说实话,Apache Doris 比前面提到的 Impala 、Presto 这些交互式查询引擎还要不...

哒呵呵
发表了文章

超越 MapReduce ,要比它更快!

前面介绍了大数据领域里的两个主流引擎:MapReduce 和 Spark 。它们开创了历史,使得世界进入了大数据时代,让很多公司能够处理庞大的数据,并从中找到更...

哒呵呵
发表了文章

趣谈交互式查询的历史之 Impala

接着上篇文章继续聊聊交互式查询,交互式查询崛起的原因是人类的懒惰本质,自从谷歌发表了 Dremel 论文后,相似的计算引擎不断地出现,在这篇文章里,针对几种典型...

哒呵呵
发表了文章

大数据领域里的独行侠-Dynamo风格数据库

上篇文章聊了下 Hbase ,这篇聊一下 Hbase 的“孪生兄弟”Dynamo风格的数据库,比如 Riak 、Cassandra。在大数据领域混的人大概都知道...

哒呵呵
发表了文章

简单聊聊 Spark 的诞生史

这篇文章是关于 Spark 的,说实话,我是很犹豫写这篇文章的,因为 Spark 在国内非常火,大牛不计其数并且相关的文章也数不胜数,要找准一个有趣的角度去畅抒...

哒呵呵
发表了文章

瞎扯 Hbase ,很多人都理解错了

今天扯一下 Hbase ,我对 Hbase 的了解起源于两篇文章Understanding HBase and BigTable和《李逵麻子,李鬼坑人--Big...

哒呵呵
HBase分布式数据库数据库SQLUnix
发表了文章

聊聊 Hadoop 生态圈的历史之 Hive

今天再聊聊 Hadoop 生态圈。话说前文已经提到了雅虎硬是用自己的业务把 Hadoop 搞出来了,最后也不知道什么原因把辛辛苦苦地弄出来的 Hadoop 给开...

哒呵呵
HiveHadoopMapReduceSQLZooKeeper
发表了文章

瞎扯 Hadoop 的历史

在大数据领域里,Hadoop 是谁都绕不开的话题,它基本上已经成为了事实上的标准,无论是什么企业或者是个人,闭源开始开源,都不得不兼容Hadoop生态圈,即使是...

哒呵呵
HadoopMapReduce开源大数据爬虫
发表了文章

谈谈 Spanner 和 NewSQL

关于昨天 Spanner 的文字,有人问 NewSQL 为什么会起名为 New,Spanner 的应用场景又是怎样的?那么这篇就顺着大数据的历史继续聊。

哒呵呵
MySQLNoSQL数据库SQL大数据
发表了文章

分析 Google Cloud Spanner 的架构

在2005、2006年期间,谷歌内部大规模使用了 MySQL 数据库。其中Google Adwords (谷歌广告部门)使用了 90 多个 MySQL Shar...

哒呵呵
JavaScriptAPI数据库MySQLSQL
发表了文章

我所了解的大数据的历史(2)

接着说谷歌,上篇文章提到了 GFS 。那么谷歌为什么要硬着头皮去啃分布式系统这块硬骨头呢?首先,我们要知道谷歌刚开始成立时是一家搜索公司,方便用户查询互联网上的...

哒呵呵
MapReduce存储数据库SQL开源
发表了文章

闲聊大数据是什么

今年回家有人问了我一个问题,大数据是什么?在这个领域里工作了这么久,竟然一时不知道怎么回答。是的,大数据到底是什么呢?每个人都在谈论,比如大数据分析、大数据XX...

哒呵呵
Hadoop大数据数据处理数据分析数据挖掘
发表了文章

使用 Airflow 帮助提升数据质量

Airflow 是属于 Apache 基金会的开源项目,可以帮助数据工程师构建完整的数据 ETL(数据抽取、转换和加载)流程。Airflow 使用 DAG(有向...

哒呵呵
FTP

个人简介

个人成就

  • 影响力总排行第 508 名
  • 获得 542 次赞同
  • 文章被阅读 48.8K 次

扫码关注云+社区

领取腾讯云代金券