鸿的学习笔记

293 篇文章
36 人订阅

全部文章

哒呵呵

推荐一个学习和了解数据库知识的网站

最近发现一个有趣的网站,是专门收集世界上所有的数据库信息的网站,类似于维基百科性质的,名字也很有趣叫做Database of Databases,翻译成中文也就...

9210
哒呵呵

数据可视化应用 Apache Superset 最新进展的闲聊

最近一直在关注 Apache Superset,就顺势聊聊这款很流行的数据可视化应用。而且中文社区都只有 Apache Superset 使用和部署的教程,至于...

8410
哒呵呵

数据湖及其架构的一份笔记

数据湖(Data Lake)是一个存储企业的各种各样原始数据的大型仓库,其中的数据可供存取、处理、分析及传输。数据湖是以其自然格式存储的数据的系统或存储库,通常...

6410
哒呵呵

分布式系统的一个简单的学习框架

最近在看 Martin Fowler 网站上的Patterns of Distributed Systems系列文章,突然想到,是不是也写一篇文章简单梳理一些分...

5810
哒呵呵

关于编程语言的一篇闲笔

在电脑面前发了一会呆,发现不知道写些啥了,思来想去,那么便写写在平时在数据处理过程常用的三门编程语言吧。这三门编程语言分别是 Python、Scala 和 Ja...

5720
哒呵呵

谷歌的 Spanner 数据库是如何一步步支持 SQL 语法的

Spanner 之前是一个键值数据库,与现在谈论的 Spanner 是完全不同的东西。在设计之初,Spanner 就支持事务、外部一致性和透明的故障转移。到后面...

8120
哒呵呵

关于大数据和数据库的一篇学习笔记

这篇文章来自于我非常崇敬的一个学者 Martin Kleppmann(下文用马丁指代) 的一篇访谈,包含了很多有趣的观点,比如为什么要写Designing Da...

8720
哒呵呵

Oracle 数据库编程语言 PL/SQL 的历史

在世界编程语言排行榜里,PL/SQL 一直稳稳占据着前二十的位置。尽管我不是 Matthew Symonds,也与 Softwar 这本书无关,但我依然花费了大...

8320
哒呵呵

数据仓库体系梳理

数据仓库的分层设计是为了实现数据仓库的高性能、低成本、高效率、高质量使用。而且分层设计后会带来如下好处:

13020
哒呵呵

Python 之父说 Python 历史

这篇文章主要内容来源于 Python 编程语言的最初设计者及主要架构师 Guido van Rossum 的博客 The History of Python(h...

12440
哒呵呵

浅谈信息茧房的构建和破“茧”的一些思路

信息茧房这个概念起源于2006年出版的凯斯·桑斯坦的《信息乌托邦》一书。2006年的时候,“信息茧房”还是仅仅停留在概念阶段,其赖以成长的技术基础大数据技术也才...

12600
哒呵呵

写在 Spark3.0 发布之后的一篇随笔

Spark3.0 从2019年开始就说要准备发布了,然后就一直期待这个版本,毕竟对于 Spark 而言,这是一个大版本的跨越,从 2.4 直接到了 3.0,而之...

12510
哒呵呵

关于数据发现的一些实践经验

为什么要做数据发现工具呢?原因很简单,随着团队发展,我们的数据平台接入的数据量、数据种类、数据来源和数据库类型越来越多;数据多了之后,原本很多只能停留在想一想的...

12610
哒呵呵

大数据技术发展简史(第一篇万字长文)

在写这篇文章之前,断断续续地写过一些大数据组件的历史和它的一些评价,但是感觉不过瘾,历史本来就应该是连续的、有其内在的规律,便想写一篇文章总结大数据技术发展的历...

32120
哒呵呵

一部《计算机简史》,也是基建与动能的历史

关于《计算机简史》这本书,第一次了解到还是在图灵教育这个公众号上读到了余晟以为为其写的书评《计算机简史这门课,现在补,并不晚》。对于这篇文章里面的观点,比如“但...

7220
哒呵呵

一个典型的数据平台诞生和发展简史

为什么要搭建数据平台呢?这个问题的答案难也不难:对于小公司而言,数据量小、数据来源少,构建一个数据平台就有点杀鸡用牛刀了,博主认为使用传统的关系型数据库就可以解...

9620
哒呵呵

写在 Python 3.9 即将出世的前夕

今天读 PyCoder's Weekly( PyCoder's Weekly 会收集和整理一周内关于 Python 的最新文章和讨论,并发送给订阅者的邮箱)时候...

11910
哒呵呵

兢兢业业的日志不该被世人遗忘

前一篇文章聊了 Kafka 和日志,有读者希望我能更加深入的说下日志,解释下为什么没有日志这个概念,就没有现在的大数据,没有现在的数据库,为什么笔者会对日志这个...

7910
哒呵呵

Kafka 和隐藏在它背后的幽灵

趁着周末简单聊下 Kafka。Kafka 基本上已经成为了大数据领域里的消息系统的标配,仿佛做实时处理不知道或者不懂 Kafka 就落伍了一样。不过也确实如此,...

11210
哒呵呵

看得见的与看不见的 - 计算机科学里的 trade-off

政府或企业的每一个决策、每一次行动,甚至不经意间的个人行为都可能会对现实生活中造成影响,其中有些影响是立马可以感受到的,是看得见的,而有些影响是第一时间很难感受...

8420

扫码关注云+社区

领取腾讯云代金券