首页
学习
活动
专区
工具
TVP
发布

鸿的学习笔记

专栏作者
330
文章
280311
阅读量
49
订阅数
现代元数据平台
这是一个新概念:The Modern Metadata Platform,直译就是现代元数据平台。这个概念是伴随着 Modern Data Stack 概念而生,是其中的一部分。
哒呵呵
2022-03-11
5390
简评 WhereHows 为什么失败
DataHub 是由领英的数据团队开源的一款提供元数据搜索与发现的工具。现在的 DataHub 是由 WhereHows 演变过来的。
哒呵呵
2021-12-18
7830
闲话 Spark 的一个重要改变
最近看到了 Apache Spark 发布了 3.2 版本的预告 Pandas API on Upcoming Apache Spark™ 3.2,文章写得很简单,但是体现了 Spark 的一个很重要的发展趋势,就是拥抱 Python 的数据科学社区。
哒呵呵
2021-10-19
7040
闲聊Airflow 2.0
在 2020 年 12 月 17 日 Apache Airflow 团队发布了 Apache Airflow 2.0.0。当时就想写写 Airflow 的新特性,但是粗略的看了下《Apache Airflow 2.0 is here!》这篇文章,发现 Airflow2.0 是一个超级大的版本更新,不仅仅 UI 更新了,最核心的组件 Scheduler 性能也有了极大的提升,分布式环境下的高可用模型也做了改变,同时还有 Airflow 上的 Operator 和 Hook 也做了新的分门别类,对于这个版本在复杂的生产环境下是否能稳定运行,感到一丝怀疑,遂后面没有在关注了。
哒呵呵
2021-08-12
2.5K0
谷歌的 Spanner 数据库是如何一步步支持 SQL 语法的
Spanner 之前是一个键值数据库,与现在谈论的 Spanner 是完全不同的东西。在设计之初,Spanner 就支持事务、外部一致性和透明的故障转移。到后面,Spanner 开始支持带类型的数据库表结构和其它的一些关系型数据库功能,以及支持了 SQL 功能。而现在我们正在努力改进 SQL 语法的兼容性和关系型数据库功能。
哒呵呵
2020-08-05
1.1K0
分析 Google Cloud Spanner 的架构
在2005、2006年期间,谷歌内部大规模使用了 MySQL 数据库。其中Google Adwords (谷歌广告部门)使用了 90 多个 MySQL Shards(分片)集群方案存储数据,是谷歌内部使用 MySQL 数据库的最大的部门之一。由于系统维护的原因,谷歌广告部门重新规划了 MySQL 集群,整个过程花了 2 年时间。因为谷歌知道它们的数据增长的非常快,再使用 MySQL 这类数据库到未来的某个时刻会非常痛苦。这就是 Spanner 的诞生原因。
哒呵呵
2020-02-19
3.2K0
闲聊数据交换的历史和现状
IBM 在 1960 年代发明了数据库,也就是 SystemR 。过了一段时间到了 1970 年代,数据库里面有了足够多的数据后,自然而然就有了数据交换(data exchange)的需求。1972 年 IBM 的 Fortran 编译器开始支持以逗号为分隔符的 CSV 文件格式为核心进行数据交换,于是由数据库导出数据到 CSV 格式文件,或者由 CSV 格式文件导入数据到数据库便成了数据交换历史的开端。
哒呵呵
2020-02-11
9760
EasyDB:无需服务器,一键创建的数据库
博主在阅读2019年11月22日这一期的 DB Weekly 的时候,注意到一篇关于数据库的文章,感觉非常有趣,分享给读者们。
哒呵呵
2019-11-29
2K0
Koalas,构建在 Apache Spark 之上的 Pandas
今天和大家简单聊下 Koalas 。简而言之,Koalas 试图在 Spark 之上提供一个和 Python 的 Pandas 一样接口的包。笔者在第一次接触到 Koalas 时非常惊艳,因为这意味着 Python 数据科学领域的生态圈里很多常用的包都可以直接应用在 Spark 之上,使分析师、数据科学家可以使用自己熟悉的工具操作大数据,而不需要重新学习。简直就是 killer package!
哒呵呵
2019-11-19
1.1K0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档