木东居士

LV1
发表了文章

研发之路:结构化的思维体系

每次写周报、作汇报、发文章,都难免要讲到自己的日常工作,如何说清楚是一个不小的挑战,非常挑战结构化思维体系。

木东居士
发表了文章

OLAP数据库初探

OLAP的标准概念叫作“联机分析处理系统”,与之对应的是OLTP“联机事务处理系统”。OLTP对于事务性的要求非常高,常用于银行、证券等系统,但运行速度相对有限...

木东居士
发表了文章

数据百问系列:现在是否还看好大数据的发展

最近职业上遇到了很多困惑,感觉都在说大数据不行了,过了红利期,现在有点凉凉的感觉,也不知道是我的感觉还是行业就是这样。希望大家能够谈谈自己的看法和感受。

木东居士
发表了文章

数据百问系列:数据研发大多数工作都是在提数,如何破局?

听上去很高大上的大数据研发工程师/数仓仓库工程师,日常工作很多时候就是给产品/运营跑一下数据,他们要什么我们就提供什么,感觉枯燥且乏味。想请教一下,有没有什么更...

木东居士
发表了文章

数据百问系列:如何衡量一张或者多张数据表的价值?

如上,是居士最近看到小伙伴们讨论的一个问题,一些朋友也问过类似问题,因此发出来给大家来讨论,本文是将大家的讨论汇总成文,同时在末尾加上居士自己的理解。

木东居士
发表了文章

数据百问系列:数据分析的门槛将会提高还是降低

随着数据科学行业的火热,大量跨专业、跨行业人才涌入,数据分析的门槛究竟将会提高还是降低?

木东居士
发表了文章

数据百问系列:哪个时刻让你觉得数据分析真的非常有用

数分/数仓等各类数据岗位从业者常常称自己是sql boy或sql girl、表哥表姐、调包调参侠、没有感情的提数机等等,让许多刚入行的新人感到价值感缺失和迷茫。

木东居士
发表了文章

数据百问系列:是一个宽表好还是多个维表好?

本篇的主题是关于数据模型的规范化和反规范化的讨论,其实也是一种常见的维度建模的设计和业务使用便捷性的冲突。

木东居士
发表了文章

数据运营系列(二):如何用合成控制法判断策略实施效果

合成控制法最开始是经济学家用来研究评估某个政策实施在某国家或地区的效果,原理即是反事实框架,假想该地区没有受政策干预会怎样,并与事实上受到干预的结果做对比。二者...

木东居士
发表了文章

数据运营系列(一):生存分析与用户行为如何联系起来

生存分析主要用于医学研究,比如医疗方案对病人寿命的影响。后面用来探究所感兴趣的事件的发生的时间的统计方法。比如产品的寿命分析、工程中的失败时间分析等等。这里病人...

木东居士
发表了文章

【收藏】SQL经典面试50题 | 附答案

今天给大家分享一份星友对SQL经典面试50题的刷题记录,稍作了一些修改,以下是星友自述正文:

木东居士
发表了文章

数据百问系列:数仓团队如何在繁重的需求中体现自己的价值?

如何让数仓团队在繁重业务数据需求的情况下,依旧能熟悉业务和数据,进而为业务提供更大的价值?

木东居士
发表了文章

“浪”的量子力学解释

这个五四青年节,小破站的一个《后浪》的视频引爆了两代人的网络论战,“前浪”们感慨,“这届年轻人不好带了!”“后浪”们觉得,“视频就不是真实的世界!”

木东居士
发表了文章

​引入一项新技术前,我们该想清楚什么?

很多小伙伴在工作遇到一定瓶颈的时候,都希望引入一些新技术来解决问题,比如最近经常在群里看到大家聊:

木东居士
发表了文章

下一个风口-基于数据湖架构下的数据治理

随着大数据、人工智能、云计算、物联网等数字化技术的普及和广泛应用,传统的数据仓库模式,在快速发展的企业面前已然显的力不从心。数据湖,是可以容纳大量的原始数据的存...

木东居士
发表了文章

MLSQL解决了什么问题

在谈MLSQL解决了什么问题之前,我们先提一个“数据中台”的概念。什么是数据中台呢?数据中台至少应该具备如下三个特点:

木东居士
发表了文章

新一代AI平台-MLSQL ,加入开源社区吧!

MLSQL社区希望人人都能够参与进来。开源应该是普惠的,这种普惠应该是在价值的发挥上,以及社区的参与上。我们认为积极的社区参与体现在如下点:

木东居士
发表了文章

我是不是应该转行机器学习?

先说结论: 要不要转行,不妨先业余时间玩一把,看这个是不是真的适合自己,然后再去做决定。

木东居士

个人简介

个人成就

扫码关注云+社区

领取腾讯云代金券