木东居士的专栏

85 篇文章
56 人订阅

全部文章

木东居士

腾讯 · 数据分析 (已认证)

数据工程师的算法!

翻出来了17年自己梳理的数据工程师的算法学习内容,当时的理解和现在会有些许不同,但整体来看还是可以的,有一些比较细节的内容并没有花较多的时间来整理,留待大家自己...

995
木东居士

腾讯 · 数据分析 (已认证)

如何设计可落地执行表命名规范

数据仓库的实施和落地需要团队中不同成员的参与和配合,因此也需要各种各样的规范,其中最典型的就是表命名规范,规范的表命名能让使用者轻而易举地明白该表的作用和含义。

1175
木东居士

腾讯 · 数据分析 (已认证)

《七天数据埋点之旅》指引篇

数据埋点是一份上手容易精通难的典型例子,可以说人人都可以埋点,但是埋点质量差异巨大,而这份差异随着时间推移会加速放大。

921
木东居士

腾讯 · 数据分析 (已认证)

《七天数据埋点之旅》第七天 埋点实战

本节是实战环节,以极客时间app安卓端为例,综合运用前面介绍的知识点,来解构埋点设计。虽然极客时间还有服务号、小程序、PC端、IOS端等形式,但过程大同小异,不...

1512
木东居士

腾讯 · 数据分析 (已认证)

《七天数据埋点之旅》第六天 埋点管理和验收

埋点管理是埋点设计的组织方式,可以细分为面向开发者的管理、面向监控者的管理和面向使用者的管理。本节节介绍面向使用者的管理。通过本节的学习,你将获得以下方面的认知...

1013
木东居士

腾讯 · 数据分析 (已认证)

《七天数据埋点之旅》第五天 埋点注意事项

关于作者:我是水大人,资深潜水员,一个基于开发、面向分析、走向全栈的饱经摧残的数据新手,爱折腾不爱玩,爱总结爱思考的老兵,错了改改了又错的惯犯。

883
木东居士

腾讯 · 数据分析 (已认证)

《七天数据埋点之旅》第四天 埋点设计(下)

关于作者:我是水大人,资深潜水员,一个基于开发、面向分析、走向全栈的饱经摧残的数据新手,爱折腾不爱玩,爱总结爱思考的老兵,错了改改了又错的惯犯。

874
木东居士

腾讯 · 数据分析 (已认证)

《七天数据埋点之旅》第三天 埋点设计(上)

在前两篇《初识埋点》和《埋点之前》的基础上,我们应该有了对埋点的基本认识、知道了具体的开发流程。本篇在前面铺垫的基础上进入具体的埋点设计环节。通过本篇的阅读,你...

772
木东居士

腾讯 · 数据分析 (已认证)

数据质量监控

随着大数据时代的带来,数据的应用也日趋繁茂,越来越多的应用和服务都基于数据而建立,数据的重要性不言而喻。而且,数据质量是数据分析和数据挖掘结论有效性和准确性的基...

1485
木东居士

腾讯 · 数据分析 (已认证)

《七天数据埋点之旅》第二天:埋点之前

关于作者:我是水大人,资深潜水员,一个基于开发、面向分析、走向全栈的饱经摧残的数据新手,爱折腾不爱玩,爱总结爱思考的老兵,错了改改了又错的惯犯。

1111
木东居士

腾讯 · 数据分析 (已认证)

闲聊数据库和数据仓库的区别

直观上理解:相同点是两者都是存储数据。不同点是数据库主要是基本的、日常的事务处理,例如银行交易;数据仓库,支持复杂的分析操作,侧重决策支持。

1243
木东居士

腾讯 · 数据分析 (已认证)

数据对业务价值帮助的一些思考

关于数据的价值,居士认为可以参考BI(商业智能)的定义。这里不简单地指做几张报表的工作,而是数据辅助决策。下面引用一下百度百科关于商业智能的定义。

742
木东居士

腾讯 · 数据分析 (已认证)

聊一聊数据仓库的 KPI 怎么定

首先,要明确的一点是数据最终是要服务于业务的!但是,数据仓库一般又不直接对接于业务,而更多地对接数据分析系统、用户画像系统和推荐或广告系统等。因此不容易用业务指...

1183
木东居士

腾讯 · 数据分析 (已认证)

数据仓库的一些建议

大数据时代,作为数据的掌握者,我们不仅要更好地使用数据,也要更好地管理数据。而数据仓库正是这样一套管理和组织数据的解决方案。

1512
木东居士

腾讯 · 数据分析 (已认证)

闲聊用户画像的存储

现在的用户画像,动不动就是几千几万个标签,标签一多就出现了一些需要克服的难题,比如下面两个:

1952
木东居士

腾讯 · 数据分析 (已认证)

一种计算用户留存的方法

用户留存分析是互联网时代常用的一种数据分析方法。而很多快速发展的公司并没有相应的方法论沉淀,这就导致了在计算用户留存的时候会出现下面的一些问题:1)用户留存的定...

1102
木东居士

腾讯 · 数据分析 (已认证)

简单介绍数据采集中的数据埋点

每个人都会走路跑步,但是并不是人人都能成为专业的运动员那么出色。产品经理就是一种这样的职业,我们都可以站在产品的角度思考问题,但我们并不是都能够成为一名出色的产...

1152
木东居士

腾讯 · 数据分析 (已认证)

数据仓库表的标准和规范关注点

标准和规范总不像一个数学公式那样黑白分明,它的概念总是显得抽象和模糊。因此,并不存在真正意义上的标准和规范,而是指的从业人员相互之间的约定积累,以及在工作中达成...

1462
木东居士

腾讯 · 数据分析 (已认证)

数据仓库实践之业务数据矩阵的设计

数据仓库的设计不能完全依赖于业务的需求,但又必须服务于业务的价值。那么,该如何地从业务的角度出发,设计一套切实可行的数据仓库呢?

1102
木东居士

腾讯 · 数据分析 (已认证)

一种通用的数据仓库分层方法

数据分层是数据仓库设计中十分重要的一个环节,优秀的分层设计能够让整个数据体系更易理解和使用。而目前网络中大部分可以被检索到相关文章只是简单地提及数据分层的设计,...

1452

扫码关注云+社区