木东居士的专栏

75 篇文章
46 人订阅

全部文章

木东居士

腾讯 · 数据分析 (已认证)

闲聊数据库和数据仓库的区别

直观上理解:相同点是两者都是存储数据。不同点是数据库主要是基本的、日常的事务处理,例如银行交易;数据仓库,支持复杂的分析操作,侧重决策支持。

643
木东居士

腾讯 · 数据分析 (已认证)

数据对业务价值帮助的一些思考

关于数据的价值,居士认为可以参考BI(商业智能)的定义。这里不简单地指做几张报表的工作,而是数据辅助决策。下面引用一下百度百科关于商业智能的定义。

492
木东居士

腾讯 · 数据分析 (已认证)

聊一聊数据仓库的 KPI 怎么定

首先,要明确的一点是数据最终是要服务于业务的!但是,数据仓库一般又不直接对接于业务,而更多地对接数据分析系统、用户画像系统和推荐或广告系统等。因此不容易用业务指...

843
木东居士

腾讯 · 数据分析 (已认证)

数据仓库的一些建议

大数据时代,作为数据的掌握者,我们不仅要更好地使用数据,也要更好地管理数据。而数据仓库正是这样一套管理和组织数据的解决方案。

882
木东居士

腾讯 · 数据分析 (已认证)

闲聊用户画像的存储

现在的用户画像,动不动就是几千几万个标签,标签一多就出现了一些需要克服的难题,比如下面两个:

862
木东居士

腾讯 · 数据分析 (已认证)

一种计算用户留存的方法

用户留存分析是互联网时代常用的一种数据分析方法。而很多快速发展的公司并没有相应的方法论沉淀,这就导致了在计算用户留存的时候会出现下面的一些问题:1)用户留存的定...

722
木东居士

腾讯 · 数据分析 (已认证)

简单介绍数据采集中的数据埋点

每个人都会走路跑步,但是并不是人人都能成为专业的运动员那么出色。产品经理就是一种这样的职业,我们都可以站在产品的角度思考问题,但我们并不是都能够成为一名出色的产...

542
木东居士

腾讯 · 数据分析 (已认证)

数据仓库表的标准和规范关注点

标准和规范总不像一个数学公式那样黑白分明,它的概念总是显得抽象和模糊。因此,并不存在真正意义上的标准和规范,而是指的从业人员相互之间的约定积累,以及在工作中达成...

882
木东居士

腾讯 · 数据分析 (已认证)

数据仓库实践之业务数据矩阵的设计

数据仓库的设计不能完全依赖于业务的需求,但又必须服务于业务的价值。那么,该如何地从业务的角度出发,设计一套切实可行的数据仓库呢?

792
木东居士

腾讯 · 数据分析 (已认证)

一种通用的数据仓库分层方法

数据分层是数据仓库设计中十分重要的一个环节,优秀的分层设计能够让整个数据体系更易理解和使用。而目前网络中大部分可以被检索到相关文章只是简单地提及数据分层的设计,...

762
木东居士

腾讯 · 数据分析 (已认证)

漫谈数据仓库和范式

长期从事数据仓库的你,是否还记得数据库设计中的三大范式?在设计数据仓库的表时,是否考虑过规范化和反规范化之间的区别?是否想过数据仓库和数据库在设计中对范式考虑的...

731
木东居士

腾讯 · 数据分析 (已认证)

少数人的智慧:基于专家意见的协同过滤

基于最近邻算法的协同过滤(nearest-neighbor collaborative filtering)是一种十分成功的推荐方法。然而,这种方法存在一些缺点...

661
木东居士

腾讯 · 数据分析 (已认证)

如何优雅地设计数据分层

本文主要讲解数据仓库的一个重要环节:如何设计数据分层! 其它关于数据仓库的内容可参考之前的文章。

7365
木东居士

腾讯 · 数据分析 (已认证)

技术资源推荐(数据仓库篇)

4892
木东居士

腾讯 · 数据分析 (已认证)

DataTalk:收集有用的数据问题

1814
木东居士

腾讯 · 数据分析 (已认证)

DataTalk:是一个宽表好还是多个维表好?

6103
木东居士

腾讯 · 数据分析 (已认证)

DataTalk:为什么特征组合后效果更好?

1786
木东居士

腾讯 · 数据分析 (已认证)

DataTalk:ODS层的数据需要做数据清洗吗?

2466
木东居士

腾讯 · 数据分析 (已认证)

DataTalk:迟到的数据该怎样处理?

2193
木东居士

腾讯 · 数据分析 (已认证)

你了解你的数据吗(化神篇):简易特征分析

2082

扫码关注云+社区