木东居士的专栏

65 篇文章
34 人订阅

全部文章

木东居士

【Andrew Ng 机器学习】Week 1(二):代价函数和梯度下降

1722
木东居士

如何优雅地设计数据分层

本文主要讲解数据仓库的一个重要环节:如何设计数据分层! 其它关于数据仓库的内容可参考之前的文章。

4245
木东居士

技术资源推荐(数据仓库篇)

3332
木东居士

DataTalk:收集有用的数据问题

1634
木东居士

DataTalk:是一个宽表好还是多个维表好?

4013
木东居士

DataTalk:为什么特征组合后效果更好?

1616
木东居士

DataTalk:ODS层的数据需要做数据清洗吗?

2136
木东居士

DataTalk:迟到的数据该怎样处理?

1943
木东居士

你了解你的数据吗(化神篇):简易特征分析

1822
木东居士

【Andrew Ng 机器学习】Week 1(一):基本概念和线代基础

1632
木东居士

数据质量监控

5103
木东居士

你了解你的数据吗(练气篇):数据接入和常见的坑

1411
木东居士

你了解你的数据吗(筑基篇):核心维度分布和数据口径

2384
木东居士

你了解你的数据吗(结丹篇):数据质量监控

1866
木东居士

你了解你的数据吗(元婴篇):血缘分析

3843
木东居士

机器学习经典开源数据集

"数据为王,使用相同机器学习算法,不同质量的数据能训练出不同效果的模型。本文将分享数据科学领域中经典的几个开源数据集。

3909
木东居士

聊一聊如何优雅地向程序员提问题

2775
木东居士

数据仓库概念总结

2034
木东居士

Counting Bloom Filter 的原理和实现

1624
木东居士

不深入而浅出 Roaring Bitmaps 的基本原理

3654

扫码关注云+社区