首页
学习
活动
专区
工具
TVP
发布

木东居士的专栏

专栏作者
222
文章
401490
阅读量
177
订阅数
今天一位朋友讲了一小段他的工作经历,由于一个潜在的线上的问题,他和后台、算法、产品同学排查了几周,今天终于发现的确有一个地方写出来了bug,大家如释重负地说:找到了总比没有找到的好,后面有事情可以做了
(function () { var content = "今天一位朋友讲了一小段他的工作经历,由于一个潜在的线上的问题,他和后台、算法、产品同学排查了几周,今天终于发现的确有一个地方写出来了bug,大家如释重负地说:找到了总比没有找到的好,后面有事情可以做了。 说出这句话的时候,大家第一反应是由衷地开心,bug被发现了。而不是,这个事情怎么瞒下来,不要对外讲。"; // 只保留a标签 var jsTextContent = document.
木东居士
2022-03-24
3390
漫谈数据团队协作之各岗位间的相互尊重
数据相关的岗位有很多,本文并不会展开一一列举,后面会有文章专门分享不同岗位之间的分工和责任边界。
木东居士
2021-07-16
5840
漫谈什么是数据科学家?
近半年,居士看了很多关于数据科学家的模模糊糊的概念,也听了很多所谓数据科学家讲到自己比数据分析怎么怎么厉害,但,细问其和数据分析、数据挖掘有何区别时,又含含糊糊,讲不清楚。
木东居士
2021-07-16
7280
用户画像实践:神策标签生产引擎架构
导读:用户画像是建立在数据基础之上的用户模型,是产品改进、精准营销等业务场景中不可或缺的重要基础。而构建用户画像的过程就是要给用户打上各种维度的标签,并基于标签进行定性或定量分析。这其中,建设灵活、全面、高效的标签体系是工作的重中之重。本文就从标签体系建设的需求出发,阐述神策数据在设计标签生产引擎过程中所做的思考和实践。主要内容包括:
木东居士
2020-09-22
2.6K0
数据百问系列:数据分析和数据挖掘的区别是什么? (附真实招聘数据对比报告)
数据分析和数据挖掘是数据从业者非常关注的两个岗位。这两个岗位到底有哪些区别?常听人说数据分析偏业务、偏前台,而数据挖掘偏技术,偏后台。所以要早点选定一个方向进行深耕才行?
木东居士
2020-08-11
1.8K0
数据百问系列:现在是否还看好大数据的发展
最近职业上遇到了很多困惑,感觉都在说大数据不行了,过了红利期,现在有点凉凉的感觉,也不知道是我的感觉还是行业就是这样。希望大家能够谈谈自己的看法和感受。
木东居士
2020-07-16
1.1K0
数据运营系列(二):如何用合成控制法判断策略实施效果
合成控制法最开始是经济学家用来研究评估某个政策实施在某国家或地区的效果,原理即是反事实框架,假想该地区没有受政策干预会怎样,并与事实上受到干预的结果做对比。二者之差即为“处理效应”。这里D为干预变量,X为解释变量,Y为被解释变量。因此合成控制法需要估计处理效应ATT:
木东居士
2020-06-01
1.4K0
下一个风口-基于数据湖架构下的数据治理
随着大数据、人工智能、云计算、物联网等数字化技术的普及和广泛应用,传统的数据仓库模式,在快速发展的企业面前已然显的力不从心。数据湖,是可以容纳大量的原始数据的存储库和处理系统,已经成为企业应用大数据的重要工具。数据湖可以更好地支撑数据预测分析、跨领域分析、主动分析、实时分析以及多元化结构化数据分析,可以加速从数据到价值的过程,打造相应业务能力。而有效的数据治理才是数据资产形成的必要条件,同时数据治理是一个持续性过程,也是数据湖逐步实现数据价值的过程。未来在多方技术趋于融合,落地场景将不断创新,数据湖、数据治理或将成为新的技术热点。
木东居士
2020-05-07
2.2K0
MLSQL解决了什么问题
在谈MLSQL解决了什么问题之前,我们先提一个“数据中台”的概念。什么是数据中台呢?数据中台至少应该具备如下三个特点:
木东居士
2020-04-26
7070
新一代AI平台-MLSQL ,加入开源社区吧!
MLSQL社区希望人人都能够参与进来。开源应该是普惠的,这种普惠应该是在价值的发挥上,以及社区的参与上。我们认为积极的社区参与体现在如下点:
木东居士
2020-04-26
9650
我是不是应该转行机器学习?
先说结论: 要不要转行,不妨先业余时间玩一把,看这个是不是真的适合自己,然后再去做决定。
木东居士
2020-04-26
5020
二次元属性被稀释,B站还剩什么?| 数据获取
由于篇幅过大原因,文章将分为上篇与下篇:上篇为数据获取,下篇为数据分析。今天为大家带来的是上篇:获取B站数据!
木东居士
2020-03-06
9110
出场率No.1的逻辑回归算法,是怎样“炼成”的?
逻辑回归(Logistic Regression,LR)。在Kaggle竞赛的统计中,LR算法以63.5%的出产率,荣获各领域中“出场率最高的算法”这一殊荣。在实际场景中,逻辑回归同样应用广泛,大到国家各项经济政策的制定,小到计算广告CTR,都能看到LR算的身影。
木东居士
2019-12-10
7070
数据仓库系列:如何优雅地规划数仓体系
数仓规划是数仓建设的蓝图,涵盖从需求分析开始到最终的数仓评估验收整个环境;数仓规划之所以重要,是因为它是描述了数据流动的概念性框架,为元数据管理奠定了基础,对数据加工过程的理解、数仓建设的交流分享、数据的使用和问题排查、数仓健康度的评估都提供了极大的帮助。
木东居士
2019-12-10
3.3K0
还不了解梯度下降法?看完这篇就懂了!
那么其实可以总结出关于“如何找到函数f(x)”的方法论。可以看作是机器学习的“三板斧”:
木东居士
2019-12-10
2.3K0
理论+实践,一文带你读懂线性回归的评价指标
关于作者:饼干同学,某人工智能公司交付开发工程师/建模科学家。专注于AI工程化及场景落地,希望和大家分享成长中的专业知识与思考感悟。
木东居士
2019-11-24
1.5K0
模型之母:简单线性回归的代码实现
关于作者:饼干同学,某人工智能公司交付开发工程师/建模科学家。专注于AI工程化及场景落地,希望和大家分享成长中的专业知识与思考感悟。
木东居士
2019-11-04
5100
特征工程系列:GBDT特征构造以及聚类特征构造
关于作者:JunLiang,一个热爱挖掘的数据从业者,勤学好问、动手达人,期待与大家一起交流探讨机器学习相关内容~
木东居士
2019-10-30
1.7K0
模型之母:简单线性回归&最小二乘法
关于作者:Japson。某人工智能公司AI平台研发工程师,专注于AI工程化及场景落地。持续学习中,期望与大家多多交流技术以及职业规划。
木东居士
2019-10-24
2.7K0
特征工程系列:笛卡尔乘积特征构造以及遗传编程特征构造
关于作者:JunLiang,一个热爱挖掘的数据从业者,勤学好问、动手达人,期待与大家一起交流探讨机器学习相关内容~
木东居士
2019-10-15
2K0
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档