关注ITValue,看企业级最新鲜、最具价值报道!
文章来源@ CIO之家 |
图片来源@视觉中国 |
数据驱动决策和产品智能,需要建立一个从数据采集、建模、分析到反馈的完整数据闭环。
数据采集包括客户端数据、业务端数据、第三方数据以及线下数据,要把“大、全、细、时”的原则落实到用户行为、用户数据、业务运行数据、内容数据等数据类型上。
另外,数据采集是一切数据应用的根基;建模中最重要的是数据模型的选择,以及储存和处理;而分析与反馈无法分割,用实际场景解释如何做数据分析、如何根据分析结果直接反馈以及反馈时的核心内容。
数据采集的四个法则: 大, 全, 细, 时:
"大"强调的是宏观的大, 这不只需要海量数据, 还要从系统的角度去考虑;
"全"强调多种数据源. 对于用户行为分析来说, 不但要采集客户端数据, 还要采集服务端日志, 业务数据库, 以及第三方数据, 全面覆盖, 而且是全量数据;
"细"要求把不同的维度都采集下来. 对于用户行为来说, 我们要采集 Who, When, Where, How, What 等信息. 如果缺失会导致重新采集, 延长迭代周期;
"时" 则强调时效性;
实际工作中, "大"可作为宏观考量, 重点关注"全"和"细", 而"时"可以根据业务场景灵活把控, 毕竟数据的时效性是有成本的。
(本文作者: 曹犟 神策数据联合创始⼈人 & CTO)
领取专属 10元无门槛券
私享最新 技术干货