每日一句
保持身体健康的唯一办法,
就是吃点你不想吃的,
喝点你不想喝的,
以及做点你不愿做的事情。
——马克·吐温(许锋)
在今天的数据科学成熟度模型(DSMM)维度讨论中,我将重点放在“方法论”维度上:
数据科学的企业方法论是什么呢?
最常被引用的“数据挖掘”方法CRISP-DM是数据科学的一个关键要素。但是,数据科学的广度和发展可能需要超越CRISP-DM引入的传统阶段:业务理解,数据理解,数据准备,建模,评估和部署。 实际上,结果反馈循环或扩展数据感知/访问阶段的价值可能是有用的。此外涉及数据科学项目参与者和工作产品的企业特定工作流程可能是提高生产率和衍生价值所必需的过程和方法。
和以前一样,我们将讨论“方法论”维度的5个成熟度等级中的每一个:
第1级:数据分析侧重于使用商业智能和数据可视化工具的临时方法。
对于一级企业,数据分析师和其他参与者通常不遵循既定的方法,而是依赖于他们的经验,技能和偏好。主要是通过仪表板,报告实现商业智能和数据可视化,并依赖于传统的方式进行演绎查询。
第2级:数据分析扩展到包括采用解决业务问题的机器学习和预测分析的方法,但仍使用临时方法。
与1级一样,2级企业通常不遵循既定的方法,而是依赖于玩家的经验,技能和偏好。但是,二级企业补充了传统角色,例如数据分析师,他们为数据科学家提供商业智能和数据可视化,他们引入了更先进的数据科学技术,如机器学习和预测分析。随着数据科学家的引入,临时数据科学“方法论”得到了更多隐含的增强使用。
第3级:各个组织开始定义并定期应用数据科学方法。
3级企业处于试验阶段,各个组织开始定义自己的方法实践或利用现有的方法实践。目标包括:在控制风险的同时提高数据科学项目的生产率,一致性和可重复性。但是数据科学项目可能会或可能不会有效地跟踪部署的模型结果的性能。
第4级:为数据科学项目建立的基础数据科学方法最佳实践。
4级企业通过在整个企业中建立方法最佳实践,从3级的进展为基础。这些最佳实践源于组织实验或从现有方法中得来。通过建立最佳实践,企业可以提高数据科学项目的生产率,一致性和可重复性,同时降低失败的风险。
第5级:整个企业正式化数据科学方法的最佳实践。
在第4级建立了数据科学的最佳实践后,5级企业正式确定了数据科学项目的其他关键方面,包括项目规划,需求收集/规范和设计,以及实施,部署和项目评估。
在我们明天的文章中,我们将介绍数据科学成熟度模型的“数据意识”维度。
分享:
领取专属 10元无门槛券
私享最新 技术干货