前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >企业数据分析流程与高级分析模型

企业数据分析流程与高级分析模型

作者头像
博文视点Broadview
发布2023-05-19 20:14:33
2940
发布2023-05-19 20:14:33
举报

随着移动互联网的快速发展,大数据技术变得越来越成熟,正在改变着人们的工作、生活与思维模式,进而对文化、技术等产生深远的影响。

本文选自《数据决策:企业数据的管理、分析与应用》一书,文末可了解本书详情。


在正式介绍企业数据分析流程及高级分析之前,首先介绍一些企业里常见的数据职位,以及每个职位的人在企业中承担的责任。

业务分析师(Business Analysis,BA):这类人需要了解行业,快速理解业务痛点,能够进行基础的统计数据分析类工作(某些高级一点的职位需要熟练的SQL技能)。他们通常掌握一些基础数据处理分析技能,能够做商业洞察分析类报告。

高级统计分析建模师:一般数据科学家会拥有高级统计分析建模经验,熟悉一些统计或者机器学习算法,能够通过编程实现一些模型分析应用项目。高级统计分析建模师需要熟悉一些工作中用到的算法,如非监督学习、监督学习及聚类等。

 数据分析流程 

在企业中,经营的方方面面都需要数据分析。互联网公司由于业务变化快,需要实时且持续地通过数据分析,发现企业业务存在的问题,并提出改进的方法,帮助企业解决相应的业务问题。

企业数据分析一般需要以下几个步骤。

• 确定商业目标。

• 确定解决该问题所需要的数据、技术、能力。

• 确定用基本业务分析模型,还是用高级分析模型。

• 数据分析,包括数据准备、数据预处理、数据建模、分析数据并得出结果。

• 数据分析结果汇报。

• 解释结果,提出应用方案。

其中,确定清晰的商业及业务问题,并和相关业务关键人员达成共识,是数据分析类项目成功的关键。接下来的部分属于企业中数据科学家建模、执行的环节。

 高级分析 

下面介绍在日常工作中常用的高级分析模型—机器学习算法模型。

①监督学习:包含的算法有逻辑回归、贝叶斯法、决策树、SVM(支持向量机)。

②非监督学习:包含的算法有kNN(邻近算法)、PCA(主成分分析)、K-means(K均值聚类算法)。

下面重点看一下监督学习是如何工作的。

这是一个监督学习模型。企业采集相关数据,并将数据转化为特征向量,通过相应的机器学习模型(这里是监督模型)对特征向量进行训练,最终进行分类预测,得到期望的类型标签。

企业中高级统计分析建模的工作,需要有专门的数据科学家来协助定义问题、建模并将结果进行呈现。

一个合格的数据科学家需要哪些核心能力呢?

数据科学家需要具备的能力

要成为数据科学家,需要掌握的核心能力包括数理知识(含传统研究)、业务能力(行业领域经验)、黑客能力(在数据领域工作,尤其是数据科学家,需要通过寻找变量之间的各类关系,不断进行假设、验证,喜欢与数据打交道,能够热衷于研究数据,所以需要黑客的探索精神)等。

数据科学家需要具备的能力

由此可见,数据科学家需要具备比较综合的跨学科的素质。在具体实践中,不同的算法有不同的优缺点,也有各自适应的场景。当面对不同的问题时,应该选择不同的算法模型。然而,在什么情况下选择什么算法模型,该从什么角度去思考这个问题,是值得每一位初学者深思的问题。

图书详情

《数据决策:企业数据的管理、分析与应用》

顾生宝 著

本书是作者十年数据领域实践经验的总结,系统介绍了企业的数据战略规划和企业内外部数据的应用,并在此基础上介绍了零售、快速消费品、汽车、航空、保险等行业的实战案例及作者的思考。

本书通过与企业数据相关的理论体系、行业案例、业务领域热点等,全面介绍了不同行业的企业中数据的管理、分析与应用,对企业未来的数字化转型也做了简要介绍。相信不同类型的读者都能够从本书中获得自己想要了解的部分。本书实战案例丰富,适合想在企业中更好地利用数据的企业主、管理层、业务负责人阅读,也适合从事数据和 AI相关工作,关注数据和 AI在产业中应用的读者阅读。

▼扫码了解本书详情▼

代码语言:javascript
复制
如果喜欢本文欢迎 在看丨留言丨分享至朋友圈 三连

  热文推荐  
书单丨上过太空的JavaScript用着就是香!
周志华教授专著《集成学习:基础与算法》上市全方位解读语音识别的最新著作Jetpack来了:走近Google标准应用架构

▼点击阅读原文,了解本书详情。
本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2020-07-20,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 博文视点Broadview 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
语音识别
腾讯云语音识别(Automatic Speech Recognition,ASR)是将语音转化成文字的PaaS产品,为企业提供精准而极具性价比的识别服务。被微信、王者荣耀、腾讯视频等大量业务使用,适用于录音质检、会议实时转写、语音输入法等多个场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档