前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >大数据的管理(二)

大数据的管理(二)

作者头像
哒呵呵
发布2018-08-06 17:10:47
5080
发布2018-08-06 17:10:47
举报
文章被收录于专栏:鸿的学习笔记

我们该如何管理数据呢?接下来的章节提出的问题,值得你去深思。

Data Management

大数据是为了解决复杂的企业优化问题。为了充分利用大数据,我们必须认识到,数据是一个重要的企业资产,因为数据是互联网经济的命脉。今天的组织依靠数据科学可以做出更明智和更有效的决策,通过创新产品和运营效率创造竞争优势。

然而,数据首先是债务。数据采集,硬件,软件,操作和人才的成本非常高。没有正确的管理,我们就不可能有效地从数据中提取价值。为了使大数据成功,我们必须有所有的规则来管理作为宝贵资源的数据。数据管理比数据库管理更广泛。这是一个以成本有效的方式捕获,交付,操作,保护,增强和处置数据的系统过程,需要不断加强计划,政策,计划和实践。

数据管理的最终目标是增加数据的价值主张。它需要认真仔细地考虑,并应从一个数据策略开始,定义一个路线图,以数据驱动的方式满足业务需求。要创建数据策略,请仔细考虑以下问题:

•我们试图解决什么问题?大数据能带来什么价值?大数据很火热,因此许多公司都选择拥抱它。然而,大数据为大数据显然是错误的。其他的案例不一定是你想要的东西。要收集大数据的价值,深入了解您的业务和解决的问题是至关重要的。

•谁掌握数据,谁拥有数据,谁可以访问数据?数据管理是一组过程,是确保重要的数据资产在整个企业中可以得到正式管理。通过数据管理,我们期望数据管理员和数据托管人对数据进行积极的控制。数据托管人负责数据的安全保管,运输和存储,而数据托管人负责数据元素(内容和元数据)的管理。

•我们需要什么数据?这可能看起来很明显,但它通常只是回答“我不知道”或“一切”,这表明此时缺乏理解商业实践。每当这种情况发生,我们应该回去回答第一个问题。如何获取数据?数据可以从记录,日志文件,调查或第三方的内部系统收集。可以修改事务系统以收集用于分析的必要数据。

•在哪里存储数据和保存它们多长时间?由于各种数据,今天的数据可能存储在各种数据库(关系或NoSQL),数据仓库,Hadoop等。今天,数据库管理超越了关系数据库管理。因为大数据也是快速数据,所以永远保存所有数据是不切实际的。需要仔细思考来确定数据的寿命。

•如何保证数据质量?垃圾进入,垃圾离开。在没有确保数据质量的情况下,大数据不会给业务带来任何价值。随着大数据的出现,数据质量管理比以往任何时候都更重要,更具挑战性。

•如何分析和可视化数据?大量的数学模型可用于分析数据。简单地应用数学模型不一定会产生可行的见解。在谈论你的数学模型之前,先了解你的业务和问题。引导模型与你的见解(或机器学习的先验),而不是由无法解释的黑箱模型的数量领先。此外,可视化非常有助于探索数据和呈现分析结果,一图千字。

•如何管理复杂性?大数据非常复杂。为了管理复杂性和改进数据管理实践,我们需要制定问责框架,以鼓励符合组织的业务战略,优势和优先事项的期望行为。

我们相信,在思考和回答上述问题后,将会拥有一个良好的数据策略。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2017-01-09,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 鸿的学习笔记 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
数据库
云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档