专栏首页PPV课数据科学社区【观点】大数据不是万能的,它不适合处理这10件事情

【观点】大数据不是万能的,它不适合处理这10件事情

许多企业领导人开始接纳大数据处理并期待神奇和奇迹,但却发现大数据带来新的复杂性——且从中获益所需要付出的努力要预计中的多得多。

每个组织机构都对大数据应用寄予厚望,期待它可以解答长期存在的业务问题,让他们在市场集中镇南关,在产品、服务交付中更具竞争力。这种对于大数据获益的预期很难实现,除非给予足够的指导和帮助。这里列举不适合大数据的10件事情,除非你能够采取正确步骤优化其价值。

1:解决你的业务问题

大数据不会处理业务问题。人们可以做的,就是要坐下来,在开始使用大数据之前,讨论决定放弃大数据,就使用商业智能取得共识。

2:帮助你管理数据

IBM公司宣称:每一天都会产生250万字节的数据,其中大部分属于大数据。不出预料,世界范围内企业所需要管理的数据量呈现指数级增长,由于缺乏清晰有效地数据存储和使用策略,数据将不断堆积,每个企业都陷于数据管理的工作。

3:缓解减轻你的安全忧虑

对于许多公司来说,确保大数据的安全访问仍然是一个开放式的课题。这是因为对于大数据安全实践的定义远没有系统数据和记录保护这样明确。我们正处在这样的一个时间点上,也就是IT与最终用户一起来确定:谁可以访问哪些级别的大数据,并可以进行相应地分析。

4:关键IT技能缺乏

大数据处理数据库管理、服务器管理、软件开发、业务分析技能短缺,许多IT部门关键IT技能的缺失会不断成为企业的负担。

5:减少遗留系统的价值

如果有的话,遗留系统记录会较之任何大数据更具有价值。通常情况下,正是这些遗留系统可以为大数据分析提供重要线索,用于回答重要的业务问题。

6:简化数据中心

大数据分析需要并行处理计算机集群和传统IT事务处理和数据仓库系统等不同风格的系统管理,这就意味着能量、冷却、软件硬件消耗,运转这些系统所需要的技巧也不尽相同。

7:提高数据质量

传统事务处理系统美妙之处在于其拥有固定长度的数据字段以及全面的数据编辑和验证发方式,这有助于得到一个相对干净的表格呈现。大数据不是这样,他们是非结构化的数据,可以表现为几乎任何形式。这让大数据的质量成为一个令人头痛的难题。数据质量至关重要,如果你没有它,就不能信任数据查询的结果。

8:验证当前的投资回报率(ROI)

衡量系统投资回报率最常用的方法是监测交易速度,然后推断其获利能力(例如酒店每分钟有多少新的预订)。对于大数据处理来说,交易速度不是好的衡量指标,大数据缓存和运行分析可能需要数小时甚至数天才可以杀青。衡量大数据处理有效性的一个最好的指标应该是利用率,它应该保持在90%以上(相比于交易系统,其利用率可能只有20%)。对于大数据来说,确定新的ROI指标尤为重要,因为你还有说服CFO以及其他业务部门的领导。

9:减小“噪音”

95%以上的大数据属于“噪音”,对于商业智能的贡献很小或几乎没有。通过数据筛选来进行企业掘金,帮助企业业务进步,这是一个非常艰巨的任务。

10:每天工作时间

多年来,大学和研究中心一直运用大数据实验,试图解答基因组、药物研究以及是否有其他星球生命等令人难以捉摸问题的答案。虽然其中一些算法和查询产生结果更多还是不确定的,大学和研究对于环境的研究也尚无定论,但这不是企业可以接受的,因此,IT和企业关键决策者需要对预期进行调整和管理。

本文分享自微信公众号 - PPV课数据科学社区(ppvke123)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2014-05-21

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 好文章 | 掘金大数据产业链:上游资源+中游技术+下游应用

    【背景】 我们正处在一个数据量爆发增长的时代。 在摩尔定律长达50年的支配下,当今的信息产业呈现出前所未有的繁荣,新的互联网技术不断涌现。从传统互联网的PC...

    小莹莹
  • 大数据应用于P2P风控领域

    一、大数据风控——互联网金融的命脉 近几年,大数据已经撼动了世界的方方面面,从商业科技到医疗、政府、教育、经济、人文以及社会其他各个领域;数据成了有价值的公...

    小莹莹
  • 大数据与财会行业未来机遇与挑战下的领域——“数据资产的估值”

    ? 产生和存储的数据量正在迅速增长,甚至呈指数增长。根据预测,数据量每两年就可能翻倍。同时,从业人员能够运用新的高级分析技术,来连接和查询原先分散的数据集,只...

    小莹莹
  • 关于数据发现的一些实践经验

    为什么要做数据发现工具呢?原因很简单,随着团队发展,我们的数据平台接入的数据量、数据种类、数据来源和数据库类型越来越多;数据多了之后,原本很多只能停留在想一想的...

    哒呵呵
  • 大数据周周看 | 奇虎360信用信息大数据试点获批,贵交所10大战略激活万亿大数据市场

    <数据猿导读> 本周,奇虎360公司的信用信息大数据试点获国家发改委批复,成为我国首家发展信用信息大数据试点的企业;腾讯公司紧跟其后发布腾讯浏览服务(TBS),...

    数据猿
  • 英国2020《国家数据战略》与世界各国对比解析

    2020年9月9日,英国数字、文化、媒体和体育部(DCMS)发布《国家数据战略》(下文简称《战略》),支持英国对数据的使用,帮助该国经济从疫情中复苏,并将在20...

    明悦数据
  • 透过数据魔镜看人看物看世界

    万物皆数,透过数据的魔镜能够帮助人类照出万物的本质,看人看物看世界。正如实现心愿的如意——如意如意快快显灵,数据的如意如今已经成为评判人和物的标尺,给人给物画像...

    机器思维研究院
  • 张涵诚:你如何成为优秀的数据经纪人

    数据猿导读 一个数据经纪人没有很深的行业知识和数据价值的理解能力,注定不会成为一个优秀的数据经纪人。今天我们就来来交流一下:“你如何成为优秀的数据经纪人”,如何...

    数据猿
  • 数据清洗 Chapter01 | 数据清洗概况

    这篇文章讲述的是数据存储方式和数据类型等基本概念、数据清洗的必要性和质量评价的关键点。希望这篇数据清洗的文章对您有所帮助!如果您有想学习的知识或建议,可以给作者...

    不温卜火
  • DàYé玩转数据战略Step By Step

    我们先看看工业革命的演进路径,从1.0的蒸汽机时代,到2.0的电力、流水线和大规模生产时代,再到3.0的计算机自动化时代,最后是4.0的智能化时代。

    曲水流觞

扫码关注云+社区

领取腾讯云代金券