专栏首页CDA数据分析师大数据是如何赚钱和亏钱的?

大数据是如何赚钱和亏钱的?

拟有看到大数据如何带来收益,以及如何实现的例子吗?

大数据无疑是时下炙手可热的流行词汇,然而,我们鲜少看到大数据如何带来收益,以及如何实现的例子,这是怎么回事呢?

多年来,在经历了几个通信和投行的大数据相关早期实施项目后,我认为这个新兴技术的收益主要在于:实现对复杂系统更为精准的剖析,例如股票市场或供应链。(投行成为最早一批应用大数据分析的行业之一,可谓毫不意外。对利用技术提升效率,创造效益更为敏锐的商业模式,往往也是更赚钱的。)

在投行的日常工作中,为了精准地选择投资机会、选购股票,有大量对文档处理的需求,例如新闻简报,财务报表。如果人工进行,工作量过于庞大。因此助理分析师们往往简化他们的预测分析过程,并使用电子表格来完成绝大部分工作。通过大数据技术,投行可以整合各种信息,减少可能的(简化分析带来的)风险,从整体上带来更优越的分析和预测能力。

公司如何通过大数据赚钱?

通过大数据平台,股票经纪和投资经理们可以聚合各种来源的非格式化数据,辅助判断哪些公司值得投资。所谓‘非格式化数据’包括如公司新闻,产品评论,供应商数据,价格变化,将这些信息以所谓“大数据”形式整合,通过建模,帮助股票经纪决策买入或售出股票。

有些采用如上方式进行投资预测的公司,很注重节约实施成本,例如使用云平台(如AWS),先从很小数量的服务器开始,随着获益增长,逐步提高投入。一位我认识的分析师,从一家大投行离职创业后,在不到六个月的时间内,仅仅使用非常有限的投入,创立了一个盈利良好的大数据交易系统。

即便在传统制造领域,大数据仍然可以提升预测能力。我曾经担任过顾问的某欧洲一线汽车制造厂商,通过建立一个钢材交易成本的分析系统,选择更好的时机,以更优价格买入原材料。这个系统由开源Java框架Hadoop创建,整合了多个供应商的共计15Tb的数据,在两年内为该公司节省了1600万美元。

这个项目的成功主要有两个原因:首先,公司有足够的信息为所有的供应商建模;其次,该项目节省的原材料成本超过了实施这个项目的费用。

公司为何因为大数据亏钱?

然而,并非每个大数据项目都会这样成功。公司在大数据项目上以亏损告终的概率,有时和成功的概率相差无几。大数据项目失败的早期症状有很多种,最常见的问题如:

步子迈太大

大数据并不需要一笔巨大的预算,如果怀着巨大的投入将带来巨大回报的预期开始一个大数据项目,往往会产生问题。在正式开始前,明智的做法是,尝试用有限的投入,在小范围内测试这个技术是否确实能带来预期的收益。按这样的节奏,一个项目可以按部就班地随着收益逐步提高,而逐步扩大投入规模,确保收益始终大于投入。

低估人力投入

在开始实施一个大数据系统前,问自己一个简单的问题:这个项目是否可以不需要持续的人工支持来运作?如果答案是,需要人工支持,那么建议停止项目。建立这样一个项目往往意味着百万级的损失,无法在有利润情况下保持维护和运行。

迷信自然语言处理

大数据有个经常听到的功能是,通过自然语言处理,将各种领域的各种数据处理成直接可读可理解的形式。这听起来确实很赞,但是在实际应用中,往往不尽如人意。自然语言处理仍然存在许多妨碍应用的限制,主要由于人工智能的发展还不够——而且在可见的10年内,这个情况可能不会有很大改观。

现代大数据项目具备巨大的节约成本的潜力,其效果对于过去的数据处理方式而言有如童话。但需要谨记的是,在投入时间和资源到大数据项目之前,首先要确认你的项目是收益大于成本的。只有傻瓜才会匆匆对一个点子一见钟情并倾其所有。

本文作者Marco Visibelli是一位曾经工作于IBM,后离职创建Kuldat的数据科学家,他的公司主营运用大数据来为销售和市场分析潜在获益机会。

作者:Marco Visibelli, Kuldat 译者 scv123

本文分享自微信公众号 - CDA数据分析师(cdacdacda)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2015-07-31

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 「CDAS 在线」鲍忠铁:深度商业分析的7大基石作者 傲看今朝

    作者   CDA数据分析师 今天跟大家分享三方面的内容,一个是深度商业分析的七大基石,另外是怎么做客户洞察和数据的应用,因为我们很多大数据应用在金融行业的初始点...

    CDA数据分析师
  • 25个你必须知道的大数据术语

    原作者 Ramesh Dontha 编译 CDA 编译团队 本文为  CDA 数据分析师原创作品,转载需授权 提到大数据可能有些令人生畏。在了解一定基本概念的基...

    CDA数据分析师
  • 吴甘沙:数据分析师进化的3道阶梯

    9月11日—9月12日,由经管之家(原人大经济论坛)主办的“2015中国数据分析师行业峰会(CDA?Summit)”在北京举行。 英特尔中国研究院院长兼首席工程...

    CDA数据分析师
  • 大数据(生于2006,卒于2019)已死!

    由于关注的重心从我们收集数据的方式转向实时处理数据,大数据时代即将终结。大数据现在是支持多云、机器学习和实时分析这几个新时代的业务资产。

    Spark学习技巧
  • 创业者注意了!大数据教你如何在众筹网站上成功融资

    有好点子,想创业,但没钱,怎么办?Kickstarter是美国著名的众筹网站,在这里可以帮有好点子的创业者实现梦想!本文数据侠抓取了Kickstarter的众筹...

    DT数据侠
  • 大数据(生于2006,卒于2019)已死!

    由于关注的重心从我们收集数据的方式转向实时处理数据,大数据时代即将终结。大数据现在是支持多云、机器学习和实时分析这几个新时代的业务资产。

    钱塘数据
  • 云计算数据仓库的下一步是什么

    如果说多云是当今数据仓库采用的战略,那么跨云就是它对未来的愿景。这种预测来自于一种普遍的需求,即在不同云计算提供商的不同区域之间,甚至在不同的云平台之间无缝地移...

    静一
  • 数据分析师应该了解的数据湖

    看了很多数据湖的介绍文章,笔者认为数据胡和我们常说的ODS数据很类似,也就是原始数据的保存区域,存储来自各业务系统(消息队列)的原始数据。比如电商网站的访问日志...

    WindyQin
  • 数据分析师应该了解的数据湖

    看了很多数据湖的介绍文章,笔者认为数据胡和我们常说的ODS数据很类似,也就是原始数据的保存区域,存储来自各业务系统(消息队列)的原始数据。比如电商网站的访问日志...

    WindyQin
  • 2月27日数据动态早报|互联网银行未来唯一的核心竞争力就是获取数据源的能力

    数据动态,让您了解数据新变化、新创造和新价值。 ? ---- 一、通信行业数据动态 1 广东电信春节大数据出炉 深圳空城指数最高、出境游日本最热。广东电信日...

    陆勤_数据人网

扫码关注云+社区

领取腾讯云代金券