做蚱蜢、蜘蛛还是狐狸?新兴大数据公司的四种理念

随着大数据概念的提出,新兴相关数据公司也犹如雨后春笋般出现,想象一下每早与大数据创业梦想一起醒来,这确实是一种美妙的感觉。粗浅地想象一下貌似处理大数据很容易,你只需要:

1)一个使一切工序“自动化”的想法

2)一伙能够拿出一个个算法的“数据科学家”

3)数据!大量的数据!

如果你已经有了一个基本的想法,而至于那些“数据科学家”们,你通常可以在和你合伙的小伙伴们中找到他们(如果没有的话,去哈佛、耶鲁、伯克利或者纽约大学这样的高校碰碰运气吧)。 万事具备,只欠东风,那么问题来了,该如何找到数据呢?通常有以下几个可以考虑的备选策略。

策略1:蚱蜢——相信开放数据吧!

蚱蜢先生是个乐天派,他总是告诉自己:“别担心,总会有可供使用的数据出现的,说不定它们之中还会有可以自由访问的呢!”不论现在或是将来,他相信开放数据,这一切都是为了提供他自己的服务。

这种开放数据策略可以在金融和运输市场中带来可盈利的成果。例如,初创公司往往可以运用商品运输信息,并且将它与货物与市场价格进行交叉关联,从而对有关的工业提供高度相关的信息。

这个方法的主要缺点是数据的开放范围往往有限。事实上,由于伦理或是经济方面的原因,当你想研究一个具体的东西,比如一个人、一个产品或一个地址时,开放的数据总是有所遗漏的。无论如何,最有用的东西往往是那些自己私有的(真是幸运)和花钱买来的(真是悲催)。

策略2:蜘蛛——编织你自己的网络吧!

蜘蛛先生总是那么一丝不苟。“没有数据?没关系,让我们去寻找它。”蜘蛛先生创建了一个网络结点以供他捕获数据,有时他从一个小结点出发,然后慢慢寻找更大的。蜘蛛先生将制造所有的接入点和链接器,并允许所有的参与者在使用他的服务的同时时把数据提供给他。

大多数的在线营销者采取这样的做法:这意味着你的“tracker”(从第三方网站获取流量的组件)都在网上,从而能够有最大化的数据量和最大的网络可能性。而如今,这一切正在向移动应用端转移,我们不在谈论如何运用“tracker”而是如何运用SDK(软件开发工具包)。在我们生活的现实世界中,Lokad公司已经构建了一个延伸到超市收银机的网络,使得大部分的专用收银机和库存管理程序间实现了简单的链接,从而为超市库存管理提供了一个有效的解决方案。

如果一切顺利,蜘蛛先生的方法将使得他足以建立一个扩张速度很快的成功企业。然而,这样的方案对以下两个风险因素极其敏感:

蜘蛛网太脆弱了(一个大的网络参与者可以决定“改变游戏规则”并摧毁一切)

足够肥美的昆虫太少了(也许那些大型客户和真正有兴趣的客户并不在这个网络的覆盖的范围内)

策略3:狐狸——狩猎“大集团”!

狐狸先生在哪里寻找“大数据”呢?答案是在那些已经把“大数据”喂得饱饱的大企业里。 狐狸先生按照以下几个步骤行动:

首先,他提出一个问题的可能的解决方案(例如,减少欺诈行为,提高你的广告购买的投入,增加你的邮件营销途径,采购性能更好的原材料,等等) 接着,他开始收集客户资料,并尝试实现解决问题的方案 最后,他将运用从第一个客户那学来的知识,对之后客户提出的问题给出更为简化的解决方案。

狐狸先生的一生十分艰辛,因为在他迈出走向成功的第一步时,就必须坚信自己能够解决那些自己从未解决过的问题。为此,他必须激发出自身强大的欲望(为了吸引大集团老总的注意),招摇自己的能力(大谈算法、职称、学历),炫耀自己所有的华丽衣冠(那些使人耳目一新的图表设计规划)。因此,“大数据”狐狸是一个吃力不讨好的角色,往往在他得到用真实的数据证明自己的机会之前,就不得不费尽心思地去说服别人。

当狐狸先生成功时,他便可以真真正正地为潜在的客户解决一个有直接价值的实际问题了。然而,这么做同样有非常显著的副作用:那些辛辛苦苦为第一个大客户建立的产品、服务和模型往往将会被卖给他们的竞争队手,一些相对较小的客户,这就相当于狐狸先生教会了自己的大客户如何更好服务于他们的竞争对手(那些小客户)。这意味着,参与其中的大集团们有时将会间接地帮助自己的竞争者去以更低廉的价格获得服务,从而无形之中充当了替罪羊的角色。

策略4 工具制造者!

既然所有人都想玩转大数据,那么为什么不把大数据分析交给工具,而我们只需成为工具制造者。

大数据分析工具市场是一个竞争化的市场,既有一些新创立的小企业的参与,也有一些类似于谷歌、微软、Oracle等的行业龙头的参与。同时,大数据分析工具市场也是一个强吸金市场,单2014年就有数十亿美元的投资额。然而,当这次大数据分析的热潮过去之后,大数据分析工具的需求是否还会持续?这是目前该市场面临的主要问题。这极其类似淘金时代过去后,对镐这种工具的生产是否还具有大规模可持续性的问题。当然,目前我们对大数据的分析尚停留在石器时代,能够进行大数据分析的“镐”还没有完全被开发出来。智能计算机系统需要更高效更可控的分析工具。就让我们先生产出“镐”吧,然后期待以后的某一天可以生产出大数据分析的“手提钻”!

来源:数据工匠

PPV课其他精彩文章:


1、回复“干货”查看干货 数据分析师完整知识结构

2、回复“答案”查看大数据Hadoop面试笔试题及答案

3、回复“设计”查看这是我见过最逆天的设计,令人惊叹叫绝

4、回复“可视化”查看数据可视化专题-数据可视化案例与工具

5、回复“禅师”查看当禅师遇到一位理科生,后来禅师疯了!!知识无极限

6、回复“啤酒”查看数据挖掘关联注明案例-啤酒喝尿布

7、回复“栋察”查看大数据栋察——大数据时代的历史机遇连载

8、回复“数据咖”查看数据咖——PPV课数据爱好者俱乐部省分会会长招募

9、回复“每日一课”查看【每日一课】手机在线视频集锦

PPV课大数据ID: ppvke123 (长按可复制)

大数据人才的摇篮!专注大数据行业人才的培养。每日一课,大数据(EXCEL、SAS、SPSS、Hadoop、CDA)视频课程。大数据资讯,每日分享!数据咖—PPV课数据爱好者俱乐部!

原文发布于微信公众号 - PPV课数据科学社区(ppvke123)

原文发表时间:2015-06-23

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏PPV课数据科学社区

码农是程序员吗?码农与真正程序员的区别

  人类总是会对自己的未来充满了焦虑,在我们对未来心存怀疑的时候,任何一则“消极”一点的消息都能让我们更加否认自己的未来,这一心理近日在对程序员前景心存质疑的人...

41680
来自专栏小文博客

为什么你应该#从现在开始就#写博客

9210
来自专栏织云平台团队的专栏

限量赠票!请你来看腾讯运维双雄全国首场“演唱会”

? 今年四月,全球运维大会深圳站,由腾讯社交网络部运维总监聂鑫出品的《腾讯运维体系专场》圆满结束,备受好评。各位看客想必还是意犹未尽。九月,全球运维大会·上海...

11420
来自专栏SDNLAB

从一个网工的独白说开去

独白 曾看到一位网络工程师给自己这样的独白:“我给自己的Title写的是网络大夫,因为感觉做网络的很像医生,只有网络有故障的时候才会想到网络工程师是多么重要,能...

33540
来自专栏测试开发架构之路

记我的一次电话面试

昨天晚上突如其来一个广东深圳座机电话,第一感觉是骚扰电话。可是接通后对方说“我是腾讯公司的。。。”,瞬间懵逼,原来这就是传说中的电话面试,人生第一次就这样献给了...

679120
来自专栏SDNLAB

开放网络没那么简单

开放网元、释放数据的价值 从2012年开始至今,网络行业明显是O字辈的天下。所有我接触过了解过的组织和项目,都鲜有不含“Open”这个单词的。 ONF/OPNF...

27130
来自专栏即时通讯技术

QQ现状深度剖析:你还认为QQ已经被微信打败了吗?

移动端的时代里,微信占据了社交领域的半壁江山,不得不让人想起曾经PC时代里的王者“QQ”,微信的爆发和QQ的停滞让很多人认为微信已经彻底将QQ打败,QQ已经不再...

24720
来自专栏VRPinea

Facebook F8狂潮不停,发力脑机接口要实现心灵感应!

29060
来自专栏产品成长日志

从[低水平勤奋]到[爆发式成长]的高效策略

上学时不清楚为何学习,随着大流,摸索着方法,完成一次次考试,磕磕绊绊,完成了研究生学业,但是依然不知道学习到底有什么用。

9310
来自专栏PPV课数据科学社区

【经验】数据告诉你:提高效率就别做这7件事

作者丨CamMiPham译者丨SherryMoon 当我17岁时,常常一天工作学习20小时左右。我利用课间完成作业,晚上则去管理一个公益组织。那时付出的努力给了...

36690

扫码关注云+社区

领取腾讯云代金券