译文|文本分析是大数据的下一个前沿吗?

无论技术进步有多快,也无论企业体验到之后的好处有多迅速,人们往往展望并期待着下一个大事情的发生。大数据也是一样。一旦组织开始编制旨在简化运营、提高收益的大量数据,他们知道他们已经发现了一个非常具有价值并且极具深远影响的战略。如今,大数据已经被快速使用,并已在各种各样的行业极大地提升着公司的运营能力。但接下来将会发生什么呢?对于很多企业来说,大数据到目前为止的影响是没有什么能与它所提供的尚未开发方式的可能性相提并论。首先在名单上是几乎没有触及文本分析领域,这也被称为文本挖掘。很多人认为文本分析作为承载企业最多希望的领域,在真正探索到大数据的可能性方面,这些企业是寄予厚望的。

如果要说已经有所作为的话,连续多年来企业也仅仅利用了大数据的一个方面——结构化数据。简单来说,结构化数据包括了可严格测量的数字,这些数字是“冷酷”且“坚硬”的。这可能是指有多少人访问一个网站,一个特定的产品销售了多少条目,一个公司生产了多少产品等诸多方面。结构化数据在规模上可以非常广阔,但其衡量的质量使得它的操作程序更为简便,并且更易分析。多年以来,平台和程序已经利用了这一事实。然而,更为复杂的是,这也显现出了大数据的另外一面——非结构化数据。这是数据仅通过数字本身来予以衡量更为困难的。这种挑战使得它更难获得进入众多企业的入口的钥匙,但是企业依旧希望在未来能获得更多更大的成功,而这将需要解锁并不断挖掘发现非结构化数据的潜力,这一切将从文本分析开始起步。

文本分析的目的在于从根本上把所有的非结构化数据整合从而化为结构化数据。但由于考虑到大约80%的数据都是非结构化的数据,因此这是一个非常艰难的任务,但它也从中显示了一个公司可以从这过程中得到多少。非结构化数据可以采取多种多样的形式,比如Facebook的发布,也可以以微博,语音录音,在线评论,甚至是视频的形式。而将解释所有这些信息归结为一点,还是需要拥有正确的技术才能做到这样。因为文本分析,公司可以从通常难以量化的信息中提取大量有价值且有意义的数据,比如社交媒体帖子。这样的信息可以通过手工劳动进行记录,但是文本分析是更加具有效率的,并且可以考虑到产品的整体形象或是网络上提及品牌的全部效益。

文本分析基本上是可以决定一些具有重要性的问题的,比如谁在做评论,在哪里正在做评论,正在说着什么,甚至是非结构化数据的背景以及来龙去脉等诸多问题,文本分析都可以决定。所有这些研究的结果可以被制作成更为可靠且更值得相信的商业情报,从而给企业提供对未来方向、发展规模、企业模式、甚至是未来趋势的新的见解,正因这样,企业就可以发挥自己的作用并加以准备以更好地提升效益,从而不断进步与发展。

利用文本分析来衡量非结构化数据真正价值的途径备受追捧。文本分析基本上允许公司利用技术听取网上和其他地方发生的各种对话,给予他们关于客户情绪体验的一个更大规模的采样。文本分析和临时分析一起应用还可以帮助企业更好地确定客户喜爱的东西和偏好,帮助他们找出是什么在激励着他们,而这反过来又有助于提高收入。从文本分析中获得的反馈也并未经过过滤,但可以给企业更为准确的描述,这个描述是关于消费者如何能真正从多个不同来源的途径获得感觉。所有这些新的信息还可以帮助企业想出极具创新思维和发散思路的新产品,因此这也可以让企业的销售业绩得以提升,让企业得以发展与进步。

不得不说,这是一个不断发展并快速前进的行业,这是一个被预测为其整体价值在2020年将远远超过60亿的行业。只要企业开始使用数据中的一小部分,并且确切地知道他们想找出什么类型和什么方向的信息,他们就会将自己置于一个有利的地位和位置,并为了公司的成长和发展使用该数据。事实上,只要商家愿意探索非结构化数据,文本分析就一定可以被看作是大数据的下一个前沿。

原文作者:Jonathan Buckley,本译文在原文基础上略有改动

本译文由CDA数据分析研究院翻译,译者:Henry

原文发布于微信公众号 - CDA数据分析师(cdacdacda)

原文发表时间:2015-07-17

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏数据猿

99Click CEO马天云:别只跟风小程序,留住用户才是关键

数据猿导读 对于没有“流量”和“红利”的小程序来说,开发者不需要再考虑如何通过小程序将微信用户红利引流到自身品牌,而是要考虑应该怎样运营自己的小程序、提供哪些场...

42270
来自专栏腾讯研究院的专栏

艾瑞刘雷鸣:平台化与垂直化是兴趣社交的未来

12月9日,第7期互联网前沿沙龙举行,本期主题为“兴趣社交—移动社交的下一站”,腾讯QQ兴趣部落、百度贴吧、豆瓣兴趣组等产品负责人王崇生、李英斌、清风,艾瑞...

49180
来自专栏镁客网

极限元温正棋:从前端信号处理到语音识别、对话、声纹情绪与合成,要打造智能交互闭环 | 镁客请讲

23630
来自专栏CSDN技术头条

Adgetec公司CEO、畅销书作者Mark Mueller-Eberstein:云计算大数据推动业务创新发展

【CSDN现场报道】2015年6月3-5日,作为云计算领域最具影响力的盛会——第七届中国云计算大会在国家会议中心盛大开幕。大会以“促进云计算创新发展,培育信息产...

21380
来自专栏云计算D1net

购买或构建:如何解决混合云的困境

导语 如今,企业致力于采用云计算技术,希望能够进行创新以跟上瞬息万变的技术的发展。而竞争格局和消费者需求变化意味着那些不能或不愿意创新的企业很有可能在市场竞争中...

339110
来自专栏华章科技

腾讯发布2015微信用户数据报告

微信已不单单只是一个充满创新功能的手机应用。它已成为中国电子革命的代表。覆盖 90% 以上的智能手机,并称为人们生活中不可或缺的日常使用工具。

10010
来自专栏灯塔大数据

大数据服务及未来——人工智能+大数据生态模式

2012年大数据是个流行词,没想到4年过后,在一些大数据论坛上还有人会说“如果我有大数据,我会怎样怎样……。”好吧,如果还停留在如果上,就不该随便上论坛演讲,讲...

34940
来自专栏PPV课数据科学社区

京东大数据走进北大:揭秘电子商务大数据平台技术架构与产品架构

4月20日,京东大数据来到了北京大学光华管理学院,这次由京东大数据部平台运营管理负责人葛胜利老师给北大光华管理学院的师生们带来主题为“电子商务大数据平台技术架构...

50780
来自专栏CSDN技术头条

大数据时代八大热门IT岗位

新的想法诞生新的技术,从而造出许多新词,云计算、大数据、BYOD、社交媒体、3D打印机、物联网……在互联网时代,各种新词层出不穷,令人应接不暇。 这些新的技术、...

27250
来自专栏华章科技

消除数据孤岛,摆脱企业大数据困境

在2013年大数据全球技术峰会上电子科技大学教授周涛教授提出了大数据发展的三个阶段。

19430

扫码关注云+社区

领取腾讯云代金券