深入浅出为你解析关于大数据的所有事情

大数据是什么?为什么要使用大数据?大数据有哪些流行的工具?本文将为您解答。

现在,大数据是一个被滥用的流行词,但是它真正的价值甚至是一个小企业都可以实现。

通过整合不同来源的数据,比如:网站分析、社交数据、用户、本地数据,大数据可以帮助你了解的全面的情况。大数据分析正在变的越来越容易,成本越来越低,而且相比以前能更容易的加速对业务的理解。

大数据通常与企业商业智能(BI)和数据仓库有共同的特点:高成本、高难度、高风险。

以前的商业智能和数据仓库的举措是失败的,因为他们需要花费数月甚至是数年的时间才能让股东得到可以量化的收益。然而事实并非如此,实际上你可以在当天就获得真实的意图,至少是在数周内。

为什么使用大数据?

数据在呈爆炸式的速度增长。其中一个显著的例子来自于我们的客户,他们大多使用谷歌分析。当他们分析一个长时间段数据或者使用高级细分时,谷歌分析的数据开始进行抽样,这会使得数据的真正价值被隐藏。

现在我们的工具Clickstreamr可以收集点击级的巨量的数据,因此你可以追踪用户在他们访问路径(或者访问流)中的每一个点击行为。另外,如果你加入一些其他的数据源,他就真正的变成了大数据。

更完整的解析

大数据并不仅仅是大量的数据。他的真正意义在于根据相关的数据背景,来完成一个更加完整的报告。举个例子,如果你把你的CRM数据加入到你网站的数据分析当中,你可能就会找到你早就知道的高价值用户群。她们是女性,住在西海岸,年龄30至45,花费了大量的时间在Pinterest和Facebook。

现在你已经被这些知识武装起来了,那就是如何有效的设定和获取更多高价值的用户。

类似Tableau和谷歌这样的公司给用户带来了更加强大的数据分析工具(比如:大数据分析)。Tableau提供了一个可视化分析软件的解决方案,每年的价格是2000美金。谷歌提供了BigQuery工具,他可以允许你在数分钟内分析你的数据,并且可以满足任何的预算要求。

大数据是什么?

由于大数据往往是一个混合结构、半结构化和非结构化的数据,因此大数据变得难以关联、处理和管理,特别是和传统的关系型数据库。当谈到大数据的时候,高德纳公司(Gartner Group,成立于1979年,它是第一家信息技术研究和分析的公司)的分析师把它分成个3个V加以区分:

  • 量级(Volume):大量的数据
  • 速率(Velocity):高速的数据产出
  • 多样性(Variety):多种类型和来源的数据。

正如我们所说,大部分的企业每一天在不同的领域都在产出大量的数据。这里给出一组样本数据的来源及类型,他们都是企业在做大数据分析时潜在的收集和聚合数据的方式:

  • 网站分析
  • 移动分析
  • 设备/传感器数据
  • 用户数据(CRM)
  • 统一的企业数据(ERP)
  • 社交数据
  • 会计系统
  • 销售点系统
  • 销售体系
  • 消费者数据(例如益佰利的数据、邓氏商联的数据或者普查数据)
  • 公司内部电子表格
  • 公司内部数据库
  • 位置数据(空间位置、GPS定位的位置)
  • 天气数据

但是针对无限的数据来源,不要去做太多事情。把焦点放在相关的数据上,并且从小的数据开始。通常以2-3种数据源开始是一个好的建议,比如网站数据、消费者数据和CRM,这些会让你得到一些有价值的见解。在你最初进入大数据分析之后,你可以开始添加数据源来促进你的分析,并且公布更多的分析结果。

想要获得更多关于大数据细节的知识,可以去查阅维基百科的大数据词条。

大数据的好处

大数据提供了一种识别和利用高价值机会的前瞻性方法。如果你想,那么大数据可以提供如下好处:

  • 根据数据背景获得更完整的情况
  • 利用数据驱动做出更好的商业决策
  • 降低商业风险
  • 市场上最好的解决方案
  • 开发出更好的定制化产品或服务
  • 更好的预测客户的需求和想法
  • 迅速适应市场
  • 在实时数据的趋势和预测上更加主动
  • 建立精确的生命价值周期(LTV)、地图和用户类型
  • 阅读更长和更复杂的属性窗口(用于网站点击流数据)
  • 对通过细分的更复杂的导航进行可视化,并且改善你的转化漏斗(用于网站点击流数据)

并不适用所有人

请记住,大数据分析并不适合所有人。如果你没有安装并且制定分析中的目标、没有准备好归因模型、再营销和高级细分,那么你就没有为大数据做好准备。

如果你把谷歌分析使用到了极限,特别是由于他的采样数据。那么你已经准备好接触大数据的皮毛了。

入门级大数据解决方案

目前有一大批面向企业级的大数据解决方案,比如甲骨文、SAP,、IBM、EMC和惠普。但是。这篇文章是面向寻找入门级大数据解决方案的中小型企业的读者。下面我们将讨论数据分析的输出,并且分享两个相对廉价的解决方案,从而帮助你开始使用大数据分析。

分析结果的输出

目前对于大多数企业而言,数据分析主要还是针对核心数据。然而在未来,数据分析将不会采用采样数据,并且会结合其他来源的数据,使用更加复杂的工具(比如Tableau)去分析他。谷歌分析是一个伟大的工具,但是你能获得的结果目前已经到达极致了。

汇总数据的第一步往往是你输出数据分析的过程。

如果你是一个谷歌分析高级版的用户,这将很容易被推进。因为谷歌分析高级版集成了BigQuery功能来帮助企业推动大数据分析。(学习更多的关于数据分析及BigQuery的集成,请查看视频)

如果你是一个谷歌分析标准版的用户,也不用担心。我们已经开发了一个工具,它可以导出未采样的谷歌分析数据,并且把数据推送到BigQuery,或者其他的可以做大数据分析的数据仓库或者数据工具中。

(注:你可能也注意到了其他的可以导出谷歌分析未采样数据的工具,但是不同的是,这是我们的主要工作。作为一个谷歌分析工具的咨询公司,我们不得不经常帮助客户导出未采样的数据做报告用。但是当我们发现了其他工具的一些问题时,我们不得不自己创建一个更可靠的解决方案。)

一旦你导出了你的数据,你可以做好准备把它导入到一个大数据分析工具中进行存储、处理和可视化。这就给我们带来了最好的入门级大数据解决方案。

谷歌大数据解决方案

谷歌BigQuery是一个网络服务,它能够让你执行数十亿行的大规模的数据集的交互分析。重要的是它很容易使用,并且允许精明的用户根据需求开发更加大的功能。

BigQuery采用你容易承受的按需定价的原则,当你开始存储和处理你的大数据查询时,每个月的花费只有几百美金。事实上,每个月前100GB的数据处理是免费的。随着你需求的增长,你可以拓展你的数据需求,并且为这部分需求买单。最好的消息是,BigQuery使得大数据存储和处理适用于所有人。

Tableau大数据解决方案

Tableau提供了4个强大的功能(也许更多)来促进大数据分析和预测分析。

  • Salesforce连接器允许你轻松的连接CRM和销售数据(更快、更容易的连接CRM和销售数据,所以如果你使用Salesforce,没有什么理由不加入大数据)
  • 谷歌分析链接可以帮助你更容易的创建自定义的仪表盘和报告(然而这个功能依旧需要升级才能变的更好)
  • 谷歌BigQuery连接器可以快速的分析在谷歌免费的网络服务中的大量数据。
  • 为任何点击行为的分析添加预测的功能(真正快速的预测)

数据分析师是关键

企业想要利用大数据,是需要一个数据分析师的。他必须知道不同数据的用法,并且要授予工具连接数据的权限。

当一个数据分析师使用BigQuery或者Tableau来完成提取和合并数据时,他们可以发现在大型数据集合当中的隐藏的模式。这才是大数据分析的关键。它可以是决策者做出更好的决策,并且加强了更精细颗粒度的数据段的识别。

利用这个新技能,你可以发现不同的用户与网站的互动行为。你可以在谷歌分析中以此来创建新的高级细分规则并且针对你的市场或者网站活动做出更高的价值分析。

发现不明情况内的价值

你的很多不同的数据隐藏不明的情况,这些是希望被发现并告知的。开始把网站分析、CRM、社交数据、位置数据等不同的数据源进行结合。这会使你的数据有了相关的背景,并且允许你通过数据看到一个更加完整的情况。这一定会让你胜出竞争对手。

为了说明这点,我们举个例子,通过大数据分析汇总社交数据、位置数据、客户数据、销售数据,你可以发现在旧金山的社会化媒体的趋势。这使你可以利用用户需求的增加来增加特定地区的库存。

不要忘了大数据分析的黄金法则:关注点,在正确的时间关注正确的商业问题。

原文发布于微信公众号 - CDA数据分析师(cdacdacda)

原文发表时间:2014-07-23

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏PPV课数据科学社区

深入浅出为你解析关于大数据的所有事情

大数据是什么?为什么要使用大数据?大数据有哪些流行的工具?本文将为您解答。 现在,大数据是一个被滥用的流行词,但是它真正的价值甚至是一个...

2684
来自专栏EAWorld

DevOps 5.0版本的150天历程

做DevOps产品差不多三年了,中间经历了诸多架构变迁、团队变动、业务目标调整,终于在七月下旬,正式发布了DevOps产品的 5.0 LA版本。这个版本从三月到...

3363
来自专栏数据猿

投稿丨教你从0到1搭建SaaS产品运营体系

<数据猿导读> SaaS行业不同于传统的行业,其资金投入与收益过程具有显著特征。经过了2015年的爆发式发展,处在风口的SaaS企业将会何去何从?流量获取的价格...

1.3K4
来自专栏SDNLAB

问世间云为何物:业务向云迁移的十大原因

云计算基础设施指的是支持云计算模型计算需求的软件和硬件组合,包括存储单元、服务器、虚拟化监控和网络软件。众多迁移到云计算中的业务已经充分享受到了云计算带来的便利...

34910
来自专栏ATYUN订阅号

【业界】重大消息!Adobe收购了语音应用平台Sayspring

Adobe今天宣布:其已经收购了Sayspring语音应用平台,该平台允许用户设计、构建语音应用程序的原型,比如Alexa技能或谷歌智能助理操作。但Adobe拒...

1203
来自专栏WeTest质量开放平台团队的专栏

Hi,腾讯 WeTest 联合 Unity官方打造了新的性能分析工具 UPA

早在2016年ChinaJoy开始,WeTest曾受邀出席过Unity中国的线下性能场的活动,介绍我们的自动化框架和王者荣耀的故事。当时的活动很成功,期间我们收...

2141
来自专栏about云

大数据架构和模式(二)如何知道一个大数据解决方案是否适合您的组织

问题导读 1.如何判断大数据问题是否需要大数据解决方案? 2.如何评估大数据解决方案的可行性? 3.可通过大数据技术获取何种洞察? 4.是否所有大数据都存在大...

3497
来自专栏ThoughtWorks

浅谈软件项目规模估计——估什么?

预测是一件非常困难的事情,尤其是预测未来。—— 尼尔斯.玻尔 ? 玻尔 定制化软件开发是一件复杂的事情,尤其是目前我们主要提供的端到端软件交付,它极大拓宽了软件...

3396
来自专栏EAWorld

企业如何按需选择元数据管理工具?

在各种数字化的影响下,将企业环境中的各种元数据整合利用至关重要。对于企业来说,选择适合自己的元数据管理工具将能最大化发挥元数据的作用,以协助企业完成在数据方面的...

2702
来自专栏SDNLAB

编排不等于用例:不属于编排的Top3

在云计算的早期,我们曾花费大量时间教客户关于云是什么,如何使用它,为什么它是好的,更重要的是,云不是什么。

1204

扫码关注云+社区

领取腾讯云代金券