最佳实践分析:IBM Cognos 11如何链接Hadoop

大数据标志着业务分析的新时代到来,各商业组织现在有机会就数据在容量、速度和多样性的传统处理能力不足问题上作出更加明智的决策。IBM 具有得天独厚的优势, 可以提供全面的技术和服务, 从大数据中吸取可操作的洞察力,通过与如IBM InfoSphere BigInsights 为代表的Hadoop技术互链, IBM Cognos 商业智能现在可以轻松访问非结构化源数据, 从而使业务分析人员能够接触到大量非结构化数据中发现的关键洞察。

简而言之, Hadoop 是一个用于操作大型数据集的分布式平台。它建立了容错能力, 这使得它吸引了停机时间可能影响业务流程的组织。 Cognos是一种商业智能工具, 它允许用户浏览和报告数据。然而, Hadoop 并没有像其它技术所评论的那样, 自己进行即席查询。这里只有一个Hadoop 项目可以做到这点——Hive。开发人员已经发布了 ODBC 连接器来访问配置单元数据库 (这仅仅是您的 Hadoop 数据的数据仓库视图, 可以使用称为 Hive QL 的类似 SQL 的语言进行查询)。由于 Cognos 可以从 ODBC 数据库中提取数据, 因此 Cognos 可以通过配置单元从 Hadoop 提取数据。

在最新的Cognos Analytics 11 环境中使用 Hadoop 的另一种方法是使用文本文件 (如 CSV) 传输数据。Hadoop 可以生成一个数据文件, 然后可以将其导入到 Cognos 中。

然而, 为什么要使用 Hadoop 来连接Cognos呢?举个例子,我使用 Hadoop 的两个应用程序是库存预测和现金流量/预算,如果您正在尝试执行对数十万 SKU 的常规预测, 则 Hadoop 是一个非常好的工具。另外,如果您试图执行蒙特卡洛模拟超过1000预算项目, Hadoop 也是非常棒的选择。只需从数据仓库导入数据, 运行您的 Hadoop 作业, 然后将生成的 CSV 文件导入 Cognos,一切就完成了。

不过要小心, Hadoop 不是万能药。有时,传统的SQL和你的编程语言的选择效果是一样好的,或则更好,因为Hadoop 带有学习曲线和资源需求。你可以通过下载 Hortonworks 的沙箱学习:它是一个预配置的虚拟机, 在 VMware中运行。所以你不必安装或配置任何东西。

另外,IBM InfoSphere BigInsights 为IBM官方的Hadoop产品,本文将用该产品作为Hadoop的链接对象,并且,将通过Cognos最新的Hadoop链接能力说明,来为Cognos的大数据使用作指导。

IBM Cognos 11新特性

首先,Cognos升级到Cognos 11版本有很多重大的变化,名称也由Cognos Business Intelligence变更为Cognos Analytics,从而更加强调分析能力,比如时下流行的敏捷BI,大数据可视化,协同等能力。即很好的保持了Cognos以往稳健的数据工程学体系,来保证用户对于数据的信任,另一方面也提供了简洁的界面来增强用户的使用体验,并且支持云部署。特别是引入的协同能力能使得组织能够轻松地在成百上千的用户和他们的生态系统中共享知识,并为驱动业务结果的决策和操作提供动力。新的Cognos Analytics提供了以下功能:

提供用户端分析

  • 可定制的用户界面,为桌面、平板电脑和智能手机提供一致的体验
  • 综合搜索功能,帮助您导航和快速访问已知内容和发现新内容
  • 自动选择基于数据类型的最佳默认可视化
  • 易于访问参考模板和样式以创建一致的和专业的报告
  • 能够通过引导菜单个性化您的分析环境,并更容易地导航内容,包括收藏夹、通知和我的内容
  • 共享报告和数据模型,为创建新的、扩展的报告和数据模型提供了基础

提供分析和内容的创作

  • 更快速的格式和风格的选择,在需要的地方。
  • 更快地构建交互式报告和预览内容(演练、排序或筛选)。该解决方案还允许用户在web上启动或移动,反之亦然。
  • 更容易将数据拖放到一个可以自动显示数据的环境中。

提供建模能力

  • 使用搜索启用完全基于Web和基于意图的建模。
  • 支持快速创建新模型或修改现有模型的能力,更改模型属性,并提交给每个人使用,并报告多个模型。
  • 提供在相同环境中测试和验证模型的能力。

IBM Cognos 11对Hadoop的支持

在Cognos11最新的功能里,也强化了对于Hadoop的支持,首先,Hive是一个驻留在Hadoop之上的数据仓库系统,Hive提供了数据提取,转换和导入(ETL)工具,它可以添加结构到甚至是基于文本的数据源中,并且能够嵌入大量数据分析到Hadoop的分布式文件系统Hadoop Distributed File System(HDFS)中。

Cognos商业智能系统能生成HiveQL去调用查询BigInsights文件系统,Cognos商业智能服务器通过BigInsights配置Hive JDBC驱动程序链接到BigInsights。Hive目录的元数据可以导入进Cognos Framework Manager,并作为商业智能的元数据建模发布包含BigInsights内容包到Cognos的商业智能服务器中。这些包可以用于创建Cognos报表(包括Cognos互动报表),仪表盘,以及WorkSpaces,同时驱动Big Insights的里的Map/reduce的能力。

Cognos与Hadoop的连接架构图

总结

通过Hadoop的链接,有许多新的信息来源现在可以在Cognos 商业智能上进行分析,而这些重要的数据来源以前却因技术限制而被放弃。这使用户可以利用Cognos 的优势, 在诸如仪表盘, 报表分发,和数据可视化, 和 对BigInsights 的大规模并行处理能力支持。本文中描述的互操作性仅仅是IBM Cognos 商业智能和Hadoop之间的集成的一个未来重要的里程碑。

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏蓝天

互联网后台开发需要掌握什么?

互联网后台开发,通常意味着分布式、大数据,涉及到高性能、系统容灾、数据容灾、高可用性、数据一致性等。自从2008年Hadoop在华夏大地蓬勃发展,开源如火山爆...

23730
来自专栏Debian社区

你和 Linux 高手只差了一个 LFS

很多同学都已经学习了 Linux ,可能已经在自己的机器上安装过 Linux,甚至都能搭建个简单的个人博客,也有可能编译部署过邮件服务器之类的软件,可是感觉仍然...

19830
来自专栏北京马哥教育

通关这12个游戏,你就是编程大神,我不是开玩笑!

为了评选出将游戏和编程结合的最好的网站,我们对比了200多家类似站点。最终我们不负众望,精选出了12个最好的可以让你一边玩游戏一边学编程的网站。 Mybri...

431130
来自专栏祝威廉

数据天生就是流式的

部门目前核心其实就是流式计算,从根部开始(一个超大的Kafka集群)开始,延伸出一个超级庞大的树形结构。整个过程都是数据自我驱动进行流转,没有使用类似Azkab...

9840
来自专栏PPV课数据科学社区

【学习】切勿妄谈Hadoop,以及4个数据管道打造实践

时至今日,大数据这个概念已充斥了整个IT界,各种“搭载”了大数据技术的产品,各种用于处理大数据工具更如雨后的春笋触目皆是。同时,如果某个产品还没抱...

33270
来自专栏九彩拼盘的叨叨叨

littleBits 像搭一样积木发挥创意

视频演示 littleBits的玩具都是小部件,通过参照原型图,玩家不需要特殊的技能就可以发挥自己的创意,组合出各种小物件来。虽说littleBits在...

8020
来自专栏AI研习社

如何在集群中高效地部署和使用 AI 芯片?

AI 研习社按:人工智能技术发展迅猛的背后不仅得益于庞大的数据量,更需要强大的硬件支持。面对层出不穷的 AI 应用,已经很难采用一种通用的硬件进行高效的数据计算...

17340
来自专栏大数据文摘

用Python开源机器人和5美元,我在Instagram上搞到了2500个真粉儿

59950
来自专栏镁客网

用”dadada”做密码!也难怪扎克伯格社交账号会被黑

15920
来自专栏腾讯大讲堂的专栏

谈谈微信红包海量运营--发10亿个红包难在哪里?

编者按:2015年微信红包书写了一个全新奇迹——除夕摇一摇总次数110亿次,峰值1400万次/秒,8.1亿次每分钟,微信红包收发达10.1亿次!惊人数字的背后,...

22970

扫码关注云+社区

领取腾讯云代金券