大数据的日益增长给企业发展带来了机遇,但管理不断增长的数据也对企业提出了挑战。合适的工具不仅能为企业管理大数据提供便利,还能为利用大数据高效地做出决策提供便利。接下来,我们就盘点下企业信息化管理常用的大数据工具。
1. Apache Hive
Hive是一个建立在Hadoop上的开源数据仓库基础设施。通过Hive,可以很容易地进行数据的ETL、对数据进行结构化处理,并对Hadoop上的大数据文件进行查询和处理等。Hive提供了一种简单的类似SQL的查询语言——HiveQL,这为熟悉SQL语言的用户查询数据提供了方便。
2.JaspersoftBI套件
Jaspersoft包是一个通过数据库列生成报表的开源软件。许多企业使用Jaspersoft软件来将SQL表转化为pdf,这大大提升了企业的工作和决策效率。另外,JasperReports提供了一个连接配置单元来替代HBase。
3. 1010data
1010data创立于2000年,是一个总部设在纽约的分析型云服务提供商,旨在为华尔街的客户提供服务,包括NYSEEuronext、游戏和电信的客户。其产品在设计上支持可伸缩的大规模并行处理,并且开发了自己的查询语言,支持SQL函数和广泛的查询类型,包括图和时间序列分析。这种私有云的方法减少了客户在基础设施管理和扩展方面的压力。
4. Actian
Actian之前的名字叫做IngresCorp,它通过Vectorwise以及对ParAccel实现了扩展。这些发展分别导致了ActianVector和ActianMatrix的创建。它有Apache、Cloudera、Hortonworks以及其他发行版本可供选择。
5. Pentaho Business Analytics
从某种意义上说,尽管Pentaho开始于报告生成引擎,但它目前通过简化新来源中获取信息的过程来支持大数据处理。Pentaho的工具可以连接到NoSQL数据库,例如MongoDB和Cassandra。PeterWayner指出,PentahoData(一个更有趣的图形编程界面工具)有很多内置模块,你可以把它们拖放到一个图片上,然后将它们连接起来。
“大数据与数据科学家”公众号
主编:王宏志
特邀副主编:朱劼
副主编:丁小欧
责任编辑:齐志鑫,王雨茁,陈柯昊
编辑: 陶颖安
-精彩内容,记得分享到朋友圈-
领取专属 10元无门槛券
私享最新 技术干货