20个顶级大数据分析工具

世界上有数以千计的大数据工具,用于今天的数据分析。数据分析是对数据进行检查,清理,转换和建模的过程,其目标是发现有用的信息,提出结论和支持决策。为了帮大家节省查找工具的时间,本文分别按照开源数据分析工具、数据可视化工具、情感分析工具三个分类列出20个顶级大数据分析工具。

开源数据分析工具

1. Knime

KNIME分析平台是数据驱动型创新领域中领先的开放式解决方案,它可以帮助您发现隐藏在数据中的潜在性信息,挖掘出新的视角,或预测新的未来。

KNIME分析平台拥有1000多个模块,数百个可随时运行的示例,全面的集成工具以及最广泛的高级算法选择,是数据科学家的理想工具箱。

2. OpenRefine

OpenRefine(以前称为Google Refine)是处理凌乱数据的强大工具。它可以清理数据,将数据从一种格式转换为另一种格式,并使用Web服务和外部数据进行扩展。 OpenRefine还可以帮助您轻松地探索大型数据集。

3. R语言

R语言项目是一个GNU项目,它主要是用C和Fortran来编写的,其自身很多模块都是用R语言编写的。它是用于统计计算和数据可视化的免费软件编程语言或软件环境。R语言被广泛用于数据挖掘、统计和数据分析。由于其易用性和可扩展性,近年来R的普及程度已经大大提高了。

4. Orange

Orange是同时适用于新手和专家的开源数据可视化和数据分析工具,提供交互式工作流和大型工具箱,以创建交互式工作流来分析和可视化数据。Orange包含有不同的可视化图形,从散点图,条形图,到树状图,网络图和热力图。

5. RapidMiner

与KNIME非常相似,RapidMiner通过可视化的程序进行操作,能够用于数据的处理分析和建模。 RapidMiner使得数据科学团队通过开源平台进行高效的数据前期处理,机器学习和模型部署。其统一的数据科学平台加速了在单一环境中构建完整的分析工作流程 。从数据准备到机器学习,再到模型验证和部署,大大提高了效率,缩短了数据科学项目的时间。

6. Pentaho

Pentaho解决了阻碍组织从大量数据中获得数据价值的障碍。该平台简化了所有数据的准备和融合,并包含了一组工具,可以方便地进行数据的分析、可视化、探索、报告和预测。开放的、可嵌入的和可扩展的的架构可以确保数据团队中的每一个成员(从开发人员到业务用户)能够很容易地将数据转换为价值。

7. Talend

Talend是针对数据驱动型企业用户,领先的开源集成软件提供商。

其用户可以快速地连接到任何地方。从地面到云,再到流媒体、数据或应用集成,Talend可以将大数据范围内的连接,以1/5的成本提高五倍的速度。

8. Weka

Weka是一种开源软件,它是一个数据挖掘任务的机器学习算法的集合。这些算法既可以直接应用于数据集,也可以从JAVA代码中调用。

对于那些没有编码过一段时间的人来说,Weka的GUI提供了一个最简单的过渡到数据科学世界的方式。

9. NodeXL

NodeXL是一种关系和网络的数据可视化和分析软件。NodeXL提供了精确的计算。它是一个免费的和开源的网络分析和可视化软件。

它是数据分析的最佳统计工具之一,其中包括先进的网络度量、对社交媒体网络数据导入器的访问和自动化。

10. Gephi

Gephi也是一个开源的网络分析和可视化软件包,它是在NetBeans平台上用Java编写的。它甚至可以生成复杂的Facebook和Linkedin社交关系网络图。Gelphi借助于精确地计算,而领先一步。

数据可视化工具

11. Datawrapper

Datawrapper是一种在线数据可视化工具,用于制作交互式图表。

当你上传了csv/pdf/excel格式的数据,或者直接把它粘贴进去,Datawrapper就可以产生一个条形、线条、地图或任何其他相关的可视化图形。

Datawrapper生成的图形可以嵌入到任何网站或CMS中,并带有随时可用的嵌入代码。许多记者和新闻机构使用Datawrapper在他们的文章中嵌入实时图表。

12. Solver

Solver擅长提供世界级的财务报告、预算和分析,并通过按下按钮访问所有的数据源,从而推动全公司的盈利能力。Solver提供了BI360,它适用于云计算和本地部署,主要集中在四个关键的分析领域。

13. Qlik

Qlik可以让你通过创建可视化控制台和应用程序来解决公司问题,可以让你看到数据里蕴涵的一切。

14. Tableau Public

Tableau Public是一个简单而直观的数据可视化工具。它在商业数据的处理中非常强大,可以通过强大的数据可视化功能来传达信息。

在分析过程中,画面的视觉效果让你能够快速的判断一个假设,然后在开始一个危险的统计旅程之前去探索这些数据。

15. Google Fusion Tables

Google Fusion tables是一个令人难以置信的强大工具,它用于数据分析、大型数据集可视化和映射。毫不奇怪,谷歌强大的地图软件在这个工具中发挥了重要作用。

16. Infogram

Infogram提供超过35种互动图表和500多种地图,帮助您将您的数据可视化。它可以创建各种图表,包括柱状图、条形图、饼图和词云等。你甚至可以在你的信息图或报告中添加一张地图来给你的听众留下深刻的印象。

情感分析工具

17. Opentext

OpenText情绪分析模块是一种专门的分类引擎,用于识别和评估文本内容中的主观模式和情绪表达。

分析可以在话题、句子和文档等层次上进行,并且可以识别文本的部分是事实还是主观臆断,识别出内容中表达的观点是积极的、消极的、混合的或中性的。

18. Semantria

Semantria是一种提供独特服务的工具,它可以通过收集文本、推文和其他用户的评论,并细致地分析它们,从而得出可行的、有价值的见解。

Semantria可以通过API和Excel插件提供文本分析。它不同于Lexalytics,因为它是通过API和Excel插件提供的,而且它整合了一个更大的知识库,并使用了深度学习。

19. Trackur

Trackur的自动情绪分析可以实时分析你需要监测的特定关键字,然后可以判断这个关键字表达的态度是积极的、消极的或中性的。这在Trackur算法中权重最大。

它可以用来监控所有的社交媒体和主流新闻平台,通过趋势、关键字发现、自动情绪分析和评分来获得有价值的信息。

20. SAS情绪分析

SAS情绪分析可以针对一段时间或者实时地自动提取情绪,并通过统计建模和基于一定规则的自然语言处理技术的独特组合来提取情绪。

通过持续的评估,您可以改进模型并调整分类,以反映出与您的客户、组织或行业相关的新主题和新术语。

本公众号原创作品,未经授权禁止转载,特此声明,谢谢合作!

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180120G06OZ200?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券