Java程序员在用的大数据工具,MongoDB稳居第一!

据日前的一则大数据工具使用情况调查,我们知道了Java程序猿最喜欢用的大数据工具。

问题:他们最近一年最喜欢用什么工具或者是框架?

受访者可以选择列表中的选项或者列出自己的,本文主要关心的是大数据工具。上一篇Java调查包括下列内容:

  1. 开发语言
  2. Web框架
  3. 应用服务器
  4. 数据库工具
  5. SQL数据
  6. 大数据
  7. 开发工具
  8. 云供应商

现在,来看看维基百科上对大数据的定义:

大数据,广义上来说是一组量很大很复杂的数据集合,在这种情况下传统的数据处理方式将不再适用。

对于一般情况来说传统的SQL数据库足够用。再另外一些场景下,传统的数据库能够承载的数据库量级有限,并且现在有了越来越多的工具可供使用。关键取决于场景。

现在让我们来讨论不同的非SQL工具来存储/处理数据 - NoSQL数据库、内存缓存、全文搜索引擎、实时流媒体、图形数据库等。

大数据-调查结果

  • MongoDB-一种非常流行的、跨平台、面向document的数据库。
  • Elasticsearch-专为云计算设计的分布式REST风格的搜索引擎。
  • Cassandra-一个开源的分布式数据库管理系统。最初是Facebook设计和开发的,部署在大量商用服务器上来处理大量的数据。高可用,无单点故障。
  • Redis-开源的(BSD)内存数据结构存储、内存库、缓存、消息代理。
  • Hazelcast-基于Java开发的内存数据网格。
  • EHCache-广泛使用的开源Java分布式缓存、J2ee、轻量级容器。
  • Hadoop-用java开发的开源分布式大数据框架,用来处理非常大规模数据,hadoop是集群化部署。
  • Solr-使用java开发的开源企业级搜索平台。最初归属在Apache Lucene项目中。
  • Spark-ASF中最活跃的项目,是一个开源的集群化计算框架。
  • Memcached–通用分布式缓存系统。
  • Apache Hive-在Hadoop支持类SQL封装,将SQL语句变成mr程序来执行。
  • Apache Kafka–高吞吐量、分布式、消息发布-订阅系统,最早是Linkin开发的。
  • Akka–Java开发的用来建造高并发,基于jvm弹性消息驱动的应用。
  • Hbase-根据Google的BigTable论文开发的开源分布式非关系型数据库。开发语言是Java,用HDFS作为底层存储。
  • Neo4j–用Java实现的开源图形数据库。
  • CouchBase–面向Document的开源分布式NoSQL数据库,并且针对交互应用做过优化。
  • Apache Storm–开源分布式实时计算系统。
  • CouchDB–使用json来存储数据的开放源码面向文档的NoSQL数据库。
  • Oracle Coherence–内存数据网格解决方案,使企业通过提供快速访问热数据来预测关键任务应用的规模。
  • Titan–可扩展的图形数据库,针对集群存储和查询数千亿的图形数据做过优化。
  • 亚马逊 DynamoDB – 一个快速、灵活NoSQL数据库,能够应对所有规模应用程序的需求,包括持久化、毫秒级延迟。
  • Amazon Kinesis–AWS上的实时数据计算平台。
  • Datomic–提供完整事务支持,云计算,分布式的数据库,开发语言用Clojure。

原文地址:What Big Data Tools Do Java Developers Use?(译者/袁璞 审校/朱正贵 责编/仲浩)

译者介绍:圣特尔•E店宝大数据架构师,关注高性能或可用架构、大数据技术、机器学习。

原文发布于微信公众号 - CSDN技术头条(CSDN_Tech)

原文发表时间:2016-01-29

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏JAVA高级架构

浅谈架构之路:前后端分离模式

前言:分离模式   对前后端分离研究了一段时间,恰逢公司有一个大项目决定尝试使用前后端分离模式进行,便参与其中。该项目从2016年初立项至今,平平稳稳得度过,但...

4426
来自专栏华章科技

盘点:Java程序员在用的大数据工具

译文链接:http://www.codeceo.com/article/big-data-tools-java-programmer-use.html

602
来自专栏大数据和云计算技术

Cloud_Native是什么?

Cloud_Native概念最近比较火,因此研究下到底讲的是什么含义。 Cloud_Native从概念上讲核心说的是传统的应用部署在数据中心上的架构不适合云化的...

3068
来自专栏逸鹏说道

ENode简介与各种教学视频资源汇总

ENode是什么 ENode是一个.NET平台开源的应用开发框架,为开发人员提供了一套完整的基于DDD+CQRS+ES+(in-memory)+EDA架构风格的...

43610
来自专栏大数据文摘

资源 | 被GitHub和微软伤了心?这有9个开源代码版本控制系统

事实上,当前有很多GitHub的替代解决方案,能为你做分布式版本控制(DVCS)。下面就来看看有哪些替代工具。

1173
来自专栏JAVA高级架构

微服务介绍

形像一点来说,微服务架构就像搭积木,每个微服务都是一个零件,并使用这些零件组装出不同的形状。通俗来说,微服务架构就是把一个大系统按业务功能分解成多个职责单一的小...

1201
来自专栏软件成本造价评估

软件造价之:浅析快速功能点方法度量软件的规则及过程

快速功能点方法是一种软件规模度量方法。该方法适用于软件项目早期、中期、后期等各个阶段的规模估算或测量。   采用优化后的功能点方法——快速功能点方法进...

1170
来自专栏JAVA高级架构

单体架构与微服务架构

1653
来自专栏EAWorld

微服务模式系列之一:整体式架构

译者自序: 熟悉我的朋友都知道,我很不喜欢翻译东西,因为在两种语言的思维方式之间做频繁切换对我来说是件很痛苦的事情。但是这次不一样,公司和同事的大力支持降低了我...

2978
来自专栏ThoughtWorks

用了ZAP,你的软件就安全了吗?

今日洞见 文章作者/配图来自ThoughtWorks:刘建华。 本文所有内容,包括文字、图片和音视频资料,版权均属ThoughtWorks公司所有,任何媒体、网...

4339

扫码关注云+社区

领取腾讯云代金券