开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

有没有办法把Spark-cassandra与SpringBoot 2集成？

是的，可以将Spark-cassandra与Spring Boot 2集成。Spark-cassandra是一个用于在Apache Cassandra和Apache Spark之间进行高效数据交互的库。而Spring Boot是一个用于简化Spring应用程序开发的框架。

要将Spark-cassandra与Spring Boot 2集成，可以按照以下步骤进行操作：

首先，在Spring Boot项目的pom.xml文件中添加Spark-cassandra的依赖项。可以使用Maven或Gradle进行依赖管理。例如，使用Maven，可以在<dependencies>部分添加以下代码：

<dependency>
    <groupId>com.datastax.spark</groupId>
    <artifactId>spark-cassandra-connector_2.11</artifactId>
    <version>2.5.1</version>
</dependency>

然后，创建一个SparkSession对象，用于与Cassandra进行交互。可以在Spring Boot应用程序的配置类中添加以下代码：

@Configuration
public class SparkConfig {

    @Bean
    public SparkSession sparkSession() {
        SparkConf sparkConf = new SparkConf()
                .setAppName("Spark Cassandra Integration")
                .setMaster("local[*]")
                .set("spark.cassandra.connection.host", "your_cassandra_host");

        return SparkSession.builder()
                .config(sparkConf)
                .getOrCreate();
    }
}

请注意，你需要将"your_cassandra_host"替换为实际的Cassandra主机地址。

接下来，在Spring Boot应用程序的服务类或控制器类中，可以使用SparkSession对象执行Spark操作，例如读取和写入数据。以下是一个简单的示例：

@Service
public class MyService {

    @Autowired
    private SparkSession sparkSession;

    public void readFromCassandra() {
        Dataset<Row> data = sparkSession.read()
                .format("org.apache.spark.sql.cassandra")
                .option("keyspace", "your_keyspace")
                .option("table", "your_table")
                .load();

        // 进行数据处理或其他操作
    }

    public void writeToCassandra() {
        Dataset<Row> data = ...

        data.write()
                .format("org.apache.spark.sql.cassandra")
                .option("keyspace", "your_keyspace")
                .option("table", "your_table")
                .save();

        // 其他操作...
    }
}

请注意，你需要将"your_keyspace"和"your_table"替换为实际的Cassandra键空间和表名称。

最后，在Spring Boot应用程序的配置文件(application.properties或application.yml)中，可以配置Spark和Cassandra的相关属性，例如Spark的主机地址、端口号等。

通过以上步骤，你就可以成功集成Spark-cassandra与Spring Boot 2，并在Spring Boot应用程序中使用Spark进行数据处理和与Cassandra进行交互。

关于Spark-cassandra和Spring Boot的更多信息，请参考以下腾讯云产品和文档链接：

希望以上信息能对你有所帮助！

相关搜索:有没有办法将本地hadoop与jenkins集成？有没有办法把wordpress数据库和ionic app集成起来？我们有没有办法把control-m和mule集成起来呢？将缺省H2db更改为MySql，以便与springboot集成jbpm 有没有办法把数据从Dev2Dev转到Grafana？有没有办法把2个盒子图合并成1个呢？有没有办法用NetSuite实现与外部应用程序的OAuth集成？有没有办法把电路集成到一个类似于iFrames的网站上？有没有办法将java bean验证api与Spring RestTemplate集成在一起？有没有办法将spring集成tcp udp适配器与tibco rv结合使用？有没有办法把DialogFlow和Google Assistant集成起来？我在左窗格中看不到DialogFlow中的任何集成选项有没有办法将使用IBM Watson创建的聊天机器人与Skype集成？有没有办法将颤振应用程序与WordPress内容管理系统集成？有没有办法把npm的lockfileVersion降低到lockfileVersion@1，它会自动变成lockfileversion@2？有没有与Google Recaptcha V3集成AD B2C的示例有没有办法把一个特定的列从excel表格(比如sheet_1)复制到sheet_2中的另一列？使用Python 有没有办法将AKS集群1中的Hazelcast服务器成员(A、B、C)中存储的数据与AKS集群2中的Hazelcast服务器成员(D、E、F)共享

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

【问底】许鹏：使用Spark+Cassandra打造高性能数据分析平台（二）

【导读】笔者（许鹏）看Spark源码的时间不长，记笔记的初衷只是为了不至于日后遗忘。在源码阅读的过程中秉持着一种非常简单的思维模式，就是努力去寻找一条贯穿全局的主线索。在笔者看来，Spark中的线索就是如何让数据的处理在分布式计算环境下是高效，并且可靠的。在对Spark内部实现有了一定了解之后，当然希望将其应用到实际的工程实践中，这时候会面临许多新的挑战，比如选取哪个作为数据仓库，是HBase、MongoDB还是Cassandra。即便一旦选定之后，在实践过程还会遇到许多意想不到的问题。要想快速的解决开

大数据和云计算技术周报（第127期)

通过java去实现，基于AOP和Redis实现对接口调用情况的接口及IP限流，调用每个接口，实现正常与异常的调用，并限制同一个ip地址多次调用，文章中讲解了如何设计，以及事列代码

02

【问底】许鹏：使用Spark+Cassandra打造高性能数据分析平台（一）

【导读】笔者（许鹏）看Spark源码的时间不长，记笔记的初衷只是为了不至于日后遗忘。在源码阅读的过程中秉持着一种非常简单的思维模式，就是努力去寻找一条贯穿全局的主线索。在笔者看来，Spark中的线索就是如果让数据的处理在分布式计算环境下是高效，并且可靠的。在对Spark内部实现有了一定了解之后，当然希望将其应用到实际的工程实践中，这时候会面临许多新的挑战，比如选取哪个作为数据仓库，是HBase、MongoDB还是Cassandra。即便一旦选定之后，在实践过程还会遇到许多意想不到的问题。要想快速的解决开

08

【Spark研究】用Apache Spark进行大数据处理第一部分：入门介绍

什么是Spark Apache Spark是一个围绕速度、易用性和复杂分析构建的大数据处理框架。最初在2009年由加州大学伯克利分校的AMPLab开发，并于2010年成为Apache的开源项目之一。与Hadoop和Storm等其他大数据和MapReduce技术相比，Spark有如下优势。首先，Spark为我们提供了一个全面、统一的框架用于管理各种有着不同性质（文本数据、图表数据等）的数据集和数据源（批量数据或实时的流数据）的大数据处理的需求。 Spark可以将Hadoop集群中的应用在内存中的运行速度提

07

【Spark研究】用Apache Spark进行大数据处理之入门介绍

什么是Spark Apache Spark是一个围绕速度、易用性和复杂分析构建的大数据处理框架。最初在2009年由加州大学伯克利分校的AMPLab开发，并于2010年成为Apache的开源项目之一。与Hadoop和Storm等其他大数据和MapReduce技术相比，Spark有如下优势。首先，Spark为我们提供了一个全面、统一的框架用于管理各种有着不同性质（文本数据、图表数据等）的数据集和数据源（批量数据或实时的流数据）的大数据处理的需求。将Hadoop集群的中的应用在内出中运行速度提升100倍，甚至

09

干货 | 携程数据血缘构建及应用

cxzl25，携程软件技术专家，关注大数据领域生态建设，对分布式计算和存储、调度等方面有浓厚兴趣。

02

后Hadoop时代的大数据架构

提到大数据分析平台，不得不说Hadoop系统，Hadoop到现在也超过10年的历史了，很多东西发生了变化，版本也从0.x进化到目前的2.6版本。我把2012年后定义成后Hadoop平台时代，这不是说不用Hadoop，而是像NoSQL （Not Only SQL）那样，有其他的选型补充。背景篇 Hadoop: 开源的数据分析平台，解决了大数据（大到一台计算机无法进行存储，一台计算机无法在要求的时间内进行处理）的可靠存储和处理。适合处理非结构化数据，包括HDFS，MapReduce基本组件。 HDFS：提供

08

轻松驾驭Hive数仓，数据分析从未如此简单！

直接与文件系统交互，仅是Spark SQL数据应用常见case之一。Spark SQL另一典型场景是与Hive集成、构建分布式数仓。

03

我们的技术选型

本文是我在中生代技术群分享的话题《创业一年经历的技术风雨》中的第一部分《产品架构与技术选型》的第二部分。我要谈的是我们产品研发过程中的技术选型。开发语言的选型我们选择的语言是Scala。选择它的一个主因是因为Spark；另一个原因呢？或许是因为我确实不想再写Java代码了。其实有时候我觉得语言的选型是没有什么道理的。除了特殊的应用场景，几乎所有的程序设计语言都能满足如今的软件开发需求。所以我悲哀地看到，语言的纷争成了宗教的纷争。在我们团队，有熟悉Java的、有熟悉JavaScript包括NodeJ

04

后Hadoop时代的大数据架构

感谢董飞先生投稿，推荐关注其知乎专栏【董老师在硅谷 http://zhuanlan.zhihu.com/#/donglaoshi】提到大数据分析平台，不得不说Hadoop系统，Hadoop到现在也超过10年的历史了，很多东西发生了变化，版本也从0.x进化到目前的2.6版本。我把2012年后定义成后Hadoop平台时代，这不是说不用Hadoop，而是像NoSQL （Not Only SQL）那样，有其他的选型补充。我在知乎上也写过Hadoop的一些入门文章如何学习Hadoop - 董飞的回答，为了给大家

05

【聚焦】后Hadoop时代的大数据架构

提到大数据分析平台，不得不说Hadoop系统，Hadoop到现在也超过10年的历史了，很多东西发生了变化，版本也从0.x进化到目前的2.6版本。我把2012年后定义成后Hadoop平台时代，这不是说不用Hadoop，而是像NoSQL （Not Only SQL）那样，有其他的选型补充。我在知乎上也写过Hadoop的一些入门文章如何学习Hadoop - 董飞的回答，为了给大家有个铺垫，简单讲一些相关开源组件。背景篇 Hadoop: 开源的数据分析平台，解决了大数据（大到一台计算机无法进行存储，一台计算机无

04

数据源管理 | 分布式NoSQL系统，Cassandra集群管理

Cassandra是一套开源分布式NoSQL数据库系统。它最初由Facebook开发，用于储存收件箱等简单格式数据，此后，由于Cassandra良好的可扩展性，逐渐发展成为了一种流行的分布式结构化数据存储方案。

02

浅析Lambda架构

Lambda架构（Lambda Architecture）是由Twitter工程师南森·马茨（Nathan Marz）提出的大数据处理架构。这一架构的提出基于马茨在BackType和Twitter上的分布式数据处理系统的经验。

02

百亿级图数据JanusGraph迁移之旅

目前我们的图数据库数据量为顶点 20 亿，边 200 亿的规模。在迁移之前我们使用的 AgensGraph 数据库一个主库四个备库，机器的配置都比较高，256G 内存 SSD 的磁盘，单机数据量为 3T左右。在数据量比较小的情况下 AgensGraph 表现非常稳定优异，我们之前一主一备的情况下支撑了很长一段时间。但随着公司业务的急速发展，图越来越大，占用的磁盘越来越多，对应的查询量也越来越大，随之这种方案的问题就暴露出来了

05

腾讯开源全栈机器学习平台 Angel 3.0，支持三大类型图计算算法

10 月 18 日，2019 中关村论坛平行论坛 ——AI WORLD 2019 世界人工智能峰会在北京启幕。新智元杨静、科大讯飞胡郁、微软王永东、华为王成录、英特尔宋继强、旷视及智源学者孙剑、滴滴叶杰平、AWS 张峥、依图颜水成、地平线黄畅、autowise.ai 黄超等重磅嘉宾中关村论剑，重启充满创新活力的 AI 未来。峰会现场，新智元揭晓 AI Era 创新大奖，并重磅发布 AI 开放创新平台和献礼新书《智周万物：人工智能改变中国》。回放链接：

03

什么是 Apache Spark？大数据分析平台详解

自从 Apache Spark 2009 年在 U.C. Berkeley 的 AMPLab 默默诞生以来，它已经成为这个世界上最重要的分布式大数据框架之一。Spark 可以用多种方式部署，它为 Java、Scala、Python，和 R 编程语言提供了本地绑定，并且支持 SQL、流数据、机器学习，和图处理。你将会发现它被银行、电信公司、游戏公司、政府，和所有如 Apple、Facebook、IBM，和 Microsoft 等主要的科技巨头公司使用。

03

大数据分析平台 Apache Spark详解

本文介绍了Apache Spark的四个主要应用场景，包括大数据处理、机器学习、图计算和流处理。Spark可以处理批量数据和流数据，并且提供了简单易用的API。同时，Spark还支持多种编程语言，包括Python、Java和Scala等，使得开发人员可以更加便捷地开发复杂的数据处理应用。

00

什么是 Apache Spark？大数据分析平台如是说

自从 Apache Spark 2009 年在 U.C. Berkeley 的 AMPLab 默默诞生以来，它已经成为这个世界上最重要的分布式大数据框架之一。Spark 可以用多种方式部署，它为 Java、Scala、Python，和 R 编程语言提供了本地绑定，并且支持 SQL、流数据、机器学习，和图处理。你将会发现它被银行、电信公司、游戏公司、政府，和所有如 Apple、Facebook、IBM，和 Microsoft 等主要的科技巨头公司使用。非常好，Spark 可以运行在一个只需要在你集群中的

06

Java开发人员必备工具之 10 个大数据工具和框架

先来看看大数据的概念。根据维基百科，大数据是庞大或复杂的数据集的广义术语，因此传统的数据处理程序不足以支持如此庞大的体量。

03

什么是 Apache Spark？大数据分析平台详解

自从 Apache Spark 2009 年在 U.C. Berkeley 的 AMPLab 默默诞生以来，它已经成为这个世界上最重要的分布式大数据框架之一。Spark 可以用多种方式部署，它为 Java、Scala、Python，和 R 编程语言提供了本地绑定，并且支持 SQL、流数据、机器学习，和图处理。你将会发现它被银行、电信公司、游戏公司、政府，和所有如 Apple、Facebook、IBM，和 Microsoft 等主要的科技巨头公司使用。 📷 非常好，Spark 可以运行在一个只需要在你集群中的

06

ModelarDB：Modular + Model

长文预警，今天介绍一个时间序列管理系统的论文：《ModelarDB: Modular Model-Based Time Series Management with Spark and Cassandra》，三个作者都来自丹麦奥尔堡大学，这三个人在 2017 年 TKDE 有一篇很全面的时序数据库 Survey《Time Series Management Systems: A Survey》。

02

给 Java开发者的10个大数据工具和框架

作者：java妞妞来源：http://blog.csdn.net/javaniuniu/article/details/71250316 当今IT开发人员面对的最大挑战就是复杂性，硬件越来越复杂，O

给 Java 开发者的 10 个大数据工具和框架

当今IT开发人员面对的最大挑战就是复杂性，硬件越来越复杂，OS越来越复杂，编程语言和API越来越复杂，我们构建的应用也越来越复杂。根据外媒的一项调查报告，中软卓越专家列出了Java程序员在过去12个月内一直使用的一些工具或框架，或许会对你有意义。

04

Spark+ignite实现海量数据低成本高性能OLAP

Apache Spark 、 Apache Ignite 两个都是顶级开源软件，同属于内存计算框架与平台。在功能上有交集也有侧重点，一山不容二虎，但是在IgniteRDD的作用下，将两个内存计算平台无缝的连接了起来变成了一个新的完美的内存计算框架。

01

大数据架构师基础：hadoop家族，Cloudera系列产品介绍

大数据我们都知道hadoop，可是还会各种各样的技术进入我们的视野：Spark，Storm，impala，让我们都反映不过来。为了能够更好的架构大数据项目，这里整理一下，供技术人员，项目经理，架构师选

05

2018-11-23 graph图数据库概览,经过一个星期的Demo终于看懂了这篇文章20180818图数据库概览

Knowledge Base of Relational and NoSQL Database Management Systemsdb-engines.com

03

嵌入式 Tomcat AJP 协议对 SpringBoot 应用的影响

2020 年 1 月 6 日，国家信息安全漏洞共享平台（CNVD）收录了由北京长亭科技有限公司发现并报送的 Apache Tomcat 文件包含漏洞。Tomcat AJP 协议由于存在实现缺陷导致相关参数可控，攻击者利用该漏洞可通过构造特定参数，读取服务器 webapp 下的任意文件。若服务器端同时存在文件上传功能，攻击者可进一步实现远程代码的执行。

04

Hadoop生态圈一览

根据Hadoop官网的相关介绍和实际使用中的软件集，将Hadoop生态圈的主要软件工具简单介绍下，拓展对整个Hadoop生态圈的了解。

02

十面阿里，屌丝逆袭阿里之路

虽然天猫，蚂蚁金，菜鸟都归属阿里旗下，但每个面试官问的问题都不一样，相同点主要在流程方面。面试开始会让自我介绍，主要业务架构和技术架构两部分。业务架构一般不会深究，但要面试官听明白，并且一般面试官会顺着问是如何根据这些业务去设计技术架构的。面试试题其他什么是幂等？什么情况下需要考虑幂等？你怎么解决幂等的问题？ Java 多个线程同时读写，读线程的数量远远大于写线程，你认为应该如何解决并发的问题？你会选择加什么样的锁？ JAVA的AQS是否了了解，它是干嘛的？除了synchronized关键字之外

03

十面阿里，菜鸟，天猫，蚂蚁金服题目总汇

虽然天猫，蚂蚁金，菜鸟都归属阿里旗下，但每个面试官问的问题都不一样，相同点主要在流程方面。

02

Calcite技术研究

Apache Calcite是一个基础的软件框架，它提供了查询处理、查询优化以及查询语言支持的能力。很多流行的开源数据处理系统例如Apache Hive,Apache Storm,ApacheFlink,Druid等都采用了它。

04

SpringCloud中多个子模块如何集成Swagger文档

不知道大家工作中有没有使用Swagger，可能没有用过，但是肯定或多或少的接触过、听说过，它是一款基于Restfull接口的文档在线生成 + 功能测试的工具。

02

使用Kafka+Spark+Cassandra构建实时处理引擎

Apache Kafka 是一个可扩展，高性能，低延迟的平台，允许我们像消息系统一样读取和写入数据。我们可以很容易地在 Java 中使用 Kafka。

06

一文读懂Apache Spark

本文介绍了Apache Spark的四个主要版本，包括Spark 1.x、Spark 2.x、Spark 3.x和Spark 4.x，以及每个版本所包含的特性和改进。同时，文章还介绍了Spark在大数据处理、机器学习、图计算和流处理等领域的应用情况。最后，文章展望了Spark未来的发展方向，包括结构化流处理和深度学习的支持等。

00

大数据实用组件Hudi--实现管理大型分析数据集在HDFS上的存储

问题导读 1.什么是Hudi？ 2.Hudi对HDFS可以实现哪些操作？ 3.Hudi与其它组件对比有哪些特点？前两天我们About云群大佬公司想了解Hudi ，并上线使用。Hudi 或许大家了解的比较少，这里给大家介绍下Hudi这个非常实用和有潜力的组件。 Hudi是在HDFS的基础上，对HDFS的管理和操作。支持在Hadoop上执行upserts/insert/delete操作。这里大家可能觉得比较抽象，那么它到底解决了哪些问题？ Hudi解决了我们那些痛点 1.实时获取新增数据你是否遇到过这样的问题，使用Sqoop获取Mysql日志或则数据，然后将新增数据迁移到Hive或则HDFS。对于新增的数据，有不少公司确实是这么做的，比较高级点的，通过Shell调用Sqoop迁移数据实现自动化，但是这里面有很多的坑和难点，相对来说工作量也不少，那么有没有更好的解决办法那？---Hudi可以解决。Hudi可以实时获取新数据。 2.实时查询、分析对于HDFS数据，我们要查询数据，是需要使用MapReduce的，我们使用MapReduce查询，这几乎是让我们难以接受的，有没有近实时的方案，有没有更好的解决方案--Hudi。什么是Hudi Apache Hudi代表Hadoop Upserts anD Incrementals，管理大型分析数据集在HDFS上的存储。Hudi的主要目的是高效减少摄取过程中的数据延迟。由Uber开发并开源，HDFS上的分析数据集通过两种类型的表提供服务：读优化表（Read Optimized Table）和近实时表（Near-Real-Time Table）。读优化表的主要目的是通过列式存储提供查询性能，而近实时表则提供实时（基于行的存储和列式存储的组合）查询。 Hudi是一个开源Spark库（基于Spark2.x），用于在Hadoop上执行诸如更新，插入和删除之类的操作。它还允许用户仅摄取更改的数据，从而提高查询效率。它可以像任何作业一样进一步水平扩展，并将数据集直接存储在HDFS上。 Hudi的作用上面还是比较抽象的话，接着我们来看下图，更形象的来了解Hudi

03

25个你必须知道的大数据术语

原作者 Ramesh Dontha 编译 CDA 编译团队本文为 CDA 数据分析师原创作品，转载需授权提到大数据可能有些令人生畏。在了解一定基本概念的基础上，掌握其中一些关键术语也是至关重要的。在本文中，我列出了 25 个必须掌握的大数据术语。算法（Algorithm）指用于执行数据分析的数学公式或统计过程。那么算法与大数据有什么关系呢？虽然算法是一个通用术语，但大数据分析使得这个词变得更具时代性，更受欢迎。分析（Analytics）你的信用卡公司会将附有你全年交易情况的年终报表寄给你。如

05

hadoop生态圈各个组件简介

Hadoop 是一个能够对大量数据进行分布式处理的软件框架。具有可靠、高效、可伸缩的特点。

01

Spark生态顶级项目汇总

现在 Apache Spark 已形成一个丰富的生态系统，包括官方的和第三方开发的组件或工具。后面主要给出 5 个使用广泛的第三方项目。　　Spark 官方构建了一个非常紧凑的生态系统组件，提供各种处理能力。下面是 Spark 官方给出的生态系统组件（引自 Spark 官方文档）。 Spark DataFrames：列式存储的分布式数据组织，类似于关系型数据表。 Spark SQL：可以执行 SQL 查询，包括基本的 SQL 语法和 HiveQL 语法。读取的数据源包括 Hive 表、Parquent

08

2015.5 技术雷达 | 平台篇

(点击图片可查看大图） Apache Spark（spark.apache.org）作为一种快速和通用的大规模数据处理引擎已取得稳步进展。该引擎基于Scala实现，非常适合于那些在多并行操作之间重用数据工作集的应用程序。它即可以作为一个独立集群，也可以作为Hadoop的YARN集群的一部分来工作。它可以从不同的源来访问数据，比如 HDFS，Cassandra，S3 等。不仅如此，Spark还提供了许多更高级的操作符，以便简化数据并行应用程序的开发。作为一种通用的数据处理平台，它使许多更高级别的工具的开发

05

取代而非补充，Spark Summit 2014精彩回顾

Apache Spark开源生态系统在2014上半年大幅增长，已迅速成为大数据领域中最活跃的开源项目，HDFS位列第二，其代码变动次数（commits）和行数仅仅有Spark的一半：有超过50个机构250个工程师贡献过代码和去年六月相比，代码行数几乎扩大三倍。随着1.0版本于5月30日推出，Spark提供了一个稳定的API，开发人员可以依靠它来保证代码的兼容性。所有主流的Hadoop发行商，包括Hortonworks、IBM、Cloudera、MapR和Pivotal都提供了Spark的包装和技术支持

07

Spark专题系列（一）：Spark 概述

Spark适用于各种各样原本需要多种不同的分布式平台的场景，包括批处理,迭代计算,交互式查询，流处理，通过在一个统一的框架下支持这些不同的计算，Spark使我们可以简单而低耗地把各种处理流程整合在一起。

03

大数据 | Spark的现状与未来发展

Spark的发展对于一个具有相当技术门槛与复杂度的平台，Spark从诞生到正式版本的成熟，经历的时间如此之短，让人感到惊诧。2009年，Spark诞生于伯克利大学AMPLab，最开初属于伯克利大学的研究性项目。它于2010年正式开源，并于2013年成为了Aparch基金项目，并于2014年成为Aparch基金的顶级项目，整个过程不到五年时间。由于Spark出自伯克利大学，使其在整个发展过程中都烙上了学术研究的标记，对于一个在数据科学领域的平台而言，这也是题中应有之义，它甚至决定了Spark的发展动力。S

04

Lamda架构研究「建议收藏」

Lambda架构整合离线计算和实时计算，融合不可变性（Immutability），读写分离和复杂性隔离等一系列架构原则，可集成Hadoop，Kafka，Storm，Spark，HBase等各类大数据组件。

03

SpringBoot+Mysql 无法保存emoj表情？

尤记得很久以前，想存 emoj 表情到 mysql 中，需要额外的将 emoj 表情转码之后保存，每次读取时，再解码还原成一下；每次这种 sb 的操作，真心感觉心塞，那么有没有办法直接存呢？

02

Java框架介绍

MongoDB是个基于分布式文件存储的数据库，使用C++语言编写。旨在为Web应用提供可扩展的高性能数据存储解决方案。应用性能高低依赖于数据库性能，MongoDB则是非关系数据库中功能较丰富，较像关系数据库的，随着MongDB 3.4版本发布，其应用场景适用能力得到了进步拓展。　　MongoDB的核心优势就是灵活的文档模型、高可用复制集、可扩展分片集群。

01

大数据是什么？

大数据是指海量数据或巨量数据，其规模巨大到无法通过目前主流的计算机系统在合理时间内获取、存储、管理、处理并提炼以帮助使用者决策。

03

干货丨23个适合Java开发者的大数据工具和框架

目前，编程人员面对的最大挑战就是复杂性，硬件越来越复杂，OS越来越复杂，编程语言和API越来越复杂，我们构建的应用也越来越复杂。根据外媒的一项调查报告，以下列出了Java程序员在过去12个月内一直使用

08

新数仓系列：开源组件运营（3）

大数据前几年各种概念争论很多，NoSQL/NewSQL，CAP/BASE概念一堆堆的，现在这股热潮被AI接过去了。大数据真正落地到车联网，分控，各种数据分析等等具体场景。概念很高大上，搞得久了就会发现，大部分都还是数据仓库的衍伸，所以我们称呼这个为“新数仓”，我准备写一系列相关的文章，有没有同学愿意一起来的？请联系我。前面有一些相关文章，大家可以看看：新数仓系列：Hbase国内开发者生存现状（2）新数仓系列：Hbase周边生态梳理（1）产品决定的是长期竞争力，运营决定的是短期用户体验。本文简单梳理下

04

ansible快速部署cassandra3集群

上述操作要在每台机器执行，手动操作较为费时，因此用ansible来完成上述所有步骤，除了省事儿，还减少了操作失误的概览；

02

大数据必知必会系列——面试官问能不能手写一个spark程序？[新星计划]

学习大数据差不多一年了，笔者最近在整理大数据学习的笔记资料，这个系列是整理的一些大数据必知必会的知识。

01

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭