在scala 2.11+中，如何准确地使用单例类型作为类型证据？ - 腾讯云开发者社区

您找到你想要的搜索结果了吗？

是的

没有找到

scala-sparkML学习笔记：Execption in thread "main" java.lang.

Spark2.x新特性的介绍

dataframe与dataset统一，dataframe只是dataset[Row]的类型别名

Spark集群 + Akka + Kafka + Scala 开发(4) : 开发一个Kafka + Spark的应用

前言在Spark集群 + Akka + Kafka + Scala 开发(1) : 配置开发环境中，我们已经部署好了一个Spark的开发环境。在Spark集群 + Akka + Kafka + Scala 开发(2) : 开发一个Spark应用中，我们已经写好了一个Spark的应用。本文的目标是写一个基于kafka的scala工程，在一个spark standalone的集群环境中运行。项目结构和文件说明说明这个工程包含了两个应用。一个Consumer应用：CusomerApp - 实现

Spark Streaming 与 Kafka0.8 整合

在这里我们解释如何配置 Spark Streaming 以接收来自 Kafka 的数据。有两种方法，一种为使用 Receivers 和 Kafka 高级API的旧方法，以及不使用 Receivers 的新方法（在 Spark 1.3 中引入）。它们具有不同的编程模型，性能特征和语义保证。就目前的 Spark 版本而言，这两种方法都被为稳定的API。

scala-sparkML学习笔记：xgboost进行分布式训练

大数据消息处理中间件之kafka win10快速部署

kafka官网：http://kafka.apache.org/documentation/

Apache Flink 1.12.2集成Hudi 0.9.0运行指南

•下载Flink 1.12.2包：https://mirrors.tuna.tsinghua.edu.cn/apache/flink/flink-1.12.2/flink-1.12.2-bin-scala_2.11.tgz•Hudi编译：https://github.com/apache/hudi•git clone https://github.com/apache/hudi.git && cd hudi•mvn clean package -DskipTests注意：默认是用scala-2.11编译的如果我们用的是flink1.12.2-2.12版本，可以自己编译成scala-2.12版本的 mvn clean package -DskipTests -Dscala-2.12 包的路径在packaging/hudi-spark-bundle/target/hudi-spark-bundle_2.12-..*-SNAPSHOT.jar•上述包打好后其他步骤可参考官网步骤：https://hudi.apache.org/docs/flink-quick-start-guide.html（注意：官网使用的是Flink 1.11.x版本，测试时报如下错误

聊聊flink Table的OrderBy及Limit

flink-table_2.11-1.7.0-sources.jar!/org/apache/flink/table/api/table.scala

聊聊flink Table的OrderBy及Limit

flink-table_2.11-1.7.0-sources.jar!/org/apache/flink/table/api/table.scala

手把手教你大数据离线综合实战 ETL+Hive+Mysql+Spark

两个主要方面的业务： ⚫ 第一个、数据【ETL 处理】 ◼依据IP地址，调用第三方库解析为省份province和城市city； ◼将ETL后数据保存至PARQUET文件（分区）或Hive 分区表中； ⚫ 第二个、数据【业务报表】 ◼读取Hive Table中广告数据，按照业务报表需求统计分析，使用DSL编程或SQL编程； ◼将业务报表数据最终存储MySQL Table表中，便于前端展示；上述两个业务功能的实现，使用SparkSQL进行完成，最终使用Oozie和Hue进行可视化操作调用程序ETL和Report自动执行。

数据湖（六）：Hudi与Flink整合

Hudi0.8.0版本与Flink1.12.x之上版本兼容，目前经过测试，Hudi0.8.0版本开始支持Flink，通过Flink写数据到Hudi时，必须开启checkpoint，至少有5次checkpoint后才能看到对应hudi中的数据。

如何在IDEA上编写Spark程序?(本地+集群+java三种模式书写代码)

本篇博客，Alice为大家带来关于如何在IDEA上编写Spark程序的教程。

你真的懂数据分析吗？一文读懂数据分析的流程、基本方法和实践

导读：无论你的工作内容是什么，掌握一定的数据分析能力，都可以帮你更好的认识世界，更好的提升工作效率。数据分析除了包含传统意义上的统计分析之外，也包含寻找有效特征、进行机器学习建模的过程，以及探索数据价值、找寻数据本根的过程。

IntelliJ IDEA配置Spark使用

第二步下载插件首先启动intelliJ IDEA:在命令行终端中，进入$IDEA_HOME/bin目录，输入./idea.sh进行启动,进入如下界面，然后选择右下角“plugins”

适合小白入门的IDEA开发SparkSQL详细教程

之前博主利用业余时间，梳理了一份《SparkSQL编程系列》，奈何当时考虑不周，写的不是很详细。于是在正式开始学习了之后，决定整理一篇适合像我一样的小白级别都能看得懂的IDEA操作SparkSQL教程，于是就有了下文…

Spark2.x学习笔记：6、在Windows平台下搭建Spark开发环境（Intellij IDEA）

本文介绍了如何使用IntelliJ IDEA和Scala进行Spark编程，包括创建Scala和Spark项目、安装和配置Scala和Spark、编写Spark程序等步骤。

ERROR Fatal error during KafkaServer startup. Prepare to shutdown

1、之前搭建的kafka，过了好久，去启动kafka，发现报如下下面的错误，有错误就要解决了。

Scala基础入门（三）使用Scala IDE编写第一个Scala程序

添加插件url： http://download.scala-ide.org/sdk/lithium/e44/scala211/stable/site

客快物流大数据项目(五十)：项目框架初始化

1：拷贝”\资料\oracle连接驱动ojdbc8-12.2.0.1.jar”文件到本地磁盘任意目录

kafka系列之彻底弄清楚各版本差异

我自己用了 kafka 也挺久的了，关于kafka的版本规则，各个大版本的升级究竟做了哪些优化等，并没有特别的关注。

使用IDEA编写Spark程序（4）

●maven-assembly-plugin和maven-shade-plugin的区别

Spark集群 + Akka + Kafka + Scala 开发(3) : 开发一个Akka + Spark的应用

前言在Spark集群 + Akka + Kafka + Scala 开发(1) : 配置开发环境中，我们已经部署好了一个Spark的开发环境。在Spark集群 + Akka + Kafka + Scala 开发(2) : 开发一个Spark应用中，我们已经写好了一个Spark的应用。本文的目标是写一个基于akka的scala工程，在一个spark standalone的集群环境中运行。 akka是什么？ akka的作用 akka的名字是action kernel的回文。根据官方定义：akka用于r

012

spark2.4.0 scala2.11.12 Maven构建 pom.xml

reference case：https://blog.csdn.net/qq262593421/article/details/105768404

Sprak学习--Maven实现之pom.xml配置

<?xml version="1.0" encoding="UTF-8"?> <project xmlns="http://maven.apache.org/POM/4.0.0" x

Spark_Day01：Spark 框架概述和Spark 快速入门

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-4yHXs6Sp-1627098349792)(/img/image-20210419160056620.png)]

在Ubuntu下搭建Spark群集

在前一篇文章中，我们已经搭建好了Hadoop的群集，接下来，我们就是需要基于这个Hadoop群集，搭建Spark的群集。由于前面已经做了大量的工作，所以接下来搭建Spark会简单很多。

《类型编程晋级——shapeless类库使用指南》前言及第一章翻译

从年初开始进行此项工作，我和合作伙伴包亮付出了大量而艰辛的劳动。翻译中我们本着能够让所有人看明白、看懂的目的，反复修改高达五次。现基本翻译完毕，有出版意向，如果有意向欢迎联系，不甚感激！现在此文中展示其中的前言和第一章，欢迎各位博友对此翻译提出意见建议以及指导如何出版，在此谢过！原名：The Type Astronaut's Guide to Shapeless 中文：类型编程晋级——shapeless类库使用指南作者：Dave Gurnell（戴夫·格内尔）翻译：魏守峰、包亮前言时间回到2011

[大数据之Spark]——快速入门

本篇文档是介绍如何快速使用spark，首先将会介绍下spark在shell中的交互api，然后展示下如何使用java,scala,python等语言编写应用。可以查看编程指南了解更多的内容。为了良好的阅读下面的文档，最好是结合实际的练习。首先需要下载spark,然后安装hdfs，可以下载任意版本的hdfs。 Spark Shell 交互基本操作 Spark Shell提供给用户一个简单的学习API的方式以及快速分析数据的工具。在shell中，既可以使用scala（运行在java虚拟机，因此可以

大数据技术之_24_电影推荐系统项目_06_项目体系架构设计 + 工具环境搭建 + 创建项目并初始化业务数据 + 离线推荐服务建设 + 实时推荐服务建设 + 基于内容的推荐服务建设

用户可视化：主要负责实现和用户的交互以及业务数据的展示，主体采用 AngularJS2 进行实现，部署在 Apache 服务上。（或者可以部署在 Nginx 上）综合业务服务：主要实现 JavaEE 层面整体的业务逻辑，通过 Spring 进行构建，对接业务需求。部署在 Tomcat 上。【数据存储部分】业务数据库：项目采用广泛应用的文档数据库 MongDB 作为主数据库，主要负责平台业务逻辑数据的存储。搜索服务器：项目采用 ElasticSearch 作为模糊检索服务器，通过利用 ES 强大的匹配查询能力实现基于内容的推荐服务。缓存数据库：项目采用 Redis 作为缓存数据库，主要用来支撑实时推荐系统部分对于数据的高速获取需求。【离线推荐部分】离线统计服务：批处理统计性业务采用 Spark Core + Spark SQL 进行实现，实现对指标类数据的统计任务。离线推荐服务：离线推荐业务采用 Spark Core + Spark MLlib 进行实现，采用 ALS 算法进行实现。工作调度服务：对于离线推荐部分需要以一定的时间频率对算法进行调度，采用 Azkaban 进行任务的调度。【实时推荐部分】日志采集服务：通过利用 Flume-ng 对业务平台中用户对于电影的一次评分行为进行采集，实时发送到 Kafka 集群。消息缓冲服务：项目采用 Kafka 作为流式数据的缓存组件，接受来自 Flume 的数据采集请求。并将数据推送到项目的实时推荐系统部分。实时推荐服务：项目采用 Spark Streaming 作为实时推荐系统，通过接收 Kafka 中缓存的数据，通过设计的推荐算法实现对实时推荐的数据处理，并将结果合并更新到 MongoDB 数据库。

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐