sbt scala linux_scala sbt Linux_Maven还是SBT with Scala？ - 腾讯云开发者社区 - 腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

Ubuntu 16.04 Spark单机环境搭建

00

SBT无痛入门指南顶

SBT 是 Scala 的构建工具，全称是 Simple Build Tool，类似 Maven 或 Gradle。 SBT 的野心很大，采用Scala编程语言本身编写配置文件，这使得它稍显另类，虽然增强了灵活性，但是对于初学者来说同时也增加了上手难度。另外由于SBT默认从国外下载依赖，导致第一次构建非常缓慢，使用体验非常糟糕！如果你是一名Scala初学者，本文希望帮你减轻一些第一次使用的痛苦。

04

您找到你想要的搜索结果了吗？

是的

没有找到

【腾讯云的1001种玩法】Ubuntu 14.04 Spark单机环境搭建与初步学习

本文介绍了如何利用 Spark 进行大数据分析，包括数据处理、数据挖掘、机器学习等方面的应用。通过介绍 Spark 的架构、数据处理流程、编程模型、性能优化等方面的内容，让读者对 Spark 有更深入的了解。同时，本文还提供了实践案例，让读者更好地理解 Spark 在实际项目中的应用。

01

Scala学习系列（二）——环境安装配置

Scala下载地址：https://www.scala-lang.org/download/

02

SBT入门

我们用IDEA创建Spark项目的时候，默认都是使用SBT作为构建工具的，那么SBT是个啥？

05

SBT 常用开发技巧

SBT 一直以来都是 Scala 开发者不可言说的痛，最主要的原因就是官方文档维护质量较差，没有经过系统的、循序渐进式的整理，导致初学者入门门槛较高。虽然也有其它构建工具可以选择(例如 Mill)，但是在短时间内基本上不可能撼动 SBT 的地位，毕竟它是 Scala 名正言顺的亲儿子。当然还有另外一个原因可能导致其它构建工具永远没有机会，Scala 语言以其卓越的编译器著称，编译器支持的丰富特性需要和构建工具进行无缝对接，例如 Scala 的 Macro 需要和构建工具的增量编译密切配合，在和编译器对接方面，SBT 具有先天优势。既然别无选择，只能选择默默忍受。下面分享在SBT使用过程中的一些常用技巧。

02

spark开发环境详细教程1：IntelliJ IDEA使用详细说明

问题导读 1.IntelliJ IDEA是否可以直接创建Scala工程？ 2.IntelliJ IDEA安装，需要安装哪些软件？ 3.IntelliJ IDEA如何安装插件？各种开发环境的搭建，其实都是听简单。甚至我们可以通过命令行来开发。而且最原始的编程，其实可以通过文本或则cmd即可。还有maven，sbt等。后来的发展过程中，为了更加方便我们编程，于是发展出来了，更高级的编程工具，Java有eclipse等工具，而Scala有IntelliJ IDEA.当然eclipse也可以写Scala代

04

kafka web console安装「建议收藏」

https://github.com/claudemamo/kafka-web-console

01

Spark历险记之编译和远程任务提交

Spark简介 Spark是加州大学伯克利分校AMP实验室（Algorithms, Machines, and People Lab）开发通用内存并行计算框架。Spark在2013年6月进入Apache成为孵化项目，8个月后成为Apache顶级项目，速度之快足见过人之处，Spark以其先进的设计理念，迅速成为社区的热门项目，围绕着Spark推出了Spark SQL、Spark Streaming、MLLib和GraphX等组件，也就是BDAS（伯克利数据分析栈），这些组件逐渐形成大数据处理一站式解决平台

09

详解如何使用Spark和Scala分析Apache访问日志

首先需要安装好Java和Scala，然后下载Spark安装，确保PATH 和JAVA_HOME 已经设置，然后需要使用Scala的SBT 构建Spark如下：

02

spark开发环境详细教程2：window下sbt库的设置

问题导读 1.sbt在IntelliJ IDEA里面比较慢，该如何解决？ 2.如何在window里面更改阿里源？ 3.如何在Linux里更改源？上一篇spark开发环境详细教程1：Intel

06

30分钟--Spark快速入门指南

Spark快速入门指南 – Spark安装与基础使用 2016-01-15 (updated: 2016-03-07) 6309 29 Apache Spark 是一个新兴的大数据处理通用引擎，提供了分布式的内存抽象。Spark 正如其名，最大的特点就是快（Lightning-fast），可比 Hadoop MapReduce 的处理速度快 100 倍。此外，Spark 提供了简单易用的 API，几行代码就能实现 WordCount。本教程主要参考官网快速入门教程，介绍了 Spark 的安装，Spar

09

Spark实战1：单节点本地模式搭建Spark运行环境

http://d3kbcqa49mib13.cloudfront.net/spark-1.1.0-bin-hadoop1.tgz

03

Spark R安装成功的步骤

网上有很多关于spark R的安装过程，但是按照那个过程总是出错。当然最常见的问题是：

01

手把手用 IntelliJ IDEA 和 SBT 创建 scala 项目

1. 安装 sbt 打开 terminal，检查 java 版本，安装 sbt： http://www.scala-sbt.org/release/docs/Installing-sbt-on-Mac.html $ java -version $ brew install sbt $ sbt about Getting org.scala-sbt sbt 0.13.16 ---- 2. 下载 jetbrains 的 community 版本, 安装 Scala plugin 打开 dmg 文件安装：

07

Mac 安装 ApacheFlink + Scala + SBT

flink: https://ci.apache.org/projects/flink/flink-docs-release-1.8/tutorials/local_setup.html

06

Spark集群 + Akka + Kafka + Scala 开发(1) : 配置开发环境

目标配置一个spark standalone集群 + akka + kafka + scala的开发环境。创建一个基于spark的scala工程，并在spark standalone的集群环境中运行。创建一个基于spark+akka的scala工程，并在spark standalone的集群环境中运行。创建一个基于spark+kafka的scala工程，并在spark standalone的集群环境中运行。集群框架图本图主要是说明各个组件可以发布到不同的逻辑机器上。 image.png 本

06

008.Kafka集群管理工具CMAK-3.0.0.5源码编译以及安装部署

cmak在github上有已经编译好的安装包，我在JDK1.8环境中无法运行，于是才有了上一步的源码编译，我想使用JDK1.8编译，使得安装包可以在JDK1.8环境中运行，结果使用JDK1.8编译都编译不过，于是，只好老老实实的使用JDK11来安装cmak了。

03

sbt快速入门

sbt类似与maven, gradle的项目管理工具，主要用在scala，也可以用在java项目，本文介绍一下常用的使用命令和语法安装 mac brew install sbt redhat¢os # remove old Bintray repo file sudo rm -f /etc/yum.repos.d/bintray-rpm.repo curl -L https://www.scala-sbt.org/sbt-rpm.repo > sbt-rpm.repo sudo mv sbt

02

Play For Scala 开发指南 - 第4章第一个Play项目

准备环境安装JDK8 单击这里下载并安装JDK8，安装完成后在命令行查看Java的版本号： C:\Users\Lenovo>java -version java version "1.8.0_111" Java(TM) SE Runtime Environment (build 1.8.0_111-b14) Java HotSpot(TM) 64-Bit Server VM (build 25.111-b14, mixed mode) 如果上面的命令执行报错，请手动将路径"Java安装目录/bin"

04

1 Spark机器学习 spark MLlib 入门

开始学习spark ml了，都知道spark是继hadoop后的大数据利器，很多人都在使用spark的分布式并行来处理大数据。spark中也提供了机器学习的包，就是MLlib。

02

如何在Ubuntu20上离线安装joern（包括sbt和scala）

在Ubuntu 20上离线安装Joern，由于Joern通常需要通过互联网从其官方源或GitHub等地方下载，但在离线环境中，我们需要通过一些额外的步骤来准备和安装。（本人水平有限，希望得到大家的指正）

01

sbt的依赖管理逻辑

在软件项目开发中，依赖项管理是至关重要的一环。sbt（Simple Build Tool）作为Scala领域最常用的构建工具之一，提供了便捷的依赖项管理机制，既支持托管依赖项，也支持非托管依赖项。sbt 使用 Apache Ivy 作为其依赖管理系统，支持 Maven 和 Ivy 依赖格式。本文将对sbt的依赖管理逻辑进行一些个人观点上概述，水平有限，还请见谅。

01

play framework 2.2.3 project 迁移到 2.3.0

这篇文章是关于怎样将play 2.2.3的工程迁移到play 2.3.0 1、安装sbt 0.13.5，去官网下载sbt 0.13.5: http://www.scala-sbt.org/download.html，安装完之后，修改工程下的project/build.properties文件。修改sbt版本： sbt.version=0.13.5 2、升级scala到2.11.1（可选），由于play 2.3 同时支持 scala 2.10 和 scala 2.11所以，可以不用升级到2.11，

02

geotrellis使用（六）Scala并发（并行）编程

本文主要讲解Scala的并发（并行）编程，那么为什么题目概称geotrellis使用（六）呢，主要因为本系列讲解如何使用Geotrellis，具体前几篇博文已经介绍过了。我觉得干任何一件事情基础很重要，就像当年参加高考或者各种考试一样，老师都会强调基础，这是很有道理的。使用Geotrellis框架的基础就是Scala和Spark，所以本篇文章先来介绍一下Scala编程语言，同样要想搞明白Scala并发（并行）编程，Scala基础也很重要，没有Scala语言基础就谈不上Scala并发编程也就更谈不

05

基于spark源码做单元测试

之前debug spark源码，是通过写application debug，这个不是基于spark源码本身的调试。

04

spark sql on hive笔记一

Spark sql on Hive非常方便，通过共享读取hive的元数据，我们可以直接使用spark sql访问hive的库和表，做更快的OLAP的分析。 spark 如果想直接能集成sql，最好自己编译下源码：切换scala的版本为新版本 dev/change-scala-version.sh 2.11编译支持hive mvn -Pyarn -Phive -Phive-thriftserver -Phadoop-2.7.3 -Dscala-2.11 -DskipTests clean pac

06

IDEA-2017.2-bug-SBT项目初始化的失败

这个错误出现过若干次了，每次出现都想记录一下可是都忘了，然后下一次再遇见就又要搞很久才能解决，其实这本身是IntelliJ IDEA 2017.2的一个bug，只要修改一处配置就好了。

03

Fedora 配置 Spark 实验环境（一）安装Hadoop、Spark

实验环境建议使用jdk11，如果 java version 显示的是之前安装的其它版本jdk，可以切换到新安装的jdk11:

05

一行Python，你可以做什么？

Python的列表推倒器是美好的语法糖。所以使用列表推倒器简化了for循环的嵌套，更简洁。许多黑魔法都是用这个方法。

04

傻白甜，约不约？

首先来介绍下，今天的主角“傻白甜”（SBT:Simple Build Tools），其功能与 Maven 和 Gradle 类似。其是由 Scala 编写，对于新手入门不是太友好，如果只是写纯 Java 的 Bug ，大可不必和自己过不去，但是如果你经常使用 Spark 等大数据工具，还是有点必要学学使用的。而且 Sbt 默认会从一些奇奇怪怪的地方下载依赖，相信大家的第一次，都不会很美好（ Sbt 的项目构建异常缓慢，而且还经常会失败），笔者也不例外，所以有了这篇文章，希望对你有些帮助。

03

编译工具sbt部署

项目构建工具是项目开发中非常重要的一个部分，充分利用好它能够极大的提高项目开发的效率。在学习SCALA的过程中，我遇到了SBT(Simple Build Tool)， SBT是SCALA 平台上标准的项目构建工具，当然你要用它来构建其他语言的项目也是可以的。

05

用spinal生成了一个计数器

class表示module，Bundle相当于interface。用Reg()定义一个寄存器。具体如下：

03

Spark 开发环境搭建

本文介绍了如何使用 Spark 进行大数据处理，包括概述、架构、运行、集群、资源调度、数据存储、编程模型、性能优化、高级特性、应用案例等方面的内容。

02

sbt 项目导入问题

有用过 sbt 开发项目的同学应该都有这样的体会，换个环境，sbt 经常会出现编译项目出错的情况，导入 IDEA 又各种报错，尤其是在 github 上找到一个 sbt 编译的项目，想 clone 下来导入 IDEA 中阅读源码，跑跑测试用例，debug 进去看看实现原理等等…

04

体验 Scala 语言的 Play Web 框架

在本文中将介绍 Scala 的 Play Web 开发框架。我们将会学习如何创建一个 Play 项目，使用开发工具生成我们的第一个项目以及实现自定义的功能，另外还将体验一下 Play 框架的测试能力。

05

如何使用IDEA加载已有Spark项目

背景是这样的：手上有一个学长之前实现的Spark项目，使用到了GraphX，并且用的Scala编写，现在需要再次运行这个项目，但如果直接在IDEA中打开项目，则由于各种错误会导致运行失败，这里就记录一下该如何使用IDEA来加载老旧的Spark项目。注意：默认你的机器已有Scala环境，项目使用IDEA打开，对Sbt不做要求，因为这里采用的是NoSbt方式添加依赖的。

02

[大数据之Spark]——快速入门

本篇文档是介绍如何快速使用spark，首先将会介绍下spark在shell中的交互api，然后展示下如何使用java,scala,python等语言编写应用。可以查看编程指南了解更多的内容。为了良好的阅读下面的文档，最好是结合实际的练习。首先需要下载spark,然后安装hdfs，可以下载任意版本的hdfs。 Spark Shell 交互基本操作 Spark Shell提供给用户一个简单的学习API的方式以及快速分析数据的工具。在shell中，既可以使用scala（运行在java虚拟机，因此可以

09

centos 安装sbt

1.yum install sbt 2.如果不行，则 curl https://bintray.com/sbt/rpm/rpm > bintray-sbt-rpm.repo sudo mv bintray-sbt-rpm.repo /etc/yum.repos.d/ sudo yum install sbt sbt 二进制文件发布到 Bintray，而Bintray 方便地提供了RPM资源库。你只需要将存储库添加到你的软件包管理器将检查的地方。 3.手动安装，目前官网提供的是可以直接运行的地址：http:/

08

geotrellis使用初探

最近，单位领导要求我研究一下geotrellis(GITHUB地址：https://github.com/geotrellis/geotrellis，官网http://geotrellis.io/)，于是我只能接受这个苦逼的任务。官网中写到：GeoTrellis is a geographic data processing engine for high performance applications.可以看出这个框架主要是用来进行地理信息数据的高性能快速处理，当然是个很有用的东西，但是怎么学习之，是

08

Apache Spark 2.2.0 中文文档 - 快速入门 | ApacheCN

本文介绍了如何使用 Spark 进行大数据处理，首先介绍了 Spark 的基本概念和架构，然后通过一个简单的例子展示了如何使用 Spark 进行数据处理。最后，本文还介绍了 Spark 的部署方式，包括本地部署和集群部署。

08

Delta Lake 学习笔记（一）

今天 Spark + AI Summit 2019 宣布开源了 Delta Lake 这个项目，关于这个项目的背景我就不赘述了，砖厂官网有很多介绍，包括项目的 Github 地址，大家可以上去看看，我也打算测一下，并且研究一下源代码，所以今天开始写一些探索这个项目的学习笔记。

03

idea中使用scala运行spark出现Exception in thread "main" java.lang.NoClassDefFoundError: scala/collection/Gen

idea中使用scala运行spark出现： Exception in thread "main" java.lang.NoClassDefFoundError: scala/collection/GenTraversableOnce$class 查看build.sbt: name := "ScalaSBT" version := "1.0" scalaVersion := "2.11.8" libraryDependencies += "org.apache.spark" % "spark-core

04

网页爬虫开发：使用Scala和PhantomJS访问知乎

随着大数据时代的到来，网页爬虫作为一种高效的数据收集工具，被广泛应用于互联网数据抓取和信息抽取。而知乎是一个知识分享平台，拥有大量的用户生成内容。通过爬虫获取知乎数据，企业和研究人员可以进行深入的数据分析和市场研究，了解用户的需求、兴趣和行为模式，从而为产品开发、市场定位和营销策略提供数据支持。本文将介绍如何使用Scala编程语言结合PhantomJS无头浏览器，开发一个简单的网页爬虫，以访问并抓取知乎网站上的数据。

01

sbt编译Spark App的依赖问题

Spark App（用Spark APIs编写的）需要submit到Spark Cluster运行，对于Scala编写的代码，提交之前要用sbt或者maven把以下内容：

01

jdk版本导致Intellij IDEA编译报错：org/jetbrains/jps/incremental/messages/BuildMessage$Kind

最经安装了Intellij IDEA后，导入之前开发的项目，运行买方法，一直都报同样的错误，还以为是idea的版本问题

01

网页爬虫开发：使用Scala和PhantomJS访问知乎

随着大数据时代的到来，网页爬虫作为一种高效的数据收集工具，被广泛应用于互联网数据抓取和信息抽取。而知乎是一个知识分享平台，拥有大量的用户生成内容。通过爬虫获取知乎数据，企业和研究人员可以进行深入的数据分析和市场研究，了解用户的需求、兴趣和行为模式，从而为产品开发、市场定位和营销策略提供数据支持。本文将介绍如何使用Scala编程语言结合PhantomJS无头浏览器，开发一个简单的网页爬虫，以访问并抓取知乎网站上的数据。

01

XGB-1：XGBoost安装及快速上手

XGBoost是“Extreme Gradient Boosting”的缩写，是一种高效的机器学习算法，用于分类、回归和排序问题。它由陈天奇（Tianqi Chen）在2014年首次提出，并迅速在数据科学竞赛和工业界获得广泛应用。XGBoost基于梯度提升框架，但通过引入一系列优化来提升性能和效率。

01

使用SBT正确构建IndexedRDD环境

IndexedRDD由AMPLab的Ankur Dave提出，它是Immutability和Fine-Grained updates的精妙结合。IndexedRDD是一个基于RDD的Key-Value Store，扩展自RDD[(K, V)]，可以在IndexRDD上进行高效的查找、更新以及删除。由于其并没有合并到 Spark 的主项目分支，所以在使用时需要引入特别的对其的支持。

03

数据科学、机器学习IDE概览

IDE 提供的丰富特性对软件开发极为有用，大大提高了程序员的生活质量。这一点同样适用于数据科学家。然而，因为数据科学家除了可以选择传统的 IDE，还可以选择 Jupyter notebook 这样在浏览器中运行的新工具。因此，数据科学家——特别是刚入门数据科学的新手——可能会困惑该使用哪个开发环境。

03

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭