开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

sbt包和程序集包含我不想要的jars

，这个问题涉及到构建工具和依赖管理的方面。

首先，sbt（Simple Build Tool）是一种基于Scala语言的构建工具，用于构建和管理Scala项目。它使用sbt构建定义文件（build.sbt）来管理项目的依赖关系和构建过程。

在sbt中，程序集（assembly）是指将项目的所有依赖项打包成一个可执行的JAR文件或者一个包含所有依赖项的目录。程序集的生成可以通过sbt的插件来实现，例如sbt-assembly插件。

如果程序集包含了不想要的JAR文件，可以通过以下几种方式解决：

排除依赖项：在build.sbt文件中，可以使用exclude或者excludeAll方法来排除特定的依赖项。例如，如果想要排除名为"unwanted-jar"的JAR文件，可以在build.sbt中添加如下配置：

libraryDependencies += "group" % "artifact" % "version" exclude("unwanted-group", "unwanted-jar")

这样就会排除掉该JAR文件。

调整依赖项版本：有时候不想要的JAR文件是由于与其他依赖项的版本冲突导致的。可以尝试调整依赖项的版本，以解决冲突问题。
清理无用依赖项：可以使用sbt的clean命令清理项目中的无用依赖项。运行以下命令：

sbt clean

这将删除项目中未使用的依赖项。

手动删除不需要的JAR文件：如果以上方法都无法解决问题，可以手动删除不需要的JAR文件。在程序集生成后，通过删除不需要的JAR文件来达到目的。

需要注意的是，以上方法都是基于sbt构建工具的解决方案。对于其他编程语言和构建工具，可能会有不同的解决方法。

对于腾讯云相关产品，推荐使用腾讯云的云原生应用平台TKE（Tencent Kubernetes Engine），它提供了强大的容器化和微服务支持，可以帮助开发者更好地管理和部署应用程序。TKE可以与sbt等构建工具结合使用，实现自动化构建和部署。更多关于TKE的信息可以参考腾讯云官方文档：Tencent Kubernetes Engine (TKE)

希望以上回答能够满足您的需求，如果还有其他问题，请随时提问。

相关搜索:*为什么*多进程序列化我的函数和闭包？sbt未在程序集后的清单中包含主类 Spack 2.4.5和Scala 2.11使用哪个版本的Sbt和Sbt程序集？Xamarin -无法安装软件包。包不包含任何与该框架兼容的程序集引用或内容文件。为什么我不能为silverlight和通常的.NET创建程序集？为什么我的CSS和PHP不包含在我的WebView中加载使用share 2.0.0包我想要共享我的应用程序的链接，但我还没有将我的应用程序发布到play商店在项目模板中包含对我自己的程序集的引用的最佳方法是什么？如何优化我的requirements.txt，使其只包含我的应用程序直接使用的包？如何使用ggplot和brewer包绘制包含计数的数据集？

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

Spark Submit的ClassPath问题

在我们的Scala项目中，可以直接将要依赖的jar包放在module的lib文件夹下，在使用sbt执行编译和打包任务时，会自动将lib下的jar包放入classpath中。...实际上，sbt assembly并不会将所有依赖的外部包都装配到最终的部署包中，只要在sbt的依赖中添加provided，就能保证第三方依赖包不被包含进部署包中。...这就是在本地设置classpath不生效的根本原因。...因此，我修改了启动程序的脚本，将其设置为： exec $SPARK_HOME/bin/spark-submit \ --class com.bigeyedata.mort.Main \ --driver-class-path...该文件仍然不能作为内嵌的资源文件打包到部署包中。因为这个文件的内容需要区分测试环境和生产环境。在部署到生产环境中时，需要替换为另一个key文件。

4.2K9 0

【问底】许鹏：使用Spark+Cassandra打造高性能数据分析平台（一）

程序的话，只需要在build.sbt中加入如下内容即可由sbt自动下载所需要的spark-cassandra-connector驱动 datastax.spark" %% "spark-cassandra-connector...我在实际的使用当中，遇到”no route to host”的错误信息，起初还是认为网络没有配置好，后来网络原因排查之后，忽然意识到有可能使用了不同的用户名和用户组，使用相同的用户名/用户组之后，问题消失...所依赖的包，多个包之间用冒号(:)分割 --jars driver和executor都需要的包，多个包之间用逗号(,)分割为了简单起见，就通过—jars来指定依赖，运行指令如下 $SPARK_HOME.../bin/spark-submit –class 应用程序的类名 \ --master spark://master:7077 \ --jars 依赖的库文件 \ spark应用程序的jar包 3.3.5...RDD函数使用的一些问题 collect 如果数据集特别大，不要贸然使用collect，因为collect会将计算结果统统的收集返回到driver节点，这样非常容易导致driver结点内存不足，程序退出

2.7K8 0

Spark的那些外部框架

小编说：Spark社区提供了大量的框架和库。其规模及数量都还在不断增加。本文我们将介绍不包含在Spark 核心源代码库的各种外部框架。...包添加到你指定的路径下。...如果要在你的项目中包含此插件，请务必在sbt项目的project/plugins.sbt文件中写入下面的代码： resolvers += "bintray-Spark-packages" at "https...% "0.2.3") 发布Spark包时必须提供如下信息，应该把它们写到build.sbt中： spName——package的名称。...选择package的名称上面的简短描述和主页最好与build.sbt中的描述和主页URL一致。一旦你提交了package，验证过程就开始了。这个过程通常需要几分钟。

1.3K1 0

Spark2.3.0 使用spark-submit部署应用程序

为此，需要创建一个包含代码及其依赖关系的 assembly jar（或 Uber jar）。sbt 和 Maven 都有 assembly 插件。...对于包含空格的 value（值）使用引号包 “key=value” 起来。 application-jar: 包含应用程序和所有依赖关系的 jar 路径。...（例如，独立EC2集群中的主节点）提交。...高级依赖管理使用 spark-submit 时，包含在 --jars 选项中的应用程序 jar 以及其他 jar 将自动分发到集群。在 --jars 之后提供的 URL 列表必须用逗号分隔。...该列表会包含在 driver 和 executor 的 classpath 中。--jars 不支持目录的形式。

2.9K4 0

傻白甜，约不约？

首先来介绍下，今天的主角“傻白甜”（SBT:Simple Build Tools），其功能与 Maven 和 Gradle 类似。...而且 Sbt 默认会从一些奇奇怪怪的地方下载依赖，相信大家的第一次，都不会很美好（ Sbt 的项目构建异常缓慢，而且还经常会失败），笔者也不例外，所以有了这篇文章，希望对你有些帮助。...sbt 项目依赖在使用 scala 的时候，大家一定要注意自己的sdk版本以及配置的依赖包的版本要一致，如果不符，就会出现各种奇怪的问题 libraryDependencies += "org.apache.spark...libraryDependencies += "com.typesafe.akka" %% "akka-stream" % "2.6.10" akka Akka是JAVA虚拟机平台上构建高并发、分布式和容错应用的工具包和运行时...Akka既可以在单机上构建高并发程序，也可以在网络中构建分布式程序，并提供位置透明的Actor定位服务。代码案例： package cn.datahub import akka.actor.

7963 0

Spark 开发环境搭建

HDFS 是 Hadoop 项目中的一个组件，本文中说明的部署方式仅为在单机上搭建完整开发环境（只包含一个 NameNode 和一个 DataNode，无 HA 支持），生产环境会复杂一些，请参阅 HDFS...---- | bin/ (工具程序目录) conf/ (配置文件目录) jars/ (scala Jar 包目录)...我这里选择 sbt，原因是这三者虽然功能上难分伯仲，但 sbt 与 scala 具备天然的亲和性，它自身是使用 scala 编写的，其工程定义文件实际也是一个 scala 程序，使用它构建 scala...java vm 参数 --- lib/ # 预装 jar 包 5.2 sbt 工程样例将上面在交互模式下运行的单词计数使用独立的 scala 程序实现。.../jars lib sbt 会首先从本地库中寻找寻找被引用组件包。

6.8K2 1

ScalaPB（4）：通用跨系统protobuf数据，sbt设置

这样把protobuf数据类型和相关的序列化/反序列化函数打成一个独立的包，由用户系统各自引用就是一种最佳解决方案了。下面示范产生一个独立的protobuf包。...在使用方sbt项目里可以用unmanagedBase指定.jar路径或者把包放到默认的lib/目录下： lazy val commonSettings = Seq( name := "using-common-protobuf-data...scalapb.compiler.Version.scalapbVersion % "protobuf" ), ) unmanagedBase := file("/users/tiger-macpro/jars...在上面的.sbt文件中有关路径的设置需要总结一下： 1、改变默认源代码路径: (src/main/scala， src/test/scala) scalaSource in Compile := baseDirectory.value...= baseDirectory.value / "test-resources" 3、改变默认附加库路径：(lib/) unmanagedBase := baseDirectory.value / "jars

1.1K4 0

大数据基础系列之提交spark应用及依赖管理

为了达到这个目的，需要创建一个assembly jar或者super jar，这个jar要同时包含你的代码和它的依赖。Sbt和maven都有assembly 插件。...一个通用的部署策略是在一个集群入口机器上提交你的程序到集群(比如，在EC2集群中的master节点)。在这种设置中，client模式是合适的。...五，高级依赖管理当使用spark-submit，用户的jar和--jars选项指定的jar会被自动传输到集群。...--jars参数指定URLs必须用逗号分隔，该列表包含在driver和Executor Classpath上。目录不适用于--jars。...注意，JARS和files会被拷贝到Executor的工作目录。这将会浪费很大的磁盘空间，使用完了需要进行clean up。

1.2K9 0

【R语言】额外的年终奖到手我却笑不起来，XML包和RCurl包的安装问题及解决过程

拿到电脑就迫不及待的参考果子老师前期的帖子将一系列生信所需的R包进行安装，然后在假期继续相关学习，然而安装过程中却遇到两个R包装不上的问题（原来没遇到过），困扰小编2天时间才解决，特此进行分享（大神略过...报错：安装失败，还有警告此外，小编在安装RCurl包的时候也是遇到相同的问题，因此暗下决心必须攻克~ 解决过程尝试一：使用多种安装方法，包括 BiocManager::install("XML...尝试二：咨询果子老师，回答是尝试不编译，当时不理解什么意思，查询度娘也没找到解决方案。...compilation一词在安装时出现过如图所示，在这一步一般都会选择‘是’，以前没注意看，现在仔细进行翻译，即‘您是否要从源安装需要编译的软件包？’...总结到此，XML包和RCurl包均已安装成功，这个问题原来在其他电脑上没遇到过，在新电脑上首次遇到，但是这两个包却很重要，绕不过去，他们是R语言爬虫相关的两大利器，也是许多包的依赖包，如RTCGA、TCGAbiolinks

5502 0

如何使用IDEA加载已有Spark项目

注意：默认你的机器已有Scala环境，项目使用IDEA打开，对Sbt不做要求，因为这里采用的是NoSbt方式添加依赖的。...//注意这是在No-sbt模式下必须的，这个包很大，大概170M，导入后不用再添加其他依赖即可对Spark程序进行本地(Local)运行，其已包括GraphX模块。...Java的版本这里由于要是用Scala所以必须使用 Version 1.8+，关于如何修改版本这里不赘述。...第一步：官网下载相应版本的hadoop。第二步：解压到你想要安装的任何路径，解压过程会提示出现错误，不去管他，这是因为linux文件不支持windows。...然后再path中添加 %HADOOP_HOME%bin和%HADOOP_HOME%sbin 第四步：找一找可以使用的重新编译的winutils兼容工具插件包，这个可以在这里下载：第五步：下载完以后在我们

2K2 0

30分钟--Spark快速入门指南

新建RDD RDDs 支持两种类型的操作 actions: 在数据集上运行计算后返回值 transformations: 转换, 从现有数据集创建一个新的数据集下面我们就来演示 count() 和.../usr/local/spark/README 文件中包含 “a” 的行数和包含 “b” 的行数。...包含了应用程序的信息。...点击查看：解决 sbt 无法下载依赖包的问题使用 sbt 打包 Scala 程序为保证 sbt 能正常运行，先执行如下命令检查整个应用程序的文件结构： cd ~/sparkappfind ....SimpleApp的文件结构接着，我们就可以通过如下代码将整个应用程序打包成 JAR（首次运行同样需要下载依赖包，如果这边遇到网络问题无法成功，也请下载上述安装 sbt 提到的离线依赖包 sbt-0.13.9

3.5K9 0

Apache Spark 2.2.0 中文文档 - Submitting Applications | ApacheCN

为此，创建一个包含您的代码以及依赖的 assembly jar（或者 “uber” jar）。无论是 sbt 还是 Maven 都有 assembly 插件。...对于包含空格的 value（值）使用引号包 “key=value” 起来。 application-jar: 包括您的应用以及所有依赖的一个打包的 Jar 的路径。...高级的依赖管理在使用 spark-submit 时，使用 --jars 选项包括的应用程序的 jar 和任何其它的 jar 都将被自动的传输到集群。...在 --jars 后面提供的 URL 必须用逗号分隔。该列表会被包含到 driver 和 executor 的 classpath 中。 --jars 不支持目录的形式。...这些命令可以与 pyspark, spark-shell 和 spark-submit 配置会使用以包含 Spark Packages（Spark 包）。

84910 0

一文读懂数据分析的流程、基本方法和实践

数据分析除了包含传统意义上的统计分析之外，也包含寻找有效特征、进行机器学习建模的过程，以及探索数据价值、找寻数据本根的过程。...相关性分析相关性分析是指通过分析寻找不用商品或不同行为之间的关系，发现用户的习惯，计算两个数据集的相关性是统计中的常用操作。在MLlib中提供了计算多个数据集两两相关的方法。...（2）创建项目开发环境启动IDEA程序，选择“Create New Project”，进入创建程序界面，选择Scala对应的sbt选项，设置Scala工程名称和本地目录（以book2-master为例...），选择SDK、SBT、Scala版本（作者的开发环境：Jdk->1.8.0_162、sbt->1.1.2、scala->2.11.12），点击“Finish”按钮完成工程的创建。...2.3.0-bin-hadoop2.6/jars）和本地libs（如：\book2-master\libs，包括：nak_2.11-1.3、scala-logging-api_2.11-2.1.2、scala-logging-slf4j

1.4K2 0

——快速入门

我的本地有个文件——test.txt,内容为： hello world haha nihao 可以通过这个文件创建一个新的RDD val textFile = sc.textFile("test.txt...，但是如果再非常大的数据集下就非常有用了，尤其是在成百上千的节点中传输RDD计算的结果。...这个程序仅仅是统计文件中包含字符a和b的分别都有多少行。你可以设置YOUR_SPARK_HOME替换自己的文件目录。不像之前在shell中的例子那样，我们需要自己初始化sparkContext。...应用依赖于spark api，因此需要在程序中配置sbt的配置文件——simple.sbt，它声明了spark的依赖关系。...那么可以参考下面的链接获得更多的内容: 为了更深入的学习，可以阅读Spark编程指南如果想要运行Spark集群，可以参考部署指南最后，Spark在examples目录中内置了多种语言版本的例子，如scala

1.4K9 0

Fedora 配置 Spark 实验环境（一）安装Hadoop、Spark

，将会远程下载sbt launcher，以及对应版本的 sbt 和 scala 程序。...成功启动后会提示sbt的版本以及jdk版本。...另外，sbt会将current project切到当前工作目录下对应的project 远程网络慢的话，可以更换maven仓库 mkdir ~/.sbt vi ~/.sbt/repositories 添加以下内容...> test 运行 main method（或实现App接口的object） > run //可以从多个可执行程序中选择某一个运行 4....examples/jars/spark-examples_2.12-3.2.3.jar 100 2>&1 | grep "Pi is roughly" 6.

8995 0

【腾讯云的1001种玩法】Ubuntu 14.04 Spark单机环境搭建与初步学习

Spark 终端我觉得 Spark 非常亲民的一点是它提供了一个交互式的命令行终端，这样用户就可以快速地测试一些命令和语句，而无需每次都保存代码脚本然后调用执行，这对于 R 和 Python 用户来说是非常顺心的一件事...第8到第13行其实包含了两条操作，第一是调用了 raw 对象的 map() 方法，之后连着的是 cache()方法。...这是因为 Spark 采用了一种“延迟运行”的机制，意思是数据只有在真正用到的地方才开始运算，其理念就是，“只要老师不检查作业，我就暂时不写”。...22和24行插入了两句获取时间的函数，是为了评估模型训练（23行）花费的时间。在第31行中，我们用拟合出的模型对训练集本身进行了预测。...极简 Spark 入门笔记——安装和第一个回归程序[EB/OL]. http://yixuan.cos.name/cn/2015/04/spark-beginner-1/.

4.2K1 0

Spark SQL+Hive历险记

，我这里是2.11.7 （2）下载spark-1.6.0源码，解压进入根目录编译（3）dev/change-scala-version.sh 2.11 修改pom文件，修改对应的hadoop.../conf/hive-site.xml拷贝到spark的conf/目录下，执行，spark-sql的启动命令，同时使用--jars 标签把mysql驱动包，hadoop支持的压缩包，以及通过hive...读取hbase相关的jar包加入进来，启动 Java代码 bin/spark-sql --jars lib/mysql-connector-java-5.1.31.jar, lib/hadoop-lzo...Spark SQL整合Hive时，一定要把相关的jar包和hive-site.xml文件，提交到集群上，否则会出现各种莫名其妙的小问题，经过在网上查资料，大多数的解决办法在Spark的spark-env.sh...里面设置类路径，经测试没有生效，所以，还是通过--jars 这个参数来提交依赖的jar包比较靠谱。

1.2K5 0

Apache Spark 2.2.0 中文文档 - 快速入门 | ApacheCN

我们在 Scala（SBT）, Java（Maven）和 Python 中练习一个简单应用程序。...使用 scala.App 的子类可能不会正常运行。该程序仅仅统计了 Spark README 文件中每一行包含 ‘a’ 的数量和包含 ‘b’ 的数量。...我们的应用依赖了 Spark API, 所以我们将包含一个名为 build.sbt 的 sbt 配置文件, 它描述了 Spark 的依赖。...SimpleApp.scala 和 build.sbt 文件。...在成功后, 我们可以创建一个包含应用程序代码的 JAR 包, 然后使用 spark-submit 脚本来运行我们的程序。

1.4K8 0

Spark新愿景：让深度学习变得更加易于使用

实际上Spark采用了2和3的结合。第二条容易理解，第三条则主要依赖于另外一个项目tensorframes。这个项目主要是实现tensorflow和spark的互相调用。...., name='x') 程序自动从df可以知道数据类型。 df2 = tfs.map_blocks(z, df) 则相当于将df 作为tf的feed_dict数据。...spark-deep-learning使用的是spark 2.1.1 以及python 2.7 ，不过我的环境是spark 2.2.0, python 3.6。...所以你需要在build.sbt里第一行修改为 val sparkVer = sys.props.getOrElse("spark.version", "2.2.0") 同时保证你的python为2.7版本...（你可以通过一些python的管理工具来完成版本的切换），然后进行编译： build/sbt assembly 编译的过程中会跑单元测试，在spark 2.2.0会报错，原因是udf函数不能包含“-”，

1.8K5 0

Spark新愿景：让深度学习变得更加易于使用

实际上Spark采用了2和3的结合。第二条容易理解，第三条则主要依赖于另外一个项目tensorframes。这个项目主要是实现tensorflow和spark的互相调用。...., name='x') 程序自动从df可以知道数据类型。 df2 = tfs.map_blocks(z, df) 则相当于将df 作为tf的feed_dict数据。...spark-deep-learning使用的是spark 2.1.1 以及python 2.7 ，不过我的环境是spark 2.2.0, python 3.6。...所以你需要在build.sbt里第一行修改为 val sparkVer = sys.props.getOrElse("spark.version", "2.2.0") 同时保证你的python为2.7版本...（你可以通过一些python的管理工具来完成版本的切换），然后进行编译： build/sbt assembly 编译的过程中会跑单元测试，在spark 2.2.0会报错，原因是udf函数不能包含“-”，

1.3K2 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭