SPARK: java.lang.IllegalStateException:找不到任何构建目录 - 腾讯云开发者社区

文章/答案/技术大牛

发布

如何在Kerberos环境下的CDH集群部署Spark2.1的Thrift及spark-sql客户端

3.将解压出来的spark-2.1.0-bin-hadoop2.6/jars目录下的hive-cli-1.2.1.spark2.jar和spark-hive-thriftserver_2.11-2.1.0...4.将/opt/cloudera/parcels/SPARK2/lib/spark2/jars目录下的所有jar上传至HDFS，如果目录不存在则创建 [root@cdh03 jars]# kinit spark...7.部署Spark SQL客户端将spark-2.1.0-bin-hadoop2.6/bin/目录下的spark-sql脚本拷贝至/opt/cloudera/parcels/SPARK2/lib/spark2...在Spark2的HOME目录创建如下目录： [root@cdh02 ~]# mkdir -p /opt/cloudera/parcels/SPARK2/lib/spark2/launcher/target...注意：部署spark-sql客户端时需要创建$SPARK_HOME/launcher/target/scala-2.11目录，否则启动会报“java.lang.IllegalStateException

2.5K3 0

Kylin配置Spark并构建Cube

/spark/jars/ ./ # 上传到HDFS上的指定目录 hadoop fs -mkdir -p /kylin/spark/ hadoop fs -put spark-libs.jar /kylin...三、构建Cube 保存好修改后的 Cube 配置后，点击 Action -> Build，选择构建的起始时间（一定要确保起始时间内有数据，否则构建 Cube 无意义），然后开始构建 Cube 。...解决办法：由于缺失 HBase 相关的类文件比较多，参照 Kylin 官网给出的解决方式依旧报找不到类文件，所以我将 HBase 相关的 jar 包都添加到了 spark-libs.jar 里面。...五、Spark与MapReduce的对比使用 Spark 构建 Cube 共耗时约 7 分钟，如下图所示： ? 使用 MapReduce 构建 Cube 共耗时约 15 分钟，如下图所示： ?...还是使用 Spark 构建 cube 快，还快不少！

1.4K5 0

您找到你想要的搜索结果了吗？

是的

没有找到

spark任务提交时绝对路径添加额外配置文件提示找不到路径

=radar --conf spark.driver.cores=4 --conf spark.driver.maxResultSize=10G --conf spark.yarn.submit.waitAppCompletion...和computeA1524709482.7682726_output_data.conf失败，提示找不到文件。...computeA1524709482.7682726_output_data.conf computeA 只有cd到 tmp目录，用相对文件路径提交时才可以。...原因是spark将文件上传到集群时,会找/tmp/computeA_run_spark.py的路径，找不到，没上传成功或者上传成功放入了别的路径（没看到spark提示上传文件失败）。...因此在你spark脚本执行的时候调用computeA_run_spark.py提示找不到文件。

3.1K3 0

Kylin配置Spark并构建Cube（修订版）

1K2 0

聊聊spark-submit的几个有用选项

__spark_libs__ 这个子目录，存储了spark这个计算框架本身依赖的一系列jar包，我们可以看到一共有240个jar包，那么我们回到spark工程根目录，看看assembly/target.../scala-2.11/jars/这个目录，刚好240个jar包，说明spark在提交任务时，把自身依赖的jar包发送到了各个container的本地目录下，spark计算框架需要的文件系统、配置、网络...，这时我们发现在每个container的本地目录下，jetty-plus-9.3.20.v20170531.jar这个包已经安全的躺在那里了，所以下次我们再遇到类找不到的问题，我们就可以去这个目录下看看...，jvm类加载时需要的jar是否在这个目录下，如果不在，那就肯定会报类找不到的异常了，如果在，那么我们可以使用jar或者unzip命令解压开这个jar包看看到底有没有需要的class文件。...妈妈再也不用担心我跑spark时找不到类啦！

2.8K3 0

spark on yarn 如何集成elasticsearch

，共享的依赖用在变化，这样的好处就是动静分离，核心代码体积非常小，只有只kb，每次编译重新打包上传linux运行速度非常快，依赖的jar虽然体积比较大，数量多但是我们只需要第一次将其全部收集到一个公共目录即可...，程序运行时加载这个目录即可。...提交命令加上--jars libs/*jar即可，少数时候会出现另外一种情况，明明libs目录下有这个jar包，但是在运行spark任务的时候一直报这个jar的类找不到，如果出现这种情况，就需要在每台...hadoop或者spark的机器上创建一个本地的jar目录，然后把那个出现问题的jar，放在这里面，最后在使用下面的几个参数配置此jar，这样以来这种问题基本就能解决。...最后需要注意的是，如果跟hive集成的时候，还用到了yarn-cluster模式，那么提交任务的时候，必须把hive-site.xml也提交上去，否则会报找不到hive的表异常。

1.4K6 0

0858-7.1.6-安装YARN Queue Manager服务启动异常分析

报错信息为： Caused by: java.lang.IllegalStateException: Could not open file nio:/var/lib/hadoop-yarn/config-service.mv.db...根据报错分析是找不到config-service.mv.db。...2.解决办法 1.手动去对应目录下创建一个名为config-service.mv.db的文件 [root@cdh2 hadoop-yarn]# vim config-service.mv.db ?

1.2K4 0

使用CDSW和运营数据库构建ML应用2：查询加载数据

Get/Scan操作使用目录在此示例中，让我们加载在第1部分的“放置操作”中创建的表“ tblEmployee”。我使用相同的目录来加载该表。...例如，如果只需要“ tblEmployee”表的“ key”和“ empName”列，则可以在下面创建目录。...如果您用上面的示例替换上面示例中的目录，table.show（）将显示仅包含这两列的PySpark Dataframe。...已提交JIRA来解决此类问题，但请参考本文中提到的受支持的方法来访问HBase表 https://issues.apache.org/jira/browse/HBASE-24828 —找不到数据源“ org.apache.hbase.spark...Hub Cloudera Data Science Workbench（CDSW）作为PySpark更高级用法的一部分，请单击此处以了解第3部分，以了解PySpark模型的方式可以与HBase数据一起构建

5.3K2 0

Java的ClassPath问题

在文章《Spark Submit的ClassPath问题》中，我探讨了针对spark-submit的Jar包，如何指定外部依赖的Jar包。同样的问题在本地部署时仍然存在。...此时，运行Jar并不是通过spark-submit，而是通过java命令，例如： exec java -Xmx2000m -DMORT_HOME=$MORT_HOME -Ddata-set-parquet.path...然而事情的发展并非我所愿，运行时仍然报告找不到第三方Jar包中相关类的错误。...资料还提到可以将要依赖的第三方jar包放在JVM的扩展class路径下，即{java_home}\jre\lib\ext目录下。一旦设置正确，就无需修改任何配置文件了。

1.6K7 0

如何在CDH中启用Spark Thrift

.tgz [wkb4idcoxd.jpeg] 3.将解压出来的spark-assembly-1.6.3-hadoop2.6.0.jar拷贝至CDH的jars目录 [root@cdh02 spark-1.6.3...99zmvp8yfi.jpeg] 5.将spark-assembly-1.6.3-hadoop2.6.0.jar包上传至HDFS目录 [root@cdh02 lib]# sudo -u spark hadoop...spark-lineage_2.10-1.6.0-cdh5.13.0.jar包，否则连接Spark会报错找不到com.cloudera.spark.lineage.ClouderaNavigatorListener...3.部署Spark ThriftServer启动和停止脚本 ---- 1.拷贝Spark ThriftServer启动和停止脚本将 spark-1.6.3-bin-hadoop2.6/sbin/目录下的...否则连接Spark会报错找不到com.cloudera.spark.lineage.ClouderaNavigatorListener类。CDH5.10或之前版本不用加载这个jar包。

6.5K9 0

flink问题集锦

解决方法：去掉即可问题2： java.lang.IllegalStateException: No Executor found....error: 1 (Exit value: 1) 产生这个问题的原因有很多，重要的是查看error报错的信息，我这边主要是scala中调用了java的方法，但build时只指定了打包scala的资源，所以会找不到类报错...artifactId> 1.3.1 问题9： Exception in thread “Thread-8” java.lang.IllegalStateException...ToolRunner.java:90) at org.apache.hadoop.fs.FsShell.main(FsShell.java:389) 按照提示说core-site.xml找不到..., 很疑惑；明明core-site.xml等配置文件存在，且配置没有任何问题。

4.9K2 0

CarbonData集群模式体验

： /data/soft/lib/java/carbondata-kettle 配置完成后检查下，确保carbondata-kettle下有个.kettle 的隐藏目录，该目录有kettle.properties...各个Slave节点都会加载该配置文件 Hive MetaStore 配置首先下载一个mysql-connector,放到你准备提交Spark任务的机器上(有SPARK_HOME的机器上)的某个目录，比如我这里是...hive-site.xml文件一般会配置两个目录： hive.exec.scratchdir hive.metastore.warehouse.dir 你需要确保你之后需要运行的程序对着两个目录相应的权限...构建CarbonContext 对象 import org.apache.spark.sql.CarbonContext import java.io.File import org.apache.hadoop.hive.conf.HiveConf...Slave节点不存在，你进入Spark 各个节点(Executor)的日志,可以看到很明显的错误，提示 kettle.properties 找不到。

2.2K2 0

用IntelliJ IDEA提交pyspark程序

最近要用python写spark程序。因为idea如此强大，因此要写一个如何在idea上提交pyspark程序。安装python组件不管怎么样，想要在idea编写python需要安装组件。...可能很多小朋友找不到这个页面，其实在打开工程的时候，左上角file->close project就可以了。然后Create New Project： ?...里要设置好如下的内容： export SPARK_HOME=/home/fish/workspace/spark_compile/spark export PYTHONPATH=$SPARK_HOME/...其中PYTHONPATH填入的是spark目录下的python目录。关联源码这样虽然可以运行程序，但是无法进入到源码中实际看看到底是什么原理，因此要关联源码。...至此，就可以用idea写pyspark的程序并查看源码了，但是发现pyspark的源码都特别简单，而且有很多都省略的，至于它们是怎么转化成scala语言与spark关联的需要日后研究。以上。

2.2K10 0

hive on spark 测试

Apache Hbase0.98.12 Apache Hive1.2.1 Apache Tez0.7.0 Apache Pig0.15.0 Apache oozie4.2.0 Apache Spark1.6.0...Cloudrea Hue3.8.1 经测试，spark1.6.0和spark1.5.x集成hive on spark有问题，相关链接:http://apache-spark-user-list....1001560.n3.nabble.com/Issue-with-spark-on-hive-td25372.html 所以只能下载spark-1.4.1然后执行如下命令，重新编译： dev/change-scala-version.sh...-1.4.1-hadoop2.7.1.jar 到hive的lib目录下即可，然后启动hive： set hive.execution.engine=spark; 执行一个查询： ?...可以执行没有问题，但在测试hive关联hbase表使用spark模式运行的时候，会出现一个异常，spark的kvro序列化总是找不到hbase的一个类，但明明已经启动的时候，加入到hive的class

1.5K9 0

spark-3.0安装和入门

打包过程参考：idea开发spark程序 1）进入D:\SoftWare\spark\spark-3.0.0-bin-hadoop3.2\bin 2）将jar包上传到bin目录下，和测试的文件 3）...，最后启动spark的时候会报一些文件找不到 $ chmod -R 755 /spark-3.0.0 设置环境变量 #设置环境变量 $ vim /etc/profile #增加一下配置： export...spark-local 2.使用进入 /opt/module/spark-local目录下 spark-shell：命令行工具执行以下命令 [hadoop@hadoop103 spark-local...放在本地路径可能出现文件找不到的异常。...上的目录需要提前存在。

1.3K4 0

Kylin2.5.2完全分布式安装部署

首先就是Kylin的环境变量： vi /etc/profile ##同样，这里将目录改为自己的目录即可 export KYLIN_HOME=/opt/kylin2.5.2 export PATH=...还有一点，就是笔者在启动的时候，老是报错：找不到主机。...value>mzz11,mzz12,mzz13 没错，就是这个配置项，因为笔者用的是外置的zookeeper，一开始的时候配置项加上了post，一直报错找不到...// Kylin2.6.1安装的时候需要自己下载spark的二进制包，或者运行download-spark.sh，不然会报错： spark not found, set SPARK_HOME, or...run bin/download-spark.sh 从这个版本开始Kylin不提供spark的二进制包。

6953 0

spark2.4.4-CDH6.3.0编译

在之前的文章中描述了Spark+CDH的编译步骤， spark-2.1.0-bin-2.6.0-cdh5.x源码编译但是，Spark2.4.4的编译命令和前版本略有区别：需要去掉hadoop-3.0.0...-cdh6.3.0 的 hadoop-前缀，这一步很关键，否则会报找不到 hadoop-client jar包的错误。...progress-bar -L https://downloads.lightbend.com/scala/2.11.12/scala-2.11.12.tgz 脚本先下载zinic和scala到build目录下...，如果网速感人的话，自己可以把这两个依赖手动下到build目录下编译成可执行的tgz包： .

1.4K1 0

0871-6.3.2-如何基于CDH6环境编译Hudi-0.9.0并使用

Hudi 是一个丰富的平台，用于构建具有增量数据管道的流式数据湖，具有如下基本特性/能力： Hudi能够摄入（Ingest）和管理（Manage）基于HDFS之上的大型分析数据集，主要目的是高效的减少入库延时...Hudi支持Spark 2.x版本，建议使用2.4.4+版本的Spark。...模块的org.apache.hudi.DefaultSource类中的部分代码段使用CDH6.3.2版本的Spark依赖包找不到org.apache.spark.sql.execution.datasources.orc.OrcFileFormat...4.Hudi与Spark集成测试 1.在前面完成了Hudi源码的编译，在packaging目录下的hudi-spark-bundle模块可以找到编译好的hudi-spark-bundle_2.11-0.9.0... uuid, partitionpath from hudi_trips_snapshot").show() 7.查看HDFS上的hudi数据目录 hadoop fs -ls -R /tmp/hudi_trips_cow1

3.3K3 0

springboot开发spark-submit的java代码

springboot开发spark-submit的java代码前言习惯使用spark-submit提交python写的pyspark脚本，突然想开发基于springboot开发java spark代码...数据处理完整工程代码见文章1 代码结构如下图： data目录存在测试数据； script脚本为linux下的spark-submit启动脚本； src目录为基于springboot的业务逻辑代码。...； 3.4 task目录实现所有的业务逻辑，其中DoPrepareTask组装输入输出目录，DoInitTask初始化SparkSession和UDF，DoProcessTask实现业务逻辑；...找不到主类找不到主类--> org.apache.maven.plugins maven-compiler-plugin

3.1K0 0

数据湖计算的Serverless革命：主流云服务的深度对比分析

技术实现与其他功能腾讯云数据湖计算DLC还提供了数据集成、数据开发和数据质量管理等能力，构建完整的数据湖解决方案。...AWS Athena Serverless计算 AWS Athena提供了一个交互式的查询服务，无需管理任何基础设施。...多引擎查询（Spark/Presto/Flink）主要基于Presto引擎，提供SQL查询能力，但不支持Spark和Flink。统一元数据依赖于AWS Glue进行元数据管理和数据目录服务。...多引擎查询（Spark/Presto/Flink）支持Spark和Flink，但查询能力主要基于Spark SQL。统一元数据通过华为云的元数据服务，实现数据治理。...湖仓一体与华为云的其他存储和计算服务集成，构建湖仓一体架构。数据目录提供数据目录服务，简化数据发现和访问。弹性伸缩根据工作负载自动调整资源。

2061 0

点击加载更多

如何在Kerberos环境下的CDH集群部署Spark2.1的Thrift及spark-sql客户端

Kylin配置Spark并构建Cube

spark任务提交时绝对路径添加额外配置文件提示找不到路径

Kylin配置Spark并构建Cube（修订版）

聊聊spark-submit的几个有用选项

spark on yarn 如何集成elasticsearch

0858-7.1.6-安装YARN Queue Manager服务启动异常分析

使用CDSW和运营数据库构建ML应用2：查询加载数据

Java的ClassPath问题

如何在CDH中启用Spark Thrift

flink问题集锦

CarbonData集群模式体验

用IntelliJ IDEA提交pyspark程序

hive on spark 测试

spark-3.0安装和入门

Kylin2.5.2完全分布式安装部署

spark2.4.4-CDH6.3.0编译

0871-6.3.2-如何基于CDH6环境编译Hudi-0.9.0并使用

springboot开发spark-submit的java代码

数据湖计算的Serverless革命：主流云服务的深度对比分析

相关资讯

热门标签

活动推荐

运营活动

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐