大型列表FlatMap Java Spark

腾讯云

开发者社区

文档建议反馈控制台

首页

文章/答案/技术大牛

发布

2回答

、、

我在JavaPairRDD<Integer, List<String>>中有一个很大的列表，我想做一个flatMap来获得列表条目的所有可能组合，这样我就得到了JavaPairRDD<Integer,基本上，如果我有像这样的东西我想要得到： (1, <"A","B">) (1, <"A", "C">)

浏览 11提问于2016-07-26得票数 1

回答已采纳

1回答

数据库连接失败，没有FileSystem for with : abfss

、、

我已经设置了，这样我就可以在本地开发并且获得Intellij的好处，同时利用Azure上一个大型星火集群的功能。当我想读或写到Azure数据湖spark.read.csv("abfss://blah.csv)时，我得到以下信息 at org.apache.hadoop.fs.FileSystem$Cache.getInterna

浏览 2提问于2020-02-28得票数 4

回答已采纳

2回答

如何解决“类型不匹配:无法从List<String>转换为Iterator<String>”错误

、、

我是java8和spark的新手，在这里我试图用java执行简单的平面图转换程序，但是我在第二行Arrays.asList(e.split(" ")));中遇到了一些平面图转换中的错误，错误是 import java.util.Arrays; import org.apache.spark.api.<em

浏览 0提问于2019-01-14得票数 3

回答已采纳

2回答

为什么我不能将kafka.cluster.BrokerEndPoint转换为kafka.cluster.Broker？

、、

import org.apache.spark.SparkConf;import org.apache.spark.streaming.Duration;import org.apache.spark.streaming.api.

浏览 2提问于2016-10-10得票数 1

回答已采纳

1回答

SparkException:不可序列化的任务(即使在类实现可序列化之后)

、、

JavaRDD<Tuple2<String, String>> pairRDD = someRDD.flatMap at org.apache.spark.rdd.RDD.flatMap(RDD.scala:295) at org.apache.spark.api.java.JavaRDDLike$class.flatMap<

浏览 5提问于2016-10-07得票数 0

回答已采纳

2回答

("com.databricks.spark.avro").load(files: _*)java.lang.IllegalArgumentException: java.net.URISyntaxExceptioncom.amazon.ws.emr.hadoop.fs.EmrFileSystem.globStatus(EmrFileSystem.java:362) at org.apache.spark.deploy.SparkHadoopUtil.globPa

浏览 3提问于2017-10-16得票数 0

1回答

使用Spark 2.1.0的Java中的FlatMap

、、

我正在尝试使用Java8中的spark 2.1.0进行flatMapJavaDStream<String> words = lines.flatMap(x -> Arrays.asList(x.split(" ")).iterator());Error:(31, 25) java: method flatMap in class org.apache.spark</

浏览 0提问于2017-07-21得票数 1

1回答

字符串匹配后的火花提取行并保存在ArrayList中。

、

我没有遇到任何错误，但是数组列表是空的。你能指点我哪里出问题了吗？或者是最好的方法？import java.util.*; import org.apache.spark.api.java.JavaRDD;import org.apache.spark.api.java</

浏览 1提问于2016-05-08得票数 0

回答已采纳

2回答

aws: EMR集群在提交spark作业时失败"ERROR UserData:在获取用户数据时遇到的错误“

、、

:2878) at org.apache.spark.deploy.DependencyUtilsresolveGlobPaths$2.apply(DependencyUtils.scala:144) at scala

浏览 0提问于2019-07-30得票数 6

回答已采纳

1回答

无法使用星星之交访问Google存储桶

、、、

(FileSystem.java:540) at scala.collection.TraversableLike.flatMap$(TraversableLike.scala:290) at scala.collection.AbstractTraversable.flatMap(Tra

浏览 18提问于2022-02-12得票数 0

1回答

不能将kafka.cluster.BrokerEndPoint转换为kafka.cluster.Broker

、

"bootstrap.servers"-> "127.0.0.1:9092"), )Exception in thread "main" java.lang.ClassCastException$$anonfun$flatMap$1.apply(TraversableLike.scala:241) at scala.collection.TraversableLike$$anonfun$flatMap:

浏览 2提问于2016-07-09得票数 1

回答已采纳

1回答

火花任务不是可序列化的Hadoop-MongoDB-连接器安然

、、

at org.apache.spark.rdd.RDD$$anonfun$flatMap$1.apply(RDD.scala:333) at org.apache.spark.rdd.RDDOperationScope$.withScope(RDDOperationScope.scala(RDD.scala:316) at org.apache.<

浏览 4提问于2017-03-28得票数 2

回答已采纳

1回答

我无法在星火应用程序中添加持久卷声明

、

Ignoring this directory. at scala.collection.TraversableLike.flatMap$(TraversableLike.scala:242) at scala.collection.mutable.ArrayOps$ofRef.flatMap(ArrayOp

浏览 3提问于2022-01-27得票数 0

1回答

如何在JavawithSpark2.1中使用lambda flatMap()

、、、、

我正在将Python应用程序移植到Java，并坚持正确的实现Lambda flatMap()的方法。我正在通过IP日志进行解析，需要在“”(空间)上拆分。我的环境：加载数据文件： Dataset<Row> MyLog = spark.sql("Select= Mylog.flatMap(e -> Array.asList(e.split(' ')))

浏览 0提问于2019-02-05得票数 1

2回答

spark-submit不适用于hdfs中的jar

、、

<init>(DFSClient.java:619) at org.apache.hadoop.fs.FileSystem$Cache.getInternal(FileSystem.java:2632(FileSystem.java:370) at or

浏览 0提问于2019-10-15得票数 0

1回答

Spark HistoryServer未出现

、、、、

(TraversableLike.scala:251) at java.lang.reflect.Constructor.newInstance(Constructor.java:526)

浏览 1提问于2015-05-22得票数 1

1回答

Spark S3空uri主机

、

at org.apache.hadoop.fs.Path.getFileSystem(Path.java:361) at scala.collection.TraversableLike$$anonfun$flatMap$1.apply(TraversableLike.scala:241) atscala.collection.TraversableLike$$anonfun$flatMap</

浏览 25提问于2021-02-10得票数 2

回答已采纳

2回答

电火花流卡夫卡在CDH 5.8.3中的集成

、、、

executor-memory 4G --jars (somejars for HBase interaction) --class mypackage.MyClass myJar.jarjava.lang.ClassCastException$$anonfun$flatMap$1.apply(TraversableLike.scala:251) at scala.collection.TraversableLike$$anonfun$flatMapsun.reflect.NativeMethodAccessorIm

浏览 2提问于2017-01-05得票数 3

回答已采纳

1回答

如何从包含枚举的案例类创建Spark* Dataset或Dataframe*

、、

$$extractorFor$1.apply(ScalaReflection.scala:502)at scala.collection.TraversableLike$class.flatMap(TraversableLike.scala:251) at scala.collection.AbstractTraversable.

浏览 6提问于2016-09-23得票数 10

回答已采纳

1回答

Apache Spark* :如何添加默认和特定依赖项？*

、

我的spark-defaults.conf：spark.jars.packages org.influxdb:influxdb-java:2.14:45) at org.apache.spark.util.Utils:241) at scala.collection.Traversabl

浏览 0提问于2019-11-18得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云