就像下面的那个res3: org.apache.spark.sql.DataFramepredict_churn", outerpredict _)java.lang.UnsupportedOperationException: Schema for type org.apache.spark.sql.DataFrame</e
我有一个scala List List[Any] = List("a", "b",...),我需要获取一个Sparkdataframe,它只包含列表中所有列的一行。我正在尝试用返回org.apache.spark.rdd.RDD[Any] = ParallelCollectionRDD[5834] at parallelize at <console>:81的sc.parallelize:sc.parallelize(myList).map(line
但是我想做多类分类,所以我在org.apache.spark.ml.classification包中使用了org.apache.spark.ml.classification。如果是这样的话,我可以看到在DecisionTreeClassifier预测输出之后可能出现的列吗? at org.apache.sp
我有一个有2列的SparkDataFrame,我正在尝试创建一个新列,使用when otherwise操作的另外两列。Cannot convert column into bool: please use '&' for 'and', '|' for 'or', '~' for 'not' when building DataFrame我以前在单列</
当创建一个列值默认值为NULL的表时,我在Spark(1.6) SQL中获得了下面的错误。示例:将表测试创建为select column_a,NULL作为column_b从test_temp创建; at org.apache.spark.sql.DataFrame.withCallback(DataFrame.scala:153)
at org.apach
我正在尝试将一些计算列添加到SparkR数据框中,如下所示:(unix_timestamp$$anonfun$resolve$1.apply(DataFrame.scala:159)
at org.apache.spark.sql.DataFrame$$anonfun$resolve$1.apply(DataFrame.sca
我正在尝试访问一个hive表,并从表/ dataframe中提取和转换某些列,然后将这些新列放到一个新的dataframe中。:36) at org.apache.spark.sql.execution.QueryExecution.assertAnalyzed(QueryExecution.scala:34) at org.apache.spark.sql.DataFrame(DataFrame.