我必须将我的星火数据帧输出写入一个csv文件中,该文件中有一个“\^\\”分隔符。我正试着这样做。
df.write.format("csv").option("delimiter", "\\|\\^\\|")
但是越来越少的错误
java.lang.IllegalArgumentException:分隔符的不受支持的特殊字符:
如何添加UTF-8-BOM编码输出文件在默认情况下是UTF-8?
在java中,如果我在文件的开头添加"\uFEFF“,那么文件的编码将更改为UTF-8-BOM。现在,我如何在spark中添加这个字符呢?
另外,如果我使用下面的方法,df.rdd.map(x=>x.mkString("|^|")).saveAsTextFile("dir path to store")
如何根据数据帧中的列对数据进行分区?
发布于 2017-10-04 08:50:20
刚把
df.write.format("csv").option("delimiter","^").csv("dir path to store")
对于多个字符,您可以使用下面的代码
df.rdd.map(x=>x.mkString("|^|")).saveAsTextFile("dir path to store")
https://stackoverflow.com/questions/46569786
复制相似问题