我正尝试将使用saveAsNewAPIHadoopFile编码的RDD保存到AWS存储桶中,但是当它保存到S3存储桶中时,它将字符编码改为S3 -8。代码片段
val cell = “ MYCOST £25” //This is in UTF-8 character encoding .val iso-data = new String(cellData.getBytes(charset), charset) // here it convert
我需要写一个CVS导出程序,它内部使用UTF-8编码,这源于用户通过网络输入(所以你可以期待任何字符)。这是日语系统,所以我需要编码成Shift_JIS。现在,当我将UTF-8改为Shift_JIS时,我得到如下错误:
Encoding::UndefinedConversionError (U+7E6B from UTF-8 to Shift_JIS):我想要a)消除字符,或者b)将字符映射到其他<
因此,我将编码从Window->Preferences->General->Content >Text->Java改为UTF-8。代码中的注释是可以的,但是当我运行程序时,有些单词包含奇怪的字符,例如、San Germ、�n、 (San Germán)。如果我将编码更改为ISO-8859-1,那么当我运行该程序时,一切都是正常的,但代码中的注释却不是(奇怪的字符!)。那么,它出了什么问题?编辑:我的程序是
但是,虽然我在NetBeans 7.0中将项目设置为在UTF-8中编码,但当我在项目中创建一个文件时,在Notepad++中查看该文件时,该文件是用ANSI编码的,我必须手动将编码设置为UTF-8:在Aptana Studio 3中,我将工作区设置为UTF-8编码,并且我的项目继承了该编码,但是当我在项目中创建一个文件并使用Notepad++查看它时,它是用ANSI编码的,