如何设置默认的Java字符编码?

内容来源于 Stack Overflow,并遵循CC BY-SA 3.0许可协议进行翻译与使用

  • 回答 (10)
  • 关注 (0)
  • 查看 (721)

如何以编程方式正确设置JVM(1.5.x)使用的默认字符编码?

我以前试过-Dfile.encoding=whatever,对于老版本的JVM来说,可以这样做,但是新版本该怎么办?

我试过:

System.setProperty("file.encoding", "UTF-8");

属性被设置,但它似乎不会导致下面的getBytes最后调用使用UTF 8:

    System.setProperty("file.encoding", "UTF-8");

    byte inbytes[] = new byte[1024];

    FileInputStream fis = new FileInputStream("response.txt");
    fis.read(inbytes);
    FileOutputStream fos = new FileOutputStream("response-2.txt");
    String in = new String(inbytes, "UTF8");
    fos.write(in.getBytes());
提问于
用户回答回答于

不幸的是,file.encoding属性必须在jvm启动时指定;当输入主方法时,String.getBytes()的默认构造函数InputStreamReaderOutputStreamWriter一直被缓存。

在特殊情况下,环境变量JAVA_TOOL_OPTIONS用于指定此属性,但通常如下所示:

java -Dfile.encoding=UTF-8 … com.x.Main

Charset.defaultCharset()将反映对file.encoding属性,但是需要确定默认字符编码的核心Java库中的大多数代码不使用此机制。

在编码或解码时,可以查询file.encoding属性或Charset.defaultCharset()若要查找当前默认编码,请使用适当的方法或构造函数重载来指定它。

用户回答回答于

下面是一种迫不得已的办法

System.setProperty("file.encoding","UTF-8");
Field charset = Charset.class.getDeclaredField("defaultCharset");
charset.setAccessible(true);
charset.set(null,null);

这样好比欺骗JVM,因为JVM认为字符集没有设置,在运行时再将其设置为UTF-8!

用户回答回答于

我们将两个系统属性放在一起,这使得系统将所有编码都成为了UTF 8。

file.encoding=UTF8
client.encoding.override=UTF-8
用户回答回答于

我尝试了很多东西,下面的代码成功运行

String s = "एक गाव में एक किसान";
String out = new String(s.getBytes("UTF-8"), "ISO-8859-1");
用户回答回答于

不可以在目标文件上插入不同的OutputStream类,则可以使用OutputStream的一个子类型,它将字符串转换为您定义的字符集,默认情况下为UTF-8。可以使用DataOutputStream.writeUTF(String):

byte inbytes[] = new byte[1024];
FileInputStream fis = new FileInputStream("response.txt");
fis.read(inbytes);
String in = new String(inbytes, "UTF8");
DataOutputStream out = new DataOutputStream(new FileOutputStream("response-2.txt"));
out.writeUTF(in); // no getBytes() here

这可能会有所帮助。祝你好运。

用户回答回答于

试试这个:

    new OutputStreamWriter( new FileOutputStream("Your_file_fullpath" ),Charset.forName("UTF8"))
用户回答回答于

你可以显式地指定所需的编码(即:代码中的“utf - 8”)。

用户回答回答于

我认为比设置平台的默认字符集更好的方法是,不要对应用程序产生影响,而是调用更安全的String.getBytes(“charsetName”)。这样,您的应用程序就不依赖于超出其控制的事物。

我个人觉得String.getBytes()应该反对,一些情况下,开发人员没有考虑到默认字符集可能会发生变化,所以最后造成问题。

用户回答回答于

JVM。™工具接口文件可以发现…

由于命令行不能总是被访问或修改,例如在嵌入式VM中,或者简单地在脚本中启动VM,所以JAVA_TOOL_OPTIONS变量,以便启动代理。

通过设置(Windows)环境变量JAVA_TOOL_OPTIONS-Dfile.encoding=UTF8,每次启动JVM时将会自动设置。您将知道参数已被选中,因为下面的消息将被发布到System.err:

Picked up JAVA_TOOL_OPTIONS: -Dfile.encoding=UTF8

扫码关注云+社区

领取腾讯云代金券