首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >获取字符的Unicode值

获取字符的Unicode值
EN

Stack Overflow用户
提问于 2010-02-08 16:42:00
回答 6查看 167.7K关注 0票数 75

在Java中有没有什么方法可以让我得到任何字符的Unicode等效项?例如:

假设有一个getUnicode(char c)方法。调用getUnicode('÷')应该返回\u00f7

EN

回答 6

Stack Overflow用户

回答已采纳

发布于 2010-02-08 17:07:44

您可以使用下面的一行代码对任何Java字符执行此操作:

代码语言:javascript
运行
复制
System.out.println( "\\u" + Integer.toHexString('÷' | 0x10000).substring(1) );

但它只适用于Unicode 3.0之前的Unicode字符,这就是为什么我之前说过可以对任何Java字符执行此操作。

因为Java是在Unicode3.1出现之前设计的,因此Java的char原语不足以表示Unicode3.1及更高版本:不再有“一个Unicode字符到一个Java char”的映射(而是使用了一种可怕的技巧)。

因此,您必须在这里检查您的需求:您是否需要支持Java char或任何可能的Unicode字符?

票数 73
EN

Stack Overflow用户

发布于 2010-02-08 17:13:10

如果您使用的是Java5,请使用char c = ...; String s = String.format ("\\u%04x", (int)c);

如果源不是Unicode字符(char),而是一个字符串,则必须使用charAt(index)获取位置index处的Unicode字符。

不要使用codePointAt(index),因为它将返回24位的值(完整的Unicode),这不能只用4个十六进制数字来表示(它需要6个)。参见the docs for an explanation

编辑以明确:此答案不使用Unicode,而是Java用来表示Unicode字符(即代理对)的方法,因为char是16位,Unicode是24位。问题应该是:“我如何将char转换为4位十六进制数字”,因为它(实际上)与Unicode无关。

票数 37
EN

Stack Overflow用户

发布于 2013-08-07 16:20:02

代码语言:javascript
运行
复制
private static String toUnicode(char ch) {
    return String.format("\\u%04x", (int) ch);
}
票数 14
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/2220366

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档