我有一些希伯来语网站,其中包含字符参考,如:נוף
如果我将文件另存为.html并以UTF8编码查看,则只能查看这些字母。
如果我尝试将其作为常规文本文件打开,则UTF-8编码无法显示正确的输出。
我注意到,如果我打开一个文本编辑器并用UTF-8编写希伯来语,在本例中,每个字符占用两个字节而不是4个字节(ו)
如果这是UTF-16或任何其他类型的字母的UTF表示,您知道吗?
如果可能,我如何将其转换为普通字母?
使用最新的PHP版本。
发布于 2010-08-25 20:42:27
这些都是XML Character Reference。您希望使用html_entity_decode()对它们进行解码
$string = html_entity_decode($string, ENT_QUOTES, 'UTF-8');有关更多信息,您可以在Google中搜索有问题的实体。请看以下几个示例:
https://stackoverflow.com/questions/3565713
复制相似问题