为什么PHPjson_encode函数将UTF-8字符串转换为十六进制实体?

内容来源于 Stack Overflow,并遵循CC BY-SA 3.0许可协议进行翻译与使用

  • 回答 (2)
  • 关注 (0)
  • 查看 (70)

我有一个PHP脚本,它处理各种各样的语言。不幸的是,每当我试图使用,任何Unicode输出都转换为十六进制实体。这是期望的行为吗?有没有办法将输出转换成UTF-8字符?

下面是我看到的一个例子:

输入

echo $text;

输出量

База данни грешка.

输入

json_encode($text);

输出量

"\u0411\u0430\u0437\u0430 \u0434\u0430\u043d\u043d\u0438 \u0433\u0440\u0435\u0448\u043a\u0430."
提问于
用户回答回答于

自PHP/5.4.0以来,有一个选项名为JSON_UNESCAPED_UNICODE:

因此,你应该尝试:

json_encode( $text, JSON_UNESCAPED_UNICODE );
用户回答回答于

JSON_UNESCAPED_UNICODE可在PHPVersion 5.4或更高版本上使用。

以下代码用于5.3版本。

更新

  • html_entity_decode 比pack + mb_convert_encoding更有效。
  • (*SKIP)(*FAIL)通过 JSON_HEX_* flags跳过反斜杠和特殊字符。
function raw_json_encode($input, $flags = 0) {
    $fails = implode('|', array_filter(array(
        '\\\\',
        $flags & JSON_HEX_TAG ? 'u003[CE]' : '',
        $flags & JSON_HEX_AMP ? 'u0026' : '',
        $flags & JSON_HEX_APOS ? 'u0027' : '',
        $flags & JSON_HEX_QUOT ? 'u0022' : '',
    )));
    $pattern = "/\\\\(?:(?:$fails)(*SKIP)(*FAIL)|u([0-9a-fA-F]{4}))/";
    $callback = function ($m) {
        return html_entity_decode("&#x$m[1];", ENT_QUOTES, 'UTF-8');
    };
    return preg_replace_callback($pattern, $callback, json_encode($input, $flags));
}

扫码关注云+社区