在字符串中使用智能引号会导致MYSQL中的存储和后续呈现出现问题。因此,我有一个php函数,可以用常规引号替换智能引号。
但是,当字符串包含日语字符时,它会将某些字符转换为不可打印字符和常规引号的组合。
我假设这是由于外语字符的编码方式造成的,并且与智能引号二进制编码部分匹配,从而导致了此问题。
以下是演示该问题的脚本:
<?php
function convert_smart_quotes($string)
{
$search = array(chr(145),
chr(146),
chr(147),
chr(148));
$replace = array("'",
"'",
'"',
'"');
return str_replace($search, $replace, $string);
}
$input_str = "すっぴん美人になるためにやってはいけない「3スギ」とは?";
$output_str = convert_smart_quotes($input_str);
echo $output_str;
基本上,我希望这个功能时,它是拉丁字符为基础的语言字符串。同时,如果它是一门外语,我不希望它弄乱字符串。既然没有简单的方法来检测php中的语言,我该如何实现呢?
发布于 2021-08-23 11:57:29
智能引号和类似字符不是UTF-8字符的第一个字节的有效值,但它们可以是UTF-8字符的非第一个字节的有效值。因此,您需要先尝试UTF-8,然后执行智能替换。请让我知道这是否有帮助,如果你需要更多的帮助。
UTF-8 Summary:
0xxxxxxx
110xxxxx10xxxxxx
1110xxxx10xxxxxx10xxxxxx
11110xxx10xxxxxx10xxxxxx10xxxxxx
...
--the x's are the UNICODE bits; smart quote is 10?????? which as shown above cannot be a first byte, but can be one of the other bytes)
https://stackoverflow.com/questions/36002023
复制相似问题