首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >使用日语字符消除智能引号

使用日语字符消除智能引号
EN

Stack Overflow用户
提问于 2016-03-15 11:13:18
回答 1查看 25关注 0票数 1

在字符串中使用智能引号会导致MYSQL中的存储和后续呈现出现问题。因此,我有一个php函数,可以用常规引号替换智能引号。

但是,当字符串包含日语字符时,它会将某些字符转换为不可打印字符和常规引号的组合。

我假设这是由于外语字符的编码方式造成的,并且与智能引号二进制编码部分匹配,从而导致了此问题。

以下是演示该问题的脚本:

代码语言:javascript
运行
复制
  <?php
  function convert_smart_quotes($string)
  {
      $search = array(chr(145),
      chr(146),
      chr(147),
      chr(148));

      $replace = array("'",
       "'",
       '"',
       '"');

      return str_replace($search, $replace, $string);
  }
 $input_str = "すっぴん美人になるためにやってはいけない「3スギ」とは?";
 $output_str = convert_smart_quotes($input_str);
 echo $output_str;

基本上,我希望这个功能时,它是拉丁字符为基础的语言字符串。同时,如果它是一门外语,我不希望它弄乱字符串。既然没有简单的方法来检测php中的语言,我该如何实现呢?

EN

回答 1

Stack Overflow用户

发布于 2021-08-23 11:57:29

智能引号和类似字符不是UTF-8字符的第一个字节的有效值,但它们可以是UTF-8字符的非第一个字节的有效值。因此,您需要先尝试UTF-8,然后执行智能替换。请让我知道这是否有帮助,如果你需要更多的帮助。

代码语言:javascript
运行
复制
UTF-8 Summary:
    0xxxxxxx
    110xxxxx10xxxxxx
    1110xxxx10xxxxxx10xxxxxx
    11110xxx10xxxxxx10xxxxxx10xxxxxx
    ...

--the x's are the UNICODE bits; smart quote is 10?????? which as shown above cannot be a first byte, but can be one of the other bytes)
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/36002023

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档