前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >关于PHP字符编码的函数区别

关于PHP字符编码的函数区别

作者头像
似水的流年
发布2018-01-18 16:30:14
1.3K0
发布2018-01-18 16:30:14
举报
文章被收录于专栏:电光石火电光石火

在以前的学习当中,比方说有一次的写采集过程中转换字符的编码的时候老是失败,转换的结果总没有完全输出,后来经过网络查询得知是iconv有一个“-”漏洞,所以我们有必要掌握PHP的另一个字符编码函数mb_convert_encoding。

mb_convert_encoding函数为php内部多字节字符串编码转换函数,可以在有需要的使用场合(如:解决在GB2312编码环境下使用Ajax产生的中文字乱码的问题)方便进行编码转换,以解决网页乱码的问题,使用非常方便,效率非常高,几乎支持所有编码。PHP 4 >= 4.0.6、PHP 5 版本支持。

函数原型

/**

* 多字节字符串编码转换函数

*

* @param string str 需要进行编码转换的字符串

* @param string to_encoding 指定转换为某种编码,如:gb2312、gbk、utf-8等

* @param mixed from_encoding 混合指定原来字串的编码,如:同时指定 JIS, eucjp-win, sjis-win 混合编码

* @return string

*/

string mb_convert_encoding ( string str, string to_encoding [, mixed from_encoding] )

使用举例

1、把 GBK 编码字串转换成 UTF-8 编码字串

代码语言:javascript
复制
header("content-Type: text/html; charset=Utf-8");      
echo mb_convert_encoding("你是我的好朋友", "UTF-8", "GBK");  

2、把 UTF-8 编码字串转换成 GB2312 编码字串

// 注意将此文件存盘成 utf-8 编码格式文件再测试    

代码语言:javascript
复制
header("content-Type: text/html; charset=gb2312");      
echo mb_convert_encoding("你是我的好朋友", "gb312", "utf-8");   

  3、对整个页面进行转换

       该方法适用所有编码环境。这样把前128个字符以外(显示字符)的字符集都用 NCR(Numeric character reference,如“汉字”将转换成“汉字”这种形式)来表示,这样的编码在任意编码环境下页面都能正常显示。

       在php文件的头部加上下面三行代码:

代码语言:javascript
复制
mb_internal_encoding("gb2312");   // 这里的gb2312是你网站原来的编码    
mb_http_output("HTML-ENTITIES");    
ob_start('mb_output_handler');  

 使用mb_convert_encoding 函数需启用PHP 的mbstring (multi-byte string)扩展。

  如果没有没有开启php的mbstring扩展,则需要做如下设置,让php支持该扩展。

  1、windows 服务器环境

       编辑 php.ini 文件,将; extension=php_mbstring.dll 前面的 ; 去掉,重启网页服务器。

  2、Linux服务器环境

       在编译配置时加入 –enable-mbstring=cn 编译参数,再进行PHP的编译安装。

另外有一种区别说法是

1、mb_convert_encoding() 该函数会根据内容自动识别编码,但是执行效率比iconv差; 2、然后有一种说法就是iconv()在一些字符转换下会不正常,网上有种说法就是:

发现iconv在转换字符”—”到gb2312时会出错,如果没有ignore参数,所有该字符后面的字符串都无法被保存。

不管怎么样,这个”—”都无法转换成功,无法输出。 另外mb_convert_encoding没有这个bug. 3、mb_convert_encoding()是PHP扩展函数,要开启扩展库才能用;而iconv是PHP内置函数,不需另外开启扩展库就可以使用。 4、一般情况下用 iconv,只有当遇到无法确定原编码是何种编码,或者iconv转化后无法正常显示时才用mb_convert_encoding 函数.

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档