文章/答案/技术大牛

发布

社区首页 >问答首页 >PHP混合UTF-8编码读取CSV

问PHP混合UTF-8编码读取CSV
EN

Stack Overflow用户

提问于 2013-10-12 12:46:34

回答 1查看 1.4K关注 0票数 1

我有一个问题，我认为谷歌很容易，但似乎没有那么容易。好吧，我的问题是：

我必须读取一个CSV文件，其中有一个坏的和不同的编码。我无法手动更正CSV文件，所以我必须在我的应用程序中处理它。因此CSV文件可以有以下编码：

‘5’和‘M’在同一个文件中放置了belmarkt‘。

如果我解码(utf8_decode)，右边的是正确的，左边的是正确的(这是正确的)。当我试图找出编码(mb_detect_encoding)，我总是得到的答案是，这是UTF-8。

我仍然尝试了以下解决方案：

public function convert( $str ) {
    return iconv( "Windows-1252", "UTF-8", $str );
}

和

private function getUmlauteArray() { 
    return array( 'Ã¼'=>'ü', 'Ã¤'=>'ä', 'Ã¶'=>'ö', 'Ã–'=>'Ö', 'ÃŸ'=>'ß', 'Ã '=>'à', 'Ã¡'=>'á', 'Ã¢'=>'â', 'Ã£'=>'ã', 'Ã¹'=>'ù', 'Ãº'=>'ú', 'Ã»'=>'û', 'Ã™'=>'Ù', 'Ãš'=>'Ú', 'Ã›'=>'Û', 'Ãœ'=>'Ü', 'Ã²'=>'ò', 'Ã³'=>'ó', 'Ã´'=>'ô', 'Ã¨'=>'è', 'Ã©'=>'é', 'Ãª'=>'ê', 'Ã«'=>'ë', 'Ã€'=>'À', 'Ã'=>'Á', 'Ã‚'=>'Â', 'Ãƒ'=>'Ã', 'Ã„'=>'Ä', 'Ã…'=>'Å', 'Ã‡'=>'Ç', 'Ãˆ'=>'È', 'Ã‰'=>'É', 'ÃŠ'=>'Ê', 'Ã‹'=>'Ë', 'ÃŒ'=>'Ì', 'Ã'=>'Í', 'ÃŽ'=>'Î', 'Ã'=>'Ï', 'Ã‘'=>'Ñ', 'Ã’'=>'Ò', 'Ã“'=>'Ó', 'Ã”'=>'Ô', 'Ã•'=>'Õ', 'Ã˜'=>'Ø', 'Ã¥'=>'å', 'Ã¦'=>'æ', 'Ã§'=>'ç', 'Ã¬'=>'ì', 'Ã'=>'í', 'Ã®'=>'î', 'Ã¯'=>'ï', 'Ã°'=>'ð', 'Ã±'=>'ñ', 'Ãµ'=>'õ', 'Ã¸'=>'ø', 'Ã½'=>'ý', 'Ã¿'=>'ÿ', 'â‚¬'=>'€' );
}

public function fixeUmlaute($string) {                  
    $umlaute = $this->getUmlauteArray();
    foreach ($umlaute as $key => $value){
        $value = str_replace($key, $value, $string);
    } 
    return $string;
}

和

function valid_utf8( $string ){
    return !((bool)preg_match('~[\xF5\xF6\xF7\xF8\xF9\xFA\xFB\xFC\xFD\xFE\xFF\xC0\xC1]~ms',$string));
}

这些都是我在谷歌搜索中找到的改变编码的解决方案.(也许这个“集合”可以帮助其他人.)那么，我如何才能真正发现错误的字符，或者我的错误在哪里呢？

有人能给我个提示吗？

格列茨

encoding

utf-8

php

csv

回答 1

Stack Overflow用户

发布于 2013-10-12 13:56:43

有一个不错的PHP类可以帮助您：https://github.com/neitanod/forceutf8 --它将将任何字符集转换为UTF8，并为您处理检测。希望能帮上忙。

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/19334340

复制

相似问题

问PHP混合UTF-8编码读取CSV
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问PHP混合UTF-8编码读取CSVEN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问PHP混合UTF-8编码读取CSV
EN