前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >iOS中解码.txt文件在UIWebView出现中文乱码的问题

iOS中解码.txt文件在UIWebView出现中文乱码的问题

作者头像
rectinajh
发布2018-05-17 16:01:36
3.2K0
发布2018-05-17 16:01:36
举报

1,什么是gbk和utf-8编码? 2,GBK与UTF-8的区别?

1,GBK的文字编码是双字节来表示的,即不论中、英文字符均使用双字节来表示,只不过为区分中文,将其最高位都定成1。

至于UTF-8编码则是用以解决国际上字符的一种多字节编码,它对英文使用8位(即一个字节),中文使用24位(三个字节)来编码。对于英文字符较多的论坛则用UTF-8节省空间。

2,GBK包含全部中文字符; UTF8是国际编码,它的通用性比较好,UTF-8则包含全世界所有国家需要用到的字符。 GBK是国家编码,通用性比UTF8差,不过UTF8占用的数据库比GBK大~

GB2312是GBK的子集,GBK是GB18030的子集 GBK是包括中日韩字符的大字符集合 支持就能正常观看你的文字而不会出现乱码。

用UIWebview打开txt文件有时候会出现乱码的情况,这种情况应该是txt的编码问题,解决方案如下:

webview打开网页有这三个方法:

代码语言:javascript
复制
- (void)loadRequest:(NSURLRequest *)request;
- (void)loadHTMLString:(NSString *)string baseURL:(NSURL *)baseURL;
- (void)loadData:(NSData *)data MIMEType:(NSString *)MIMEType textEncodingName:(NSString *)textEncodingName baseURL:(NSURL *)baseURL;

baseUrl是什么? 也就是data中有一些链接是图片,css都是外部文件,然后这些文件需要到一个目录上去找。baseUrl就是这个目录。

1,设置baseUrl NSArray *paths = NSSearchPathForDirectoriesInDomains(NSDocumentDirectory, NSUserDomainMask, YES); NSString *documentsDir = [paths objectAtIndex:0] ; //根据自己的具体情况设置,我的html文件在document目录,链接也是在这个目录上开始 NSURL *baseUrl = [NSURL fileURLWithPath:documentsDir];

2,MIMEType的黑魔法? 既文件的指定类型。

UTI和MIME的概念

uti.png

同一类型标识符(Uniform Type Identifier,UTI)代表IOS信息共享的中心组件。可以把它看成下一代的MIME类型。UTI是标识资源类型(比如图像和文本)的字符串,他们制定哪些类型的信息将用于公共数据对象,他们不需要依赖于老式的指示符,比如文件扩展名,MIME类型,或者文件类型的元数据。

MIME(Multipurpose Internet Mail Extensions)多用途互联网邮件扩展类型。是设定某种扩展名的文件用一种应用程序来打开的方式类型,当该扩展名文件被访问的时候,浏览器会自动使用指定应用程序来打开。多用于指定一些客户端自定义的文件名,以及一些媒体文件打开方式。

代码语言:javascript
复制
  //后缀名字符串转化为UTI字符串
   CFStringRef UTI =         UTTypeCreatePreferredIdentifierForTag(kUTTagClassFilenameExtension, fileExtension, NULL);

  //使用UITypeCopyPreferredTagWithClass(),是UTI字符串转化为后缀扩展名,这里是转换UTI字符串转化为MIME类型
   CFStringRefmimeType = UTTypeCopyPreferredTagWithClass(UTI, kUTTagClassMIMEType);

  //释放
            CFRelease(UTI);
            CFBridgingRelease(mimeType);

3,编码类型(textEncodingName) @"GBK" 既gbk编码方式 @"utf-8" 既utf-8编码方式

前两种方法实现中文解码如下: - (void)loadRequest:(NSURLRequest *)request; - (void)loadHTMLString:(NSString *)string baseURL:(NSURL *)baseURL;

txt分带编码和不带编码两种,带编码的如UTF-8格式txt,不带编码的如ANSI格式txt。带编码的用NSString的stringWithContentsOfFile可读出,不带的,我们依次尝试GBK和GB18030编码。

代码语言:javascript
复制
          NSStringEncoding *useEncoding = nil;
          NSString *urlString = [NSString stringWithContentsOfFile:[self.file fileDataLocalPath] encoding:useEncoding error:nil];

  //按gbk的方式解码;
          if (urlString) {
          urlString = [NSString stringWithContentsOfFile:[self.file fileDataLocalPath] encoding:0x80000632 error:nil];
}  
    if (urlString) {
    //将解码的贴到webview上
          [self.previewWebView loadHTMLString:urlString baseURL:nil];
} else {
    //如果gbk解码不成功,尝试utf-8解码,NSUTF8StringEncoding
          urlString = [urlString stringByAddingPercentEscapesUsingEncoding:0x80000632];
          NSURL *requesurl = [NSURL URLWithString:urlString];
          NSURLRequest *request = [NSURLRequest requestWithURL:requesurl];
    //用第一种方式加载
          [self.previewWebView loadRequest:request];
}


            第三种方式:
                //同一类型标识符
        CFStringRef UTI =   UTTypeCreatePreferredIdentifierForTag(kUTTagClassFilenameExtension, fileExtension, NULL);
        CFStringRef mimeType = UTTypeCopyPreferredTagWithClass(UTI, kUTTagClassMIMEType);
        CFRelease(UTI);
        CFBridgingRelease(mimeType);

          //GBK解码
          [self.previewWebView loadData:previewData MIMEType:(__bridge NSString *)(mimeType) textEncodingName:@"GBK" baseURL:nil];

iOS中utf-8国际通用编码有时会出现乱码情况,用gbk国家编码可以很好支持中文编码。 如果应用在国内gbk编码的方式基本通用,但是国外受环境限制易造成乱码,utf全球通用有时会出现本地支持不好情况;

出现乱码的原因在于使用编码的不同环节之间支持的编码不一样。

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2016.07.05 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档