iOS中解码.txt文件在UIWebView出现中文乱码的问题

1,什么是gbk和utf-8编码? 2,GBK与UTF-8的区别?

1,GBK的文字编码是双字节来表示的,即不论中、英文字符均使用双字节来表示,只不过为区分中文,将其最高位都定成1。

至于UTF-8编码则是用以解决国际上字符的一种多字节编码,它对英文使用8位(即一个字节),中文使用24位(三个字节)来编码。对于英文字符较多的论坛则用UTF-8节省空间。

2,GBK包含全部中文字符; UTF8是国际编码,它的通用性比较好,UTF-8则包含全世界所有国家需要用到的字符。 GBK是国家编码,通用性比UTF8差,不过UTF8占用的数据库比GBK大~

GB2312是GBK的子集,GBK是GB18030的子集 GBK是包括中日韩字符的大字符集合 支持就能正常观看你的文字而不会出现乱码。

用UIWebview打开txt文件有时候会出现乱码的情况,这种情况应该是txt的编码问题,解决方案如下:

webview打开网页有这三个方法:

- (void)loadRequest:(NSURLRequest *)request;
- (void)loadHTMLString:(NSString *)string baseURL:(NSURL *)baseURL;
- (void)loadData:(NSData *)data MIMEType:(NSString *)MIMEType textEncodingName:(NSString *)textEncodingName baseURL:(NSURL *)baseURL;

baseUrl是什么? 也就是data中有一些链接是图片,css都是外部文件,然后这些文件需要到一个目录上去找。baseUrl就是这个目录。

1,设置baseUrl NSArray *paths = NSSearchPathForDirectoriesInDomains(NSDocumentDirectory, NSUserDomainMask, YES); NSString *documentsDir = [paths objectAtIndex:0] ; //根据自己的具体情况设置,我的html文件在document目录,链接也是在这个目录上开始 NSURL *baseUrl = [NSURL fileURLWithPath:documentsDir];

2,MIMEType的黑魔法? 既文件的指定类型。

UTI和MIME的概念

uti.png

同一类型标识符(Uniform Type Identifier,UTI)代表IOS信息共享的中心组件。可以把它看成下一代的MIME类型。UTI是标识资源类型(比如图像和文本)的字符串,他们制定哪些类型的信息将用于公共数据对象,他们不需要依赖于老式的指示符,比如文件扩展名,MIME类型,或者文件类型的元数据。

MIME(Multipurpose Internet Mail Extensions)多用途互联网邮件扩展类型。是设定某种扩展名的文件用一种应用程序来打开的方式类型,当该扩展名文件被访问的时候,浏览器会自动使用指定应用程序来打开。多用于指定一些客户端自定义的文件名,以及一些媒体文件打开方式。

  //后缀名字符串转化为UTI字符串
   CFStringRef UTI =         UTTypeCreatePreferredIdentifierForTag(kUTTagClassFilenameExtension, fileExtension, NULL);

  //使用UITypeCopyPreferredTagWithClass(),是UTI字符串转化为后缀扩展名,这里是转换UTI字符串转化为MIME类型
   CFStringRefmimeType = UTTypeCopyPreferredTagWithClass(UTI, kUTTagClassMIMEType);

  //释放
            CFRelease(UTI);
            CFBridgingRelease(mimeType);

3,编码类型(textEncodingName) @"GBK" 既gbk编码方式 @"utf-8" 既utf-8编码方式

前两种方法实现中文解码如下: - (void)loadRequest:(NSURLRequest *)request; - (void)loadHTMLString:(NSString *)string baseURL:(NSURL *)baseURL;

txt分带编码和不带编码两种,带编码的如UTF-8格式txt,不带编码的如ANSI格式txt。带编码的用NSString的stringWithContentsOfFile可读出,不带的,我们依次尝试GBK和GB18030编码。

          NSStringEncoding *useEncoding = nil;
          NSString *urlString = [NSString stringWithContentsOfFile:[self.file fileDataLocalPath] encoding:useEncoding error:nil];

  //按gbk的方式解码;
          if (urlString) {
          urlString = [NSString stringWithContentsOfFile:[self.file fileDataLocalPath] encoding:0x80000632 error:nil];
}  
    if (urlString) {
    //将解码的贴到webview上
          [self.previewWebView loadHTMLString:urlString baseURL:nil];
} else {
    //如果gbk解码不成功,尝试utf-8解码,NSUTF8StringEncoding
          urlString = [urlString stringByAddingPercentEscapesUsingEncoding:0x80000632];
          NSURL *requesurl = [NSURL URLWithString:urlString];
          NSURLRequest *request = [NSURLRequest requestWithURL:requesurl];
    //用第一种方式加载
          [self.previewWebView loadRequest:request];
}


            第三种方式:
                //同一类型标识符
        CFStringRef UTI =   UTTypeCreatePreferredIdentifierForTag(kUTTagClassFilenameExtension, fileExtension, NULL);
        CFStringRef mimeType = UTTypeCopyPreferredTagWithClass(UTI, kUTTagClassMIMEType);
        CFRelease(UTI);
        CFBridgingRelease(mimeType);

          //GBK解码
          [self.previewWebView loadData:previewData MIMEType:(__bridge NSString *)(mimeType) textEncodingName:@"GBK" baseURL:nil];

iOS中utf-8国际通用编码有时会出现乱码情况,用gbk国家编码可以很好支持中文编码。 如果应用在国内gbk编码的方式基本通用,但是国外受环境限制易造成乱码,utf全球通用有时会出现本地支持不好情况;

出现乱码的原因在于使用编码的不同环节之间支持的编码不一样。

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏奔跑的蛙牛技术博客

并发知识5

锁和条件不能解决线程中的所有问题 账户1:200; 账户2:300; 线程1:从账户1转移300到账户2 线程2: 从账户2转移400到账户1 线程一和线...

982
来自专栏函数式编程语言及工具

Akka(6): become/unbecome:运算行为切换

   通过一段时间的学习了解,加深了一些对Akka的认识,特别是对于Akka在实际编程中的用途方面。我的想法,或者我希望利用Akka来达到的目的是这样的:作为传...

2969
来自专栏Java学习网

Java Web Response对象的27个方法及状态码

response表示HttpServletResponse对象,主要将JSP容器处理后的结果传回到客户端。 ? 网络配图 1、void addCookie(...

4297
来自专栏一英里广度一英寸深度的学习

分享某行软件开发中心的两道python笔试题

此段程序运行报错,UnboundLocalError: local variable 'x' referenced before assignment 应采用...

1302
来自专栏游戏杂谈

使用phpexcel操作excel

使用这个组件最让我郁闷的是,它对sheet的名称为中文的不进行处理,暂时还没仔细去查原因。

2992
来自专栏MelonTeam专栏

What's New in LLVM 9

导语 :这绝不仅仅是一篇 WWDC 2017 Session 411 学习笔记。除了有关 LLVM 9.0 的新特性之外,还有关于静态分析器和 Clang 5 ...

32310
来自专栏ShaoYL

iOS - - JSON 和 XML解析

4838
来自专栏MasiMaro 的技术博文

ATL模板库中的OLEDB与ADO

上次将OLEDB的所有内容基本上都说完了,从之前的示例上来看OLEDB中有许多变量的定义,什么结果集对象、session对象、命令对象,还有各种缓冲等等,总体上...

1362
来自专栏一个番茄说

让你在WebView中用JS调Native Object

之所做这个东西,源于之前项目中需要把一些页面用webView来呈现,但是web中需要调用native的方法,比如获取本地存的某些数据、调用摄像头等等,这里也就是...

1083
来自专栏安恒网络空间安全讲武堂

nox&CSAW部分pwn题解

暑假的时候遇到了一群一起学习安全的小伙伴,在他们的诱劝下,开始接触国外的CTF比赛,作为最菜的pwn选手就试着先打两场比赛试试水,结果发现国外比赛真有意思哎嘿。

1893

扫码关注云+社区

领取腾讯云代金券