前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >如何使用Objective-C解析HTML和XML

如何使用Objective-C解析HTML和XML

作者头像
EltonZheng
发布2021-01-22 07:55:55
1.5K0
发布2021-01-22 07:55:55
举报
文章被收录于专栏:Elton的技术分享博客

使用Objective-C解析HTML或者XML,系统自带有两种方式一个是通过libxml,一个是通过NSXMLParser。不过这两种方式都需要自己写很多编码来处理抓取下来的内容,而且不是很直观。

有一个比较好的类库hpple,它是一个轻量级的包装框架,可以很好的解决这个问题。它是用XPath来定位和解析HTML或者XML。

安装步骤: -加入 libxml2 到你的项目中 Menu Project->Edit Project Settings 搜索 “Header Search Paths” 添加新的 search path “${SDKROOT}/usr/include/libxml2” Enable recursive option

-加入 libxml2 library 到你的项目 Menu Project->Edit Project Settings 搜索 “Other Linker Flags” 添加新的 search flag “-lxml2”

-将下面hpple的源代码加入到你的项目中: HTFpple.h HTFpple.m HTFppleElement.h HTFppleElement.m XPathQuery.h XPathQuery.m

-XPath学习地址http://www.w3schools.com/XPath/default.asp

示例代码:

代码语言:javascript
复制
#import "TFHpple.h"

NSData *data = [[NSData alloc] initWithContentsOfFile:@"example.html"];

// Create parser
xpathParser = [[TFHpple alloc] initWithHTMLData:data];

//Get all the cells of the 2nd row of the 3rd table 
NSArray *elements  = [xpathParser search:@"//table[3]/tr[2]/td"];

// Access the first cell
TFHppleElement *element = [elements objectAtIndex:0];

// Get the text within the cell tag
NSString *content = [element content];  

[xpathParser release];
[data release];

另外,还有一个类似的解决方案可以参考 ElementParser http://github.com/Objective3/ElementParser


本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档