首页
学习
活动
专区
工具
TVP
发布
社区首页 >问答首页 >如何在PHP中解析和处理HTML/XML?

如何在PHP中解析和处理HTML/XML?
EN

Stack Overflow用户
提问于 2018-01-18 00:24:04
回答 2查看 0关注 0票数 0

如何解析HTML/XML并从中提取信息?

EN

回答 2

Stack Overflow用户

发布于 2018-01-18 08:43:28

原生XML扩展

更喜欢使用原生XML扩展

DOM

DOM扩展允许您使用PHP 5通过DOMAPI对XML文档进行操作。它是W3C的文档对象模型核心级别3的实现,这是一个平台和语言无关的接口,允许程序和脚本动态访问和更新文档的内容、结构和样式。

XMLReader

XMLReader扩展是一个XML解析器。

XML分析器

这个扩展允许创建XML解析器,然后为不同的XML事件定义处理程序。每个XML解析器都有一些可以调整的参数。

SimpleXml

SimpleXML扩展提供了一个非常简单和易于使用的工具集,可以将XML转换为可以使用常规属性选择器和数组迭代器处理的对象。

票数 0
EN

Stack Overflow用户

发布于 2018-01-18 09:24:32

如何获得HTML元素:

代码语言:javascript
复制
// Create DOM from URL or file
$html = file_get_html('http://www.example.com/');

// Find all images
foreach($html->find('img') as $element)
       echo $element->src . '<br>';

// Find all links
foreach($html->find('a') as $element)
       echo $element->href . '<br>';

如何修改HTML元素:

代码语言:javascript
复制
// Create DOM from string
$html = str_get_html('<div id="hello">Hello</div><div id="world">World</div>');

$html->find('div', 1)->class = 'bar';

$html->find('div[id=hello]', 0)->innertext = 'foo';

echo $html;

从HTML中提取内容:

代码语言:javascript
复制
// Dump contents (without tags) from HTML
echo file_get_html('http://www.google.com/')->plaintext;

Scraping Slashdot:

代码语言:javascript
复制
// Create DOM from URL
$html = file_get_html('http://slashdot.org/');

// Find all article blocks
foreach($html->find('div.article') as $article) {
    $item['title']     = $article->find('div.title', 0)->plaintext;
    $item['intro']    = $article->find('div.intro', 0)->plaintext;
    $item['details'] = $article->find('div.details', 0)->plaintext;
    $articles[] = $item;
}

print_r($articles);
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/-100003158

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档