我使用PHP语言的DOMDocument来解析和规范化用户提交的超文本标记语言,使用loadHTML
方法来解析内容,然后通过saveHTML
获得格式良好的结果
$dom= new DOMDocument();
$dom->loadHTML('<div><p>Hello World');
$well_formed= $dom->saveHTML();
echo($well_formed);
这很好地解析了片段并添加了适当的结束标记。问题是我也得到了一堆我不想要的标签,比如<!DOCTYPE>
、<html>
、<head>
和<body>
。我知道每个格式良好的HTML文档都需要这些标记,但是我正在规范化的HTML片段将被插入到现有的有效文档中。
https://stackoverflow.com/questions/2345670
复制相似问题