我们将基于HTML的文档转换为书籍形式。输入的HTML通常由许多换行符和缩进的行组成,因此它在普通文本编辑器中是人类可读的。这种缩进的行主要由空格组成。浏览器通常会忽略这些空格。</p>将被完全忽略,文本看起来就像HTML代码一样:
<p>This is a text with two lines<br>and this is<
当我用NSXMLParser解析html文件时。我无法避免html文件中的空格。例如<html> <body><p>sample text.This is sample text </p></body></html>
在found characters函数中,我也得到了空格。我不想要html标签中的空格。但我需要p标记中的空