网页解析器能区分网页上的静态文本和动态文本吗?例如,网页上有一个字符串。
你好“神奇四人”
在这个"Hello“中是一个静态数据,而”荒诞四“是一个动态数据(例如,从数据库值中填充)。
web解析器是否能够检测哪些是静态和动态的内容?
发布于 2009-06-26 08:45:15
我认为这是不可能的。客户端无法了解服务器中正在执行的代码,因此无法知道文本是由PHP、ASP或任何其他语言生成的.甚至是静态的。
发布于 2009-06-26 09:00:19
您可以查看URL和HTTP头,以便对文件是否静态地(直接从文件系统)或生成进行猜测。然而,大多数“网页解析器”没有得到这些信息,而且几乎所有生成的页面都有静态位。(有时这些内容直接包含在源代码中,也可能来自模板或SSI文件。)区分那些静态的比特和其他的是不可能的。
https://stackoverflow.com/questions/1048040
复制相似问题