我正在使用Python和Selenium来捕获网页的HTML源代码,这样我就可以解析它来找到特定的元素。然而,源代码与我在使用浏览器的“inspect element”视图时得到的不同。我正在寻找的元素不在Selenium提供的源代码中。有没有办法使用Selenium或使用其他工具或方法来获得相同的源代码?
发布于 2019-04-21 19:04:37
正如selenium Documentation中所描述的:
getPageSource
java.lang.String getPageSource()
获取上次加载的页面的源代码。如果页面在加载后被修改(例如,通过Javascript),则不能保证返回的文本是修改后的页面的文本。请查阅正在使用的特定驱动程序的文档,以确定返回的文本是反映页面的当前状态还是web服务器上次发送的文本。返回的页面源代码是底层DOM的表示:不要期望它以与从web服务器发送的响应相同的方式进行格式化或转义。把它想象成一个艺术家的印象。返回:当前页面的源
https://stackoverflow.com/questions/55781178
复制相似问题