我在python中使用lxml实现来进行和XML解析。设置一个解析器,如
parser = lxml.etree.HTMLParser()
并从HTML源返回一棵树(字符串)
tree = lxml.etree.fromstring(html, parser).getroottree() # Returns a XML tree
根据lxml文档,这应该返回DOM树(XML)
我想找到某些元素的标签,如"a","div","span“等。
如何使用所有可能的元素的标记名获取XPath?
编辑:我实际上正在开发一个AJAX爬虫,所以我需要Selenium来
我正在努力学习美汤。我使用下面的网址来学习。
当我尝试运行代码时,我得到下面的错误。
FileNotFoundError: [Errno 2] No such file or directory: 'what_is_beautiful_soup_in_python-Google_Search.html'
Python模块和HTML文件都保存在同一个文件夹中。文件名= what_is_beautiful_soup_in_python-Google_Search谁能帮我解决这个问题?
from bs4 import BeautifulSoup
soup = BeautifulSo