使用BeautifulSoup,我尝试了以下操作:
q =  soup.div.find_all("div", { "id" : "column-left" }, "h2")但这也为我提供了<p>的文本。我只想要一个特定div的子级的h2。
发布于 2016-09-26 19:56:58
如果你使用最新版本的BeautifulSoup (你应该这样做),你可以只使用CSS选择器,这可能更容易编写和维护。例如:
>>> from bs4 import beautifulsoup
>>> soup = BeautifulSoup('<div id=column-left><h2>Header</h2><p>Paragraph</p><h2>Another header</h2><p>Another paragraph</p></div>')
>>> soup.select('div#column-left > h2')
[<h2>Header</h2>, <h2>Another header</h2>]发布于 2016-09-26 19:08:54
为什么要访问soup.div
试试这个:
q =  soup.find('div', { 'id' : 'column-left' }).find_all('h2')此外,find_all还具有可选参数'id',因此您不必编写属性映射
q =  soup.find('div', id='column-left').find_all('h2')https://stackoverflow.com/questions/39701173
复制相似问题