如何获得一个html标签里面的所有内容?
from bs4 import BeautifulSoup
content = "<a><b>scgvggvd</b></a>"
soup = BeautifulSoup(content, 'html.parser')
matched_list = soup.find('a')
print(matched_list)
上面的代码将返回:
<a><b>scgvggvd</b></a>
我想要的是:
<b>scgvggvd</b>
找到标记<a>
后将其删除
我希望这个解决方案也能与find_all()一起使用
发布于 2018-09-27 07:03:54
如果<b>
标记是<a>
标记的同级标记,请使用以下行:
matched_list = soup.select_one('b')
如果<b>
标记是<a>
标记的子级,请使用以下行:
matched_list = soup.select_one('a b')
如果需要多次点击,请使用select
而不是select_one
。
发布于 2018-09-27 03:56:41
from bs4 import BeautifulSoup
content = "<a><b>scgvggvd</b></a>"
soup = BeautifulSoup(content, 'html.parser')
matched_list = soup.find('a')
for b in matched_list:
print(b)
https://stackoverflow.com/questions/52512355
复制相似问题