") # <html <head </head <body <a <p </p </a </body </html
html5lib库没有忽略掉</p 标签,而是自动补全了标签,还给文档树添加了...</p 标签,与html5lib库不同的是标准库没有尝试创建符合标准的文档格式或将文档片段包含在<body 标签内,与lxml不同的是标准库甚至连<html 标签都没有尝试去添加....获取子孙结点:
soup.标签.descendants【返回值也是一个可迭代对象,实际子结点需要迭代】
获取父结点:
soup.标签.parent
获取祖先结点[父结点,祖父结点,曾祖父结点…]:...,但只返回第一个符合条件的结果】
find_all( name , attrs , recursive , text , **kwargs ):【根据参数来找出对应的标签,但只返回所有符合条件的结果】...')
sp1=soup.select('span')#返回结果是一个列表,列表的元素是bs4元素标签对象
print(soup.select("#i2"),end='\n\n')
print(soup.select