它看起来很简单,但我没有发现错误,我现在已经在上面花了几个小时:
from bs4 import BeautifulSoup
txt = "<HTML><BODY><TABLE><TR><TD><P>Net sales</P></TD></TR></TABLE></BODY></HTML>"
print(txt)
bs = BeautifulSoup(txt, 'html.parser')
q = bs.find(tag='p', text='Net sales')
# table = q.find_parent('table')
print("q = ", q)
这导致(在Jupyter中)
<HTML><BODY><TABLE><TR><TD><P>Net sales</P></TD></TR></TABLE></BODY></HTML>
q = None
为什么找不到“净销售额”这一文本?
最后,我想要获取table-tag中的文本,我只是在上面的代码中注释了这一行。
发布于 2018-05-31 17:03:50
尝试不使用'tag‘参数
Ex:
from bs4 import BeautifulSoup
txt = "<HTML><BODY><TABLE><TR><TD><P>Net sales</P></TD></TR></TABLE></BODY></HTML>"
bs = BeautifulSoup(txt, 'html.parser')
print bs
q = bs.find('p', text='Net sales')
# table = q.find_parent('table')
print("q = ", q)
输出:
('q = ', <p>Net sales</p>)
https://stackoverflow.com/questions/50620302
复制相似问题