文章/答案/技术大牛

发布

社区首页 >问答首页 >所有的-美丽的汤-巨蟒不能正常工作。

问所有的-美丽的汤-巨蟒不能正常工作。
EN

Stack Overflow用户

提问于 2018-12-12 12:41:21

回答 1查看 51关注 0票数 3

当我使用findAll函数时，我遇到了一个问题。findAll函数不能正常工作，不能区分<td>标签的末尾或找不到</td>。它将所有的html代码放入我定义的t1变量中。有人能帮忙吗？我把它的输出放在这里。

t1 = soup.findAll('td',{'data': 'Text:'})
print('( Text:   ',t1.text,' )')

输出：

( Text:    helloworld  * , hello:  * . hiii * ;hello * ; </td>
      <td id="dtt" datetime="2018-12-06T19:08:56Z" data="Summary:">world hello</td>
      </tr>

如果它工作正常，它应该给我们这个输出。

( Text:    helloworld  * , hello:  * . hiii * ;hello * ;  )

另外，我应该注意到，这对于任何其他<td>都是正确的，但是仅仅对于这个<td>，我就有问题了。我认为*、;或最后的空间有一些错误。你的意见是什么？

python

python-3.x

beautifulsoup

Stack Overflow用户

回答已采纳

发布于 2018-12-12 14:19:46

您可以使用以下方法从脏输入中获得更清晰的解析结果：

    soup = bs4.BeautifulSoup(html, 'lxml-xml')

票数 2

查看全部 1 条回答

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/53743263

复制

相似问题

问所有的-美丽的汤-巨蟒不能正常工作。
EN

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问所有的-美丽的汤-巨蟒不能正常工作。EN

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问所有的-美丽的汤-巨蟒不能正常工作。
EN