我正试图在即将到来的世界巴西柔道锦标赛中,使用Python和Beautiful为每一个部门争取注册人数。(最终的目标是画出每个部门竞争对手的数量,因此每个注册人的名字并不重要。)我可以使用BeautifulSoup提取我想要的一些信息,但我似乎无法完全分离出我想要的信息。首先,我尝试使用从另一个StackOverflow问题中提取的命令来提取整个表:
result
我使用Python3和BeautifulSoup 4.4.0从网站中提取数据。我对div标记中的表感兴趣,但是要知道表中有什么数据,我必须获取h4标记的文本,然后得到同级表,也就是表。问题是,其中一个h4标记有span,当字符串中有另一个标记时,BeautifulSoup将不返回任何字符串值。以外的所有<h4>Unique Title 2<span>(<a href=&