我有一个有“一个类”链接的页面源,如下例所示。我想返回一个包含所有“href”值的列表,所以在下面的"/detail/Request-Technology%2C-LLC-Oakland-CA-94609/napil006/cyberMan”.示例中,我使用了漂亮的汤,find_all试图使用‘a class’属性,但是它什么也不返回。handleBackButton(this);" style="font-size:18px;" title=“stuff” va
这将返回带有'href‘标签的所有内容,而我想要过滤'Report I want name dddddddd’上的文件。我试过使用正则表达式,例如'href=\s\w+‘,但没有用,因为它没有返回任何结果。任何帮助我们都将不胜感激import urllib
webpage=("http://www.example.com&quo