我正在使用mechanize for python,并且我正在尝试在kijiji中搜索一个项目。最终,我的目标是让我的程序搜索一个项目,然后通过美汤检查是否有人为我的搜索词发布了新的广告,方法是搜索来自输入搜索词的html源,如果有新的广告出现,就给我发电子邮件,这样我就可以成为第一个响应的人。下面是我的代码,但我得到了一个错误
在我的后端,我使用selenium检索给定url的页面源代码。我想遍历page_source并禁用其href不在列表中的所有链接。html.parser') if not (link['href'] in link_list):
link['href']="" 我刚接触美汤,所以我不确定它的语法。我用的是美</e
我正在抓取一系列非常平坦的网页,对我来说最重要的结构是,我希望找到在具有已知id的h2元素之后出现的所有元素。我想在这个h2元素之后找到的元素是p、blockquote和center。在定位这些元素时,排序是很重要的,需要加以保留。我还应该说,所有感兴趣的因素都是兄弟姐妹,在同一组织层面上,就在另一个组织层面上。我该怎么做?以下是我尝试过的:# here is the title
h =