首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Python -如何通过几个Google网站搜索电子邮件地址

Python -如何通过几个Google网站搜索电子邮件地址
EN

Stack Overflow用户
提问于 2022-02-21 13:08:15
回答 1查看 221关注 0票数 0

我试图检索一些不同公司的电子邮件地址在网上搜索。我有一个带有公司名称的Excel文件,我想出了一个小脚本

  1. 将Google上的每一个名称并排搜索到“电子邮件”,然后尝试单击第一个Google结果
  2. 解析该网页,以找到与regex“*@*”匹配的内容。这意味着:在页面中找到包含"string@domainname.domain“(例如info@companyabc.it)的任何内容,
  3. 最终会超出测试,并将其存储在列表中。

不幸的是,当我试图点击谷歌的第一个结果时,我被困在了第一点上。下面是代码:

代码语言:javascript
复制
from selenium import webdriver 
import pandas as pd
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.common.action_chains import ActionChains

g = webdriver.Chrome()
df = pd.read_excel(path)
for i in range(len(df['Company name'])):
      g.get("https://www.google.com/search?q=" + df['Company name'][i] + " email")
      cookies_accept = ActionChains(g)
      cookies_accept.send_keys(Keys.TAB*7).send_keys(Keys.ENTER).perform()
      results = g.find_elements_by_xpath('//*[@id="rso"]/div/div/div/div/div') 
      #this xpath does not work properly with each one of the query results page.

关于如何继续下去有什么提示吗?提亚

EN

回答 1

Stack Overflow用户

发布于 2022-02-21 14:24:02

问题可能是谷歌的结果以不同的格式出现。有些只是显示到主页的链接,另一些则显示几个子页面。下面是一个示例搜索:

#这个xpath不能正常工作于每个查询结果页面。

如果您的方法已经对某些结果有效,那么您就走上了正确的轨道。修复方法可以是查看不同的格式,然后包含一些try except逻辑来检查每种结果格式,即在屏幕截图中为第一个和第二个"Windows“搜索结果包含单独的xpath。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/71206868

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档