前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >python_selenium智联搜索

python_selenium智联搜索

作者头像
机器学习和大数据挖掘
发布2019-07-02 09:30:58
4730
发布2019-07-02 09:30:58
举报
文章被收录于专栏:数据挖掘数据挖掘

python_selenium智联搜索

去招聘会工作,奈何网上仅仅提供招聘会的公司名字,没有提供招聘的职位,SO我写了个小代码给别人在智联上面搜索职位,由于时间紧迫,前程的就不写了

代码语言:javascript
复制
#!/usr/bin/python3.4
# -*- coding: utf-8 -*-

from selenium import webdriver
from lxml import etree
import time


# 打开浏览器
def openbrowser(keyword):
    global browser

    # 打开谷歌浏览器
    # Firefox()
    # Chrome()
    # browser = webdriver.Chrome()

    options = webdriver.ChromeOptions()
    prefs = {
        'profile.default_content_setting_values': {
            'images': 2
        }
    }
    options.add_experimental_option('prefs', prefs)
    browser = webdriver.Chrome(chrome_options=options)
    try:
        browser.find_element_by_id("KeyWord_kw2").send_keys(keyword)
        browser.find_element_by_class_name("doSearch").click()

        time.sleep(5)
        htmlcontent = browser.page_source

        browser.quit()
    except:

        url = "http://www.zhaopin.com/"
        browser.get(url)
        # 打开浏览器时间
        # print("等待10秒打开浏览器...")
        # time.sleep(10)
        browser.find_element_by_id("KeyWord_kw2").send_keys(keyword)
        browser.find_element_by_class_name("doSearch").click()

        time.sleep(5)
        htmlcontent = browser.page_source
        browser.quit()

    return htmlcontent


def analyzehtml(html):
    info = []
    page = etree.HTML(html.lower())
    hrefs = page.xpath('//a[@style="font-weight: bold"]/text()')
    for href in hrefs:
        info.append(href)

    return info


if __name__ == "__main__":
    file = open("../txt/company.txt")
    companys = file.readlines()
    for keyword in companys:
        print(keyword.strip())
        html = openbrowser(keyword.strip())
        a = analyzehtml(html)
        a.insert(0, str(keyword.strip()))
        print(a)
        b = "&&".join(a)
        if len(b)==0:
            b = "智联没有找到该公司"
        
        filewrite = open("../txt/qwe.txt", "a")
        filewrite.write("\n" + str(b))
        filewrite.close()
本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2016-12-05 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • python_selenium智联搜索
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档