前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >使用selenium爬取京东商品信息

使用selenium爬取京东商品信息

作者头像
北山啦
发布2022-11-27 11:09:47
3930
发布2022-11-27 11:09:47
举报
文章被收录于专栏:北山啦的博客北山啦的博客

任务要求: 用selenium爬取京东商城某一款华为手机的评论,要求至少爬取2000条用户名和用户评论,网址为https://www.jd.com/,将这些信息存入Excel文件中,文件后缀为.csv。将ipynb文件和后缀为.csv的文件压缩打包

在这里插入图片描述
在这里插入图片描述

通过博客对selenium的简单介绍,现在开始实战啦,没有看过的,可以先看看

直接上代码

代码语言:javascript
复制
"""
Created on Thu Dec 10 14:15:14 2020

@author: kun
"""
from selenium import webdriver
import pandas as pd
from time import sleep
from random import uniform

driver = webdriver.Chrome(r'M:\chromedriver.exe')
driver.maximize_window()
driver.get("https://www.jd.com/")
driver.implicitly_wait(10)
name,price = [],[]
driver.execute_script("window.scrollTo(0,document.body.scrollHeight)")  
def get_info(thing):
    driver.find_element_by_xpath('//*[@id="key"]').send_keys(thing)
    driver.find_element_by_xpath('//*[@id="search"]/div/div[2]/button').click()
    sleep(uniform(2,3))
    driver.execute_script("window.scrollTo(0,document.body.scrollHeight)")  
    sleep(uniform(2,3))
    try:
        for i in driver.find_elements_by_css_selector('ul[class="gl-warp clearfix"]>li>div>div>a>em'):
            if len(i.text)!=0:
                name.append(i.text)
        for i in driver.find_elements_by_css_selector('ul[class="gl-warp clearfix"]>li>div[class="gl-i-wrap"]>div[class="p-price"]>strong'):
            if len(i.text)!=0:
                price.append(i.text)
    except:
        pass
    """实现翻页"""
    if driver.page_source.find("pn-next disabled") == -1:
        driver.find_element_by_class_name("pn-next").click()

if __name__ == "__main__":
    get_info("5G手机")
    data = pd.DataFrame({'name':name,'price':price})
    data.to_excel("jd.xlsx",index=False)

结果如下:

在这里插入图片描述
在这里插入图片描述

当然大家也可以根据自己的需求爬取自己的内容即可,本文仅仅起到抛砖引玉的作用啦。

在这里插入图片描述
在这里插入图片描述

到这里就结束了,如果对你有帮助你,欢迎点赞关注,你的点赞对我很重要

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2020-12-21,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
文件存储
文件存储(Cloud File Storage,CFS)为您提供安全可靠、可扩展的共享文件存储服务。文件存储可与腾讯云服务器、容器服务、批量计算等服务搭配使用,为多个计算节点提供容量和性能可弹性扩展的高性能共享存储。腾讯云文件存储的管理界面简单、易使用,可实现对现有应用的无缝集成;按实际用量付费,为您节约成本,简化 IT 运维工作。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档