前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >监控商品库存方法之一——Selenium

监控商品库存方法之一——Selenium

作者头像
偶尔敲代码
发布2023-04-28 10:27:04
7760
发布2023-04-28 10:27:04
举报
文章被收录于专栏:偶尔敲代码偶尔敲代码

日常遇到一些商品比较抢手的情况,经常无库存。所以总希望能够监控它的库存,并在有库存的时候进行提醒。那以某伊份为例,尝试基于Python的Selenium模块的监控方法。

01

什么是Selenium

Selenium是一个用于Web应用程序测试的工具。Selenium测试直接运行在浏览器中,就像真正的用户在操作一样。支持的浏览器包括IE(7, 8, 9, 10, 11),Mozilla Firefox,Safari,Google Chrome,Opera,Edge等。这个工具的主要功能包括:测试与浏览器的兼容性——测试应用程序看是否能够很好得工作在不同浏览器和操作系统之上。测试系统功能——创建回归测试检验软件功能和用户需求。支持自动录制动作和自动生成.Net、Java、Perl等不同语言的测试脚本。

Selenium框架底层是使用JavaScript模拟真实用户对浏览器进行操作。测试脚本执行时,浏览器自动按照脚本代码做出点击,输入,打开,验证等操作,就像真实用户所做的一样,从终端用户的角度测试应用程序。使用简单,可使用Java,Python等多种语言编写用例脚本,使浏览器兼容性测试自动化成为可能,尽管在不同的浏览器上依然有细微的差别。

Selenium优点:模拟真实用户对浏览器进行操作。

Selenium缺点:啰嗦,一步错,步步错,需要加各种条件约束。

02

步骤及分析

2.1 提取商品链接地址

首先需要找到商品的链接地址,毕竟要用浏览器去访问。某伊份虽然是app端,但也可以通过各种分享的骚操作拿到地址。

2.2 分析商品详情页中的关键词

比如库存数量,售罄等字眼,及其所在的元素位置。再复制出相应的选择器路径或xpath等,看个人喜好。

如这个的“已售罄”提示文本的xpath路径是:

代码语言:javascript
复制
//*[@id="app"]/div[2]/div/div[2]/ul/li[1]/div[1]/div[2]/span[2]

2.3 整理思路及步骤

这次要监控3个商品,思路如下:

打开页面→设定监控间隔→切换页面→刷新→获取关键词→切换页面→刷新→获取关键词→...→有货通知

2.4 其余补充

2.4.1 登录cookies暂先手动保存,通过代码置入浏览器中;

2.4.2 可选有头或无头模式,节省资源占用。有头就是看得到浏览器,无头就是看不到,但功能正常运行。

03

效果及代码

3.1 代码:

用push+做推送;

用os模块做简单输入控制,选择有头或无头;

用bro.add_cookie(),将手动抓取的cookies置入浏览器;

用几个变量记录监控到的有货次数,超过6次停止监控。

代码语言:javascript
复制
from selenium.webdriver import ChromeOptions
import time,os,json,requests
from selenium import webdriver
from urllib import parse

p_token= ''#push+

print("开始运行")
options = ChromeOptions()#设置
options.add_argument('--window-size=300,300')#设置窗口大小
h = input('输入1开启无头模式,输入任意内容关闭无头模式:')
if h == "1":
    options.add_argument('--headless')  # 无头模式
    print("启用 无头模式")
else:
    print("关闭 无头模式")
bro = webdriver.Chrome(options= options)#按设置创建浏览器
bro.get("https://m.laiyifen.com/citylife/lifeProDetail?channelSkuUnitId=115812******")#商品1
bro.delete_all_cookies()# 首先清除由于浏览器打开已有的cookies

with open('cookies_1.txt', 'r') as f: #cookies_1.txt在py源码目录下
    cookies_list = json.load(f)# 使用json读取cookies 注意读取的是文件 所以用load而不是loads
    for cookie in cookies_list:
        if isinstance(cookie.get('expiry'), float):
            cookie['expiry'] = int(cookie['expiry'])
        bro.add_cookie(cookie)

bro.get("https://m.laiyifen.com/citylife/lifeProDetail?channelSkuUnitId=115812*****")# 重新发送请求(这步是非常必要的,要不然携带完cookie之后仍然在登录界面)
time.sleep(1)
bro.execute_script('window.open("https://m.laiyifen.com/citylife/lifeProDetail?channelSkuUnitId=11581*****");') #商品2
time.sleep(1)
bro.execute_script('window.open("https://m.laiyifen.com/citylife/lifeProDetail?channelSkuUnitId=11581*******");') #商品3

handles = bro.window_handles #获取标签句柄
n = 1 #循环次数
ddok = 0 #有货次数
yhok = 0 #有货次数
hmok = 0 #有货次数
while True:
    i = 0
    for i in range(3):
        bro.switch_to.window(handles[i])#切换标签,实际标签第一个为0,第二个为2,第三个为1
        bro.refresh()
        #print(i)
        time.sleep(3)
        try:#正常运行下面代码
            r = bro.find_element_by_xpath('''//*[@id="app"]/div[2]/div/div[2]/ul/li[1]/div[1]/div[2]/span[2]''').text
            if r == "已售罄":
                if i == 0:
                    print("dd 已售罄")
                elif i == 1:
                    print("yh 已售罄")
                else:
                    print("hm 已售罄")
            elif str(r).find("库存") != -1:
                if i == 0:
                    ddok = ddok + 1
                    print("dd 有货")
                    if ddok <= 2:
                        t = str(time.time())
                        content = parse.quote_plus(t)  # url编码
                        title = parse.quote_plus('dd 有货')  # url编码
                        requests.get(f'http://www.pushplus.plus/send?token={p_token}&title={title}&content={content}')
                elif i == 1:
                    yhok = yhok + 1
                    print("yh 有货")
                    if yhok <= 2:
                        t = str(time.time())
                        content = parse.quote_plus(t)  # url编码
                        title = parse.quote_plus('yh 有货')  # url编码
                        requests.get(f'http://www.pushplus.plus/send?token={p_token}&title={title}&content={content}')
                else:
                    hmok = hmok + 1
                    print("hm 有货")
                    if hmok <= 2:
                        t = str(time.time())
                        content = parse.quote_plus(t)  # url编码
                        title = parse.quote_plus('hm 有货')  # url编码
                        requests.get(f'http://www.pushplus.plus/send?token={p_token}&title={title}&content={content}')
            else:
                if i == 0:
                    print("dd 已售罄")
                elif i == 1:
                    print("yh 已售罄")
                else:
                    print("hm 已售罄")
        except Exception:# 产生错误时运行的代码,Exception是一个类
            print('异常,未获取到数据')
        i = i + 1
    print(f"已运行{n}次")
    if 叮咚ok >= 6:  # 提醒了6次就结束循环
        print("已监控到6次,结束运行")
        break
    n = n + 1

bro.quit()
input('输入回车后继续:')

def ck_save():#保存cookies
    with open('cookies_1.txt', 'w') as f:
        # 将cookies保存为json格式
        f.write(json.dumps(bro.get_cookies()))

3.2 有头模式运行效果:

3.3 无头模式运行效果:

动图跟3.1比起来没有浏览器,只有日志输出,就不录了。

这是之前第一次拿Selenium写的代码,供参考。

- End -

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-02-21,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 偶尔敲代码 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
腾讯云服务器利旧
云服务器(Cloud Virtual Machine,CVM)提供安全可靠的弹性计算服务。 您可以实时扩展或缩减计算资源,适应变化的业务需求,并只需按实际使用的资源计费。使用 CVM 可以极大降低您的软硬件采购成本,简化 IT 运维工作。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档