前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >高级爬虫实践|记录一次自动登录淘宝网站 By Java

高级爬虫实践|记录一次自动登录淘宝网站 By Java

作者头像
猿哥
发布2019-07-26 18:52:28
1K0
发布2019-07-26 18:52:28
举报
文章被收录于专栏:Web技术布道师Web技术布道师

一点废话

接上一篇文章(PHP高级爬虫实践|记一次失败的淘宝自动登录尝试),猿哥尝试了很多种方式(包括切换浏览器和编程语言),暂时放弃使用 Facebook 的 PHP webdriver了。主要是因为资料太少了,也不想花太多时间研究 selenium 内部的数据交互和命令执行等,于是换了一种 selenium 比较亲和的语言 java 来实现。

直(接)撸代码

代码语言:javascript
复制
package util;import org.openqa.selenium.By;import org.openqa.selenium.WebElement;import org.openqa.selenium.firefox.FirefoxDriver;import org.openqa.selenium.firefox.FirefoxOptions;import org.openqa.selenium.firefox.FirefoxProfile;import java.io.File;import java.util.Random;public class TestCase2 {    public static void main(String[] args)    {        System.setProperty("webdriver.firefox.bin","C:\\Program Files\\Mozilla Firefox\\firefox.exe");        System.setProperty("webdriver.gecko.driver","C:\\Users\\18431\\IdeaProjects\\SeleniumDemo\\bin\\geckodriver.exe");        FirefoxOptions options = new FirefoxOptions();        FirefoxProfile profile = new FirefoxProfile(new File("C:\\Users\\18431\\AppData\\Roaming\\Mozilla\\Firefox\\Profiles\\efzu2oem.default"));        options.setProfile(profile);        FirefoxDriver driver = new FirefoxDriver();        driver.get("https://login.m.taobao.com/login.htm");       //下面开始完全模拟正常人的操作,所以你会看到很多 sleep 操作        WebElement usernameElement = driver.findElement(By.id("username"));        //模拟用户点击用户名输入框        usernameElement.click();        String username = "18588260144";//你的手机号        String password = "xxxxxxxxxxx";//你的密码        Random rand = new Random();        try {            for (int i = 0; i <username.length() ; i++) {                Thread.sleep(rand.nextInt(1000));//随机睡眠0-1秒                //逐个输入单个字符                usernameElement.sendKeys(""+username.charAt(i));            }            WebElement passwordElement = driver.findElement(By.id("password"));            passwordElement.click();            //输入完成用户名后,随机睡眠0-3秒            Thread.sleep(rand.nextInt(3000));            for (int i = 0; i <password.length() ; i++) {                Thread.sleep(rand.nextInt(1000));                passwordElement.sendKeys(""+password.charAt(i));            }            driver.findElement(By.id("btn-submit")).click();        } catch (Exception e){            e.printStackTrace();        }        try {            Thread.sleep(300000);        }catch (InterruptedException ie){            ie.printStackTrace();        }        driver.quit();    }}

总结

可以看出来,万变不离其宗,再难的模拟登录都是可以完全模拟人类的操作习惯去实现反爬虫的,好吧,全都告诉你了,PHP 爬虫技术不打算继续写下去了,感觉还是用 PHP 适合它做的事情比较好,PHP 写的爬虫段位太低,还是python 和 java 更好些。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2018-03-31,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 PHP技术大全 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档