前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >python爬虫入门_在百度搜索手机归属地

python爬虫入门_在百度搜索手机归属地

作者头像
yifei_
发布2022-11-14 14:34:19
3810
发布2022-11-14 14:34:19
举报
文章被收录于专栏:yifei的专栏

枚举手机号,在百度搜索手机归属地

工具

  • requests http库
  • BeautifulSoup html解析库

代码

代码语言:javascript
复制
#!/usr/bin/python3
# -*- coding: utf-8 -*-

import requests
from bs4 import BeautifulSoup

headersPara = {    #伪装浏览器信息
    'Connection': 'Keep-Alive',
    'Accept': 'text/html, application/xhtml+xml, */*',
    'Accept-Language': 'en-US,en;q=0.8,zh-Hans-CN;q=0.5,zh-Hans;q=0.3',
    'Accept-Encoding': 'gzip, deflate',
    'User-Agent': 'Mozilla/6.1 (Windows NT 6.3; WOW64; Trident/7.0; rv:11.0) like Gecko'
}
url="https://www.baidu.com/s"
f=open('./phonenumber.txt','w')

for i in range(111,119):
    word="13363460"+str(i)
    print(i)
    f.write(word+' ')
    data={
        'wd':word,
        'ie':'utf-8'
    }
    #发送get请求,添加可选参数params和headers
    response =requests.get(url=url,params=data,headers=headersPara)
    response.encoding="utf-8"
    #获取html网页
    html=response.text
    #使用lxml解析html页面成一棵树,返回给soup
    soup=BeautifulSoup(html,'lxml')
    #data=soup.select('#main > div > div.result-right > div.c-border.op_fraudphone_container > div > div.c-span21.c-span-last > div.op_fraudphone_row')
    #用select选择需要的标签,前面加.表示类名,可用空格组合过滤条件
    data=soup.select('.c-gap-bottom-small span')
    if data and data[1]:
        #print(data[1].get_text())
        #print(data[1].get('href'))
        #获取标签内的文本
        f.write(data[1].get_text())
    f.write('\n')

f.close()

参考

欢迎与我分享你的看法。 转载请注明出处:http://taowusheng.cn/

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2019-11-13,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 工具
  • 代码
  • 参考
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档