专栏首页祥子的故事python包urllib名称

python包urllib名称

  • 在学习《Web Scraping with Python》,发现第32页下面这段代码报错。这段代码的意思是将某个页面全部爬下来。
#!/usr/bin/env python
#coding=utf8

from urllib.request import urlopen
from bs4 import BeautifulSoup

html = urlopen("http://en.wikipedia.org/wiki/Kevin_Bacon")
bsObj = BeautifulSoup(html)
for link in bsObj.findAll("a"):
    if "href" in link.attrs:
        print (link.attrs['href'])

经查询,在python3.5版本中是使用urllib.request,而在python2.7中则是urllib2

修改后,在python2.7中运行上面的代码会有警告

  • 这里的警告,并不是说有错误,只是习惯在使用时加上lxml 修改后
#!/usr/bin/env python
#coding=utf8

from urllib2 import urlopen
from bs4 import BeautifulSoup

html = urlopen("http://en.wikipedia.org/wiki/Kevin_Bacon")
bsObj = BeautifulSoup(html,"lxml")
for link in bsObj.findAll("a"):
    if "href" in link.attrs:
        print (link.attrs['href'])

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • sql | 基础总结 | 思维导图

    努力在北京混出人样
  • sql | 基础总结 | 思维导图

    努力在北京混出人样
  • Hive SQL 日常工作使用总结

    点号(.):表示和任意字符串匹配,星号(*):表示重复“左边的字符串”,(x|y)表示和x或者y匹配

    努力在北京混出人样
  • 机器学习入门数据集--5.皮马人糖尿病预测数据集

    在本项目的前期训练中,数据最后的结果都不理想。因此在代码中引入了多种数据模型:逻辑回归、高斯朴素贝叶斯、K近邻分类、决策树分类、支持向量机分类、xgboost。...

    birdskyws
  • Nature(2019)-地球系统科学领域的深度学习及其理解

    Machine learning approaches are increasingly used to extract patterns and insigh...

    zhangqibot
  • S3c2410/2440的Eboot流程

    对于嵌入式系统来说,一般都需要一个bootloader来下载和引导操作系统,常用的bootloader有eboot,uboot以及vivi等,对于windows...

    py3study
  • 图片转字符画

    字符画是一系列字符的组合,我们可以把字符看作是比较大块的像素,一个字符能表现一种颜色(暂且这么理解吧),字符的种类越多,可以表现的颜色也越多,图片也会更有层次感...

    王强
  • Elasticsearch + Kibana 起步

    浏览器访问http://localhost:5601 , 可以看的界面,说明配置正确。

    Stanley Sun
  • 基于Kerberos环境下,使用Java连接操作Hive

    虽然可以使用 Hive 服务本身的 Principal 与 keytab 来连接 Hive ,但使用服务本身的 principal 不具有普遍性,所以还是建议使...

    create17
  • 数据科学家需要了解的 5 种采样方法

    采样问题是数据科学中的常见问题,对此,WalmartLabs 的数据科学家 Rahul Agarwal 分享了数据科学家需要了解的 5 种采样方法,AI 开发者...

    AI研习社

扫码关注云+社区

领取腾讯云代金券