专栏首页Hank’s Blog1.01-url-open_code

1.01-url-open_code

import urllib.request

def load_data():
    url = "http://www.baidu.com/"
    #get的请求
    #http请求
    #response:http相应的对象
    response = urllib.request.urlopen(url)
    print(response)
    #读取内容 bytes类型
    data = response.read()
    print(data)
    #将文件获取的内容转换成字符串
    str_data = data.decode("utf-8")
    print(str_data)
    #将数据写入文件
    with open("baidu.html","w",encoding="utf-8")as f:
        f.write(data)
    #将字符串类型转换成bytes
    str_name = "baidu"
    bytes_name =str_name.encode("utf-8")
    print(bytes_name)

    #python爬取的类型:str bytes
    #如果爬取回来的是bytes类型:但是你写入的时候需要字符串 decode("utf-8")
    #如果爬取过来的是str类型:但你要写入的是bytes类型 encode(""utf-8")
load_data()

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 抓取模板

    hankleo
  • 5.01-requests_auth

    hankleo
  • [已解决]报错UnicodeDecodeError

    hankleo
  • 微信文件传输助手文件夹在哪?一起来找找

      微信文件传输助手是微信电脑版与手机微信之间相互传输图片等文件的好工具,但很多童鞋都找不到微信文件传输助手文件夹在哪,就让我们一起找找吧   1.先说说手机微...

    ytkah
  • 关于 JavaScript 错误处理的最完整指南(下半部)

    相对简单抛出异常,我们可以使用 Promise.reject 和Promise.resolve:

    前端小智@大迁世界
  • IniHelper——INI操作辅助类

    使用INI配置文件,简单便捷。 该辅助工具类为C#操作INI文件的辅助类,源码在某位师傅的基础上完善的来,因为忘记最初的来源了,因此不能提及引用,在此深感遗憾,...

    用户1637609
  • 深度|超级补脑“镁元素”,不与时代脱节

    镁客网
  • 投融资汇总 | 本周(11.19-11.25)百度AI战略凸显,共投资三家AI公司

    镁客网
  • 无人机市场爆发在即,芯片制造商的好日子来了

    对于全球规模达430亿美元的工业半导体市场而言,2014年是一个好年景,存储器、逻辑和模拟产品年增长率高达18%。然而,根据HIS分析,2015年将逊色不少,乐...

    机器人网
  • Nacos入门

    我的初衷是想搞一套适合自定义快速开发的框架,把一些必要的技术整合进来,第一想法是尝试下SpringCloud Alibaba,毕竟是阿里开发,适应国人需求,下载...

    老梁

扫码关注云+社区

领取腾讯云代金券