前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >各语言简单爬虫

各语言简单爬虫

作者头像
林万程
发布2019-08-05 17:13:42
5260
发布2019-08-05 17:13:42
举报

各语言简单爬虫

Python 简单爬虫

import requests, re

if __name__ == "__main__":
    r = requests.get('http://docs.python-requests.org/zh_CN/latest/user/quickstart.html')
    r.encoding = "UTF-8"
    print(r.text)  # 用于打印页面内容

    # 正则搜索 .表示任意字符*表示任意个数,group(第一个括号)
    search = re.search('href="#">(.*)</a><ul>', r.text)
    print(search.group(1))

golang简单爬虫

package main

import (
    "fmt"
    "io/ioutil"
    "net/http"
    "regexp"
)

func main() {
    resp, _ := http.Get("https://studygolang.com/static/pkgdoc/pkg/net_http.htm")
    defer resp.Body.Close()
    bytes, _ := ioutil.ReadAll(resp.Body)

    re := regexp.MustCompile(`<meta name="private:description" content="(.*)">`)
    b := re.FindSubmatch(bytes)[1]
    fmt.Println(string(b))
}
本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2019.08.04 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • Python 简单爬虫
  • golang简单爬虫
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档