专栏首页Python研发Python小爬虫-读取豆瓣电影名称导出csv

Python小爬虫-读取豆瓣电影名称导出csv

# -*- coding: utf-8 -*-
__author__ = 'YongCong Wu'
# @Time    : 2019/6/20 10:27
# @Email   :  : 1922878025@qq.com

from requests_html import HTMLSession
import csv

session = HTMLSession()

file = open('movies.csv', 'w', newline='')
csvwriter = csv.writer(file)
csvwriter.writerow(['名称', '年份'])

links = ['https://movie.douban.com/subject/1292052/', 'https://movie.douban.com/subject/26752088/', 'https://movie.douban.com/subject/1962665/']

for link in links:
    r = session.get(link)
    title = r.html.find('#content > h1 > span:nth-child(1)', first=True)
    year = r.html.find('#content > h1 > span.year', first=True)
    csvwriter.writerow(title.text)
    csvwriter.writerow(year.text)

file.close()

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 数据基本类型操作

    Wyc
  • 网络编程socket

    socket通常也称作"套接字",用于描述IP地址和端口,是一个通信链的句柄,应用程序通常通过"套接字"向网络发出请求或者应答网络请求。

    Wyc
  • linux入门总结

    linux的核心概念知识:      linux软件是开源免费的,而linux是由Unix演变而成,Unix是由MINIX演变而成。 2000年以后,linu...

    Wyc
  • 2015伦敦深度学习峰会:来自DeepMind、Clarifai、雅虎等大神的分享

    用户1737318
  • 【实战】使用 Python 分析 14 亿条数据

    Google Ngram viewer是一个有趣和有用的工具,它使用谷歌从书本中扫描来的海量的数据宝藏,绘制出单词使用量随时间的变化。举个例子,单词 Pytho...

    昱良
  • 使用 Python 分析 14 亿条数据

    Google Ngram viewer是一个有趣和有用的工具,它使用谷歌从书本中扫描来的海量的数据宝藏,绘制出单词使用量随时间的变化。举个例子,单词 Pytho...

    IT派
  • 数据库安全能力:数据泄露途径及防护措施

    2018-2019年,全球各地深受数据泄露事件的困扰,已造成数以万计损失。据《数据泄露损失研究》评估显示,遭遇数据泄露事件的公司企业平均要损失386万美元,同比...

    FB客服
  • 2015伦敦深度学习峰会笔记:来自DeepMind、Clarifai等大神的分享

    上周,我有机会参加在伦敦举行的第三届深度学习峰会,上两届分别在旧金山和波士顿举行。 深度学习峰会由 RE.WORK主办,汇集了从工业领域到学术领域不同背景的专业...

    CSDN技术头条
  • 大数据的误导

    大数据火了这么多年了,还是有不少朋友会跟我讨论,“你说大数据多大算大?” 有这样困惑的朋友可能还不少,而且大多集中在刚刚入行的朋友里。这就是“大数据”一词天然...

    刀刀老高
  • MongoDB给数据库创建用户

    linux/Mac : mongod -f /mongodb/etc/mongo.conf

    拓荒者

扫码关注云+社区

领取腾讯云代金券