前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >爬取小说相关指南

爬取小说相关指南

作者头像
用户8442333
发布2021-12-01 08:47:00
3080
发布2021-12-01 08:47:00
举报
文章被收录于专栏:python知识python知识

爬取指南

目前最火的小说《xxx》为例:

实现步骤
  • 获取小说所有章节以及对应地址
  • 遍历所有章节地址,获取其标题以及内容
  • 最后,把内容写入文本
学习重点
代码语言:javascript
复制
写入文本方式一:
import codecs
# 传入参数为chapter,content;content为需要写入的内容,数据类型为字符串,chapter为写入文件,数据类型为字符串。
# 传入的chapter需如下定义:path= 'G:/星辰变/第五章 修炼功法秘藏.txt'
# f = codecs.open(path, 'a', code)中,’a’表示追加写入txt,可以换成’w’,表示覆盖写入。
# code 表示编码 比如 'utf8'、'gbk'等。
def write_txt(chapter, content, code):
    f = codecs.open(path, 'a', code)
    f.write(str(content))
    f.close()


写入文本方式二(比较常用):
import codecs
def writetxt(chapter, content, code):
    with codecs.open(path, 'a', encoding=code)as f:
        f.write(content)
    return chapter+' is ok!'

本文系转载,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文系转载前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
作者已关闭评论
0 条评论
热度
最新
推荐阅读
目录
  • 爬取指南
    • 实现步骤
      • 学习重点
      领券
      问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档