是否成功的方法:
from bs4 import BeautifulSoup
观察可以看到,div\标签中存放了小说的正文内容,所以现在的目标就是把div中的内容提取出来....到目前为止,我们已经可以抓取到小说一章的内容,并且进行了分段显示.下一个目标就是要把整个小说都下载下来....接下来,就是匹配抓取到的每一个标签,并提取章节名和章节文章.例如,取第一章,标签内容如下:
第一章 他叫白小纯
对BeautifulSoup...现在每个章节的章节名,章节链接都有了.接下来就是整合代码,将获得的内容写入文本文件存储就好了,代码如下:
#-*-coding:utf-8-*-
2 from bs4 import BeautifulSoup...showtxt')
32 texts = texts[0].text.replace('\xa0'*8,'\n\n')
33 return texts
34
35 #将抓取的文章内容写入文件