在Python\3中使用request和urllib.request来获取网页的具体信息....HTML标签的小说内容.接下来的目标就是讲小说的内容提取出来,过滤掉这些没用的HTML标签.
(3)Beautiful Soup
提取我们真正需要的内容有很多方法,例如用正则表达式,Xpath,Beautiful...Beautiful Soup是一个第三方库,这里是中文学习文档
beautiful soup 4的安装方法:
sudo apt-get install python-bs4
检验beautiful soup...标签
##find_all的第一个参数是获取的标签名,第二个参数class_是标签属性
##class在Python中是关键字,所以用class_标识class属性,,避免冲突...标签
11 ##find_all的第一个参数是获取的标签名,第二个参数class_是标签属性
12 ##class在Python中是关键字,所以用class_标识class属性,