首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >BeautifulSoup错误

BeautifulSoup错误
EN

Stack Overflow用户
提问于 2017-06-15 04:58:47
回答 3查看 2.2K关注 0票数 0
代码语言:javascript
运行
复制
import urllib
import urllib.request
from bs4 import BeautifulSoup

theurl = "https://twitter.com/official_YDP09"
thepage = urllib.request.urlopen(theurl)
soup = BeautifulSoup(thepage, "html.parser")

print(Soup.title)

结果是错误的

代码语言:javascript
运行
复制
C:\Users\Yohan\AppData\Local\Programs\Python\Python36-32\python.exe "C:/Users/Yohan/PycharmProjects/Project/aku pasti bisa.py"
Traceback (most recent call last):
  File "C:/Users/Yohan/PycharmProjects/Project/aku pasti bisa.py", line 7, in <module>
    soup = BeautifulSoup(thepage, "html.parser")
  File "C:\Users\Yohan\AppData\Local\Programs\Python\Python36-32\lib\site-packages\bs4\__init__.py", line 153, in __init__
    builder = builder_class()
  File "C:\Users\Yohan\AppData\Local\Programs\Python\Python36-32\lib\site-packages\bs4\builder\_htmlparser.py", line 39, in __init__
    return super(HTMLParserTreeBuilder, self).__init__(*args, **kwargs)
TypeError: __init__() got an unexpected keyword argument 'strict'

Process finished with exit code 1
EN

回答 3

Stack Overflow用户

回答已采纳

发布于 2017-06-15 05:35:33

一个简短的修正更改打印(Soup.title)到打印(soup.title)汤是小写。尝试从urllib切换到请求。希望这有帮助,如果没有,请告诉我们。

编辑1:添加结果的图像

票数 0
EN

Stack Overflow用户

发布于 2017-06-15 05:04:50

您必须更改该字符串:

代码语言:javascript
运行
复制
soup = BeautifulSoup(thepage.read(), "html.parser")
票数 0
EN

Stack Overflow用户

发布于 2017-06-15 05:49:32

我拿到输出了,

我发现的区别是,打印(soup.title)#在这里使用大写汤

如果没有解决,重新安装您的美丽汤到适当的版本。您需要版本4.4+,因为您使用python 3.6+。

代码语言:javascript
运行
复制
import urllib.request 

是不需要的,因为您已经import urllib

您使用的是python3,所以专门为您的python3安装bs4,

代码语言:javascript
运行
复制
pip3 install beautifulsoup4

如果您没有让pip3使用apt-get install python3-pip安装它

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/44558887

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档