我有一些facebook群组,我想要获得其成员的数量。一个例子是这个组:https://www.facebook.com/groups/347805588637627/我已经查看了页面上的inspect元素,它是这样存储的:
<span id="count_text">9,413 members</span>
我正在试着把"9,413名会员“从页面中剔除。我试过使用BeautifulSoup,但不能解决这个问题。
谢谢
编辑:
from bs4 import BeautifulSoup
import requests
url = "https://www.facebook.com/groups/347805588637627/"
r = requests.get(url)
data = r.text
soup = BeautifulSoup(data, "html.parser")
span = soup.find("span", id="count_text")
print(span.text)
发布于 2017-02-11 19:32:02
如果页面中有多个span标记:
from bs4 import BeautifulSoup
soup = BeautifulSoup(your_html_input, 'html.parser')
span = soup.find("span", id="count_text")
span.text
发布于 2017-02-11 19:24:42
您可以使用已解析跨度的text
属性:
>>> from bs4 import BeautifulSoup
>>> soup = BeautifulSoup('<span id="count_text">9,413 members</span>', 'html.parser')
>>> soup.span
<span id="count_text">9,413 members</span>
>>> soup.span.text
'9,413 members'
发布于 2019-06-09 23:54:45
Facebook使用javascrypt
来防止机器人抓取。您需要使用selenium
来提取python上的数据。
https://stackoverflow.com/questions/42175190
复制相似问题