我是python的新手。我想在eclipse中运行python脚本,因为我对此有点适应。我正在尝试导入和运行美丽汤在eclipse oxygen.Import是成功的,但我得到一个错误(未解决的导入汤)与以下code.However美丽汤是工作良好与anaconda.enter图像描述在这里
从bs4导入BeautifulSoup as soup
使用美丽的汤可以做到以下几点:
for heading in soup.find_all('h1'):
print(heading.text)
Top Rated Movies
然而,是否有一种方法来提取标签本身,给出文本?从上述示例向后工作的一种方法,类似于:
soup.find_tag('Top Rated Movies')
h1
<p>
A
<span>die</span>
is thrown \(x = {-b \pm
<span>\sqrt</span>
{b^2-4ac} \over 2a}\) twice. What is the probability of getting a sum 7 from
both the throws?
</p>
在上面的html中,我只需要删除“(标记)”中的标记,即\(x = {-b \pm <span>\sqrt</span> {b^2-4ac} \
我试图使用美丽的汤刮从rottentomatoes.com的电影引号。页面源很有趣,因为引号是由span类“粗体quote_actor”直接进行的,但是引号本身没有类,例如():。
我想使用美丽汤的find_all捕捉所有的引号,没有演员的名字。我尝试过很多没有成功的事情,例如:
moviequotes = soup(input)
for t in web_soup.findAll('span', {'class':'bold quote_actor'}):
for item in t.parent.next_siblings:
我有Python3.7代码,尝试从以下网站()提取足球统计数据。看起来我在BS4美丽汤中使用的超文本标记语言解析器根本没有提取网站中的任何标签。
我首先尝试提取特定的标签,比如表示主队和客队的两个不同的div标签,以及包含球员姓名的标签。当这呈现了一个空的标签列表时,我只是简单地尝试提取该网站上的所有div标签,但我仍然得到了一个空列表。
下面是我使用的代码:
from requests import get
from bs4 import BeautifulSoup
url = 'https://www.whoscored.com/Matches/1294545/LiveStati
我正在尝试使用beautifulsoup.name获取漂亮的汤返回文本。但它只是给了我一个美丽汤对象的文档。对于如何使用Beautiful返回XML文件中的文本,有什么建议吗?
import BeautifulSoup as bsoup
f = open(file)
soup = bsoup(f)
f.close()
f = soup.name
This code will return [document]
But I'm looking to for a function in beautiful soup to return:
<name>car</n
我想从当地一家电影院的网站上刮点东西,当某部电影在运行时,我会一直拍下去。
我找到了一张表格,其中列出了如下形式的时间:
[<time datetime="2020-01-31T21:15:00+01:00">21:15</time>].
如果我用漂亮汤作为x.find_all(“时间”)。我得到了上面所示的所有时间。但我只想要“日期时间”,所以在本例中,2020-01-31T21: 15: 00 + 01: 00。现在当我搜索x.find_all(‘time’)‘日期时间’时,我得到以下错误:
TypeError: list indices must