使用extract的Python BeautifulSoup问题

文章/答案/技术大牛

发布

1回答

、、、、

我的问题是使用extract，我不接受所有的信息，而不是使用元素检查。通过元素检查，我可以看到每个元素，品牌，公里，价格等。所有这些信息都在我的摘录中，但在脚本中，并不像我在网站上看到的那样。解压地址：https://www.alcopa-auction.fr/salle-de-vente-encheres/nancy/2110 import requests from bs4 import BeautifulS

浏览 10提问于2020-01-22得票数 0

3回答

在带有BeautifulSoup的Python3中，print(soup.get_text())在以下代码中生成错误('NoneType‘对象不可调用)：

、

print(soup.get_text())“指示问题所在。我该如何解决这个问题？import urllibcontent = urllib.urlopen(url) soup = BeautifulSoup</em

浏览 0提问于2013-08-09得票数 2

1回答

Python BeautifulSoup StyleTag Extract

、、

我需要从网页上使用Python和BeautifulSoup从下面的代码中抓取文本'64%‘，请帮助。

浏览 24提问于2017-07-03得票数 0

2回答

如何用Python将这种html表格转换成excel？

、、、

在编写基于python的脚本时，我遇到了一个奇怪的html_table，它类似于： <tr> </tr> 我知道我

浏览 135提问于2020-11-04得票数 0

1回答

网页抓取:从印地语在线报纸上抓取文章

、、

当涉及到抓取库时，我是一个新手，我已经开始使用BeautifulSoup进行抓取。以下是“Dainik Jaagran”(印地语报纸)的URL的HTML片段：<p> import urllib2 from bs4 import <e

浏览 7提问于2017-02-04得票数 0

回答已采纳

1回答

Python -删除标记标记并从文件中读取html？

、、、、

我有一个名为BBC_news_home.html的文件，我需要删除所有标记标记，所以我只剩下一些文本。

浏览 2提问于2017-10-10得票数 0

回答已采纳

1回答

网页抓取当前的镀铬标签

、、、、

例如，在此链接中，第一步之一是设置要抓取的网站的url。然而，我正在寻找一种从当前打开的窗口中获取信息的方法。有没有办法从打开的chrome标签页上进行屏幕/网页抓取？

浏览 4提问于2021-05-20得票数 0

1回答

获取TypeError: python中需要的字符串或缓冲区

我有这个简单的代码：import requests list = [] link_domain = tldextract.extract(href.get('href

浏览 1提问于2013-07-19得票数 0

回答已采纳

1回答

为什么BeautifulSoup会错过<p>标记？

、

我使用的是BeautifulSoup，findAll方法缺少<p>标记。我运行代码，它返回一个空列表。但是如果我检查页面，我可以清楚地看到它，如下面的图片所示。from bs4 import BeautifulSoupurl = 'https://www.kite.com/python/answers/how-to-extrac

浏览 1提问于2021-03-09得票数 0

1回答

从HTML标记中删除注释

、、、

-- /react-text --></b></h4>comments = h.findAll(text=lambda text:isinstance(text, Comment))soup = BeautifulSoup(html)[com

浏览 4提问于2016-07-03得票数 2

回答已采纳

1回答

每两个节点

、

因此，结果应该是：3478//*/dl[concat(dt/text(), .

浏览 3提问于2014-10-09得票数 0

回答已采纳

1回答

美丽的汤刮蟒，我找不到“标题”

、、

我这样做，用BeautifulSoup：response.raise_for_status()soup = bs4.BeautifulSoup(response.text,'html.parser') for select in soup.select("script",type

浏览 1提问于2021-08-02得票数 1

回答已采纳

1回答

只有当我运行此文件时，页面才能正常工作

我用python学习了一种求职技能！当我运行代码时，页面确实运行得很好，但是页面运行得并不好。它仅适用于页面0 例如: So page :0 scraping => indeed page : 0,1,2....15 scraping 有什么问题吗？?简单链接：https://repl.it/@timedosenotwait/Python-Scraper#main.py Indeed.py import requests from bs4 importas_and=python</em

浏览 16提问于2021-01-14得票数 0

3回答

Python中的Scraper给出了“访问被拒绝”

、、

我正在尝试用Python编写一个抓取器，以便从页面中获取一些信息。如此页面上显示的优惠的标题： import bs4 source=requests.get(url).text soup=bs4.BeautifulSoup(source) n

浏览 1提问于2017-02-01得票数 8

4回答

我可以把两个'findAll‘搜索块组合在一个漂亮的汤里吗？

、

我是否可以将这两个块合并为一个：还可以将多个块合并为一个： tag.extract() tag.extract()

浏览 1提问于2009-12-01得票数 2

回答已采纳

2回答

如何使用BeautifulSoup从职务发布中提取隐藏的表数据？

、、、、

嗨，我在做python课程，今天的任务之一，我们要在：上提取工作清单到目前为止，我写的是：from bs4 import BeautifulSoupdef extract(term): request = requests.get(url,: tbod

浏览 38提问于2022-09-07得票数 2

1回答

如果link.has_attr('href')：TypeError：'NoneType‘对象不可调用，则键入error

、

我试图执行以下python代码from BeautifulSoup import BeautifulSoup, SoupStrainer print link['href']我收到错误了 File "/home/u

浏览 1提问于2013-10-17得票数 2

回答已采纳

3回答

从HTML字符串中删除所有div标签

、

我正在试着去掉所有的div。<p>111</p> 所需输出：我试过了，但不起作用： release_conten

浏览 3提问于2013-04-04得票数 2

回答已采纳

2回答

Python-AttributeError：'NoneType‘对象没有’find‘属性；

、

import requests URL = f"https://au.indeed.com/jobs?q=Python&limit={LIMIT}&radius=50" result = requests.get(URL) soup =BeautifulSoup(result.text, "html

浏览 28提问于2019-12-29得票数 2

4回答

Python -- Regex --如何在两组字符串之间找到字符串

、、、

com">Foo1</a> <a href="/">Home</a> <div id=hotlink> </div> <a

浏览 8提问于2009-05-11得票数 6

回答已采纳

点击加载更多