使用BeautifulSoup和python抓取在标记中返回斜杠的页面

文章/答案/技术大牛

发布

3回答

、、、

我将抓取作为获取页面上每个"continuar leyendo“的链接的第一步。当我使用Inspect元素查看html时，我发现我需要将所有但是当我用BeautifulSoup抓取它时，页面实际上将它返回为使用curl -i https://www.gob.mx

浏览 30提问于2019-11-15得票数 0

回答已采纳

2回答

我无法使用美汤进行解析

、

><span>Very Good</span></span> </span> My Name is Alis I am a pythonclass="class-3" style="style-2 clear: both;"> </div> <&

浏览 0提问于2010-11-17得票数 0

1回答

使用BeautifulSoup和拆分器从推特帐户检索文本

、、、

lang=en' html = browser.html print(tweet.text) 但是，它抛出一个错误，声明"'NoneType' object has no attribute 'text'"和soup.find_all()返回</

浏览 3提问于2019-12-07得票数 1

1回答

如何在web抓取时排除标签

、、、

我正在尝试使用Python3.8和BeautifulSoup来抓取网页，但我遇到了一个我无法解决的问题。我正在抓取的页面有两个类似的div标记，它们都包含一个id值，但其中一个还包含一个额外的类容器：例如，第一个标记返回：；，第二个标记返回。我可以使用"page = soup.find_all(&#

浏览 6提问于2019-11-21得票数 0

回答已采纳

1回答

BeautifulSoup按编号指定表列？

、、、、

使用Python2.7和BeautifulSoup 4，我从一个表中抓取歌曲名。理想情况下，我可以改变号码，以改变哪些被选中。/beatles/index.html") for table in soup.find_all('table')s

浏览 7提问于2014-04-09得票数 1

回答已采纳

2回答

尝试将数据从网站加载到json文件中。

、、

我试图将数据从一个网站加载到一个json文件中。m=1" print(r.text)print(r.json)继续：：import jsonerr.value“，s，err.value)到No

浏览 2提问于2020-05-10得票数 0

7回答

BeautifulSoup解析的问题

、

我正在尝试用BeautifulSoup解析一个html页面，但是看起来BeautifulSoup根本不喜欢这个html或者那个页面。当我运行下面的代码时，prettify()方法只返回页面的脚本块(见下文)。有人知道为什么会这样吗？import urllib2 url = "http://www.futureshop.ca/cata

浏览 1提问于2009-03-02得票数 5

回答已采纳

1回答

注释在网页上可见，但BeautifulSoup返回的html对象不包含注释部分

、、、

我尝试使用网址链接从网页中提取评论的文本内容，并使用BeautifulSoup进行抓取。当我单击URL链接时，在页面上可以看到注释的内容，但是BeautifulSoup返回的HTML对象不包含这些标记和文本。我使用带有'html.parser‘的BeautifulSoup来做网页抓取。我成功地提取了

浏览 19提问于2019-03-25得票数 1

回答已采纳

1回答

访问HTML注释中的标记

、、、

我已经通过BS4熟悉了使用Python进行web抓取的过程。我还没有找到嵌入在注释中的DOM标记的解决方案。例如，当试图从.html页面()获取数据时，检查页面上的表显示：我通常可以用BeautifulSoup

浏览 0提问于2018-12-11得票数 0

回答已采纳

4回答

使用PHP或Python的PHP抓取技术

、、

我需要刮大约100个网站，在他们提供的内容非常相似。第二项质询。我的主要语言是PHP，但在Stackoverflow上搜索此处后，我发现Python中的"Beautifu

浏览 2提问于2011-01-03得票数 3

1回答

当元素确实存在时，BeautifulSoup返回'None‘

、

首先，如果我错过了一些非常简单的东西，我道歉，我已经看了很多问题，但终生都找不到答案。基本上，我试图收集文本的网站是这样的： url = 'https://www.otcmarkets.com/stock/MNGG/overview'soup = BeautifulSoup(p

浏览 34提问于2021-02-27得票数 0

3回答

使用JQuery更改Facebook meta标签内容属性

、、、

我想知道如何使用JQuery来替换我的Facebook meta标签的内容属性。:url]").attr("content", url);<meta property="og:title" content="some content"/><

浏览 2提问于2011-08-14得票数 11

回答已采纳

1回答

BeautifulSoup只返回head标记内的内容

、、、

我正在使用BeautifulSoup，我发现了一个错误或者是我的一个错误。在我的示例中，我爬行了纽约时报的一个子部分网站...from bs4 import BeautifulSoup website = "http://www.nytimes.com返回的是head标记和其中的内容。但是，它不会获取b

浏览 0提问于2013-01-14得票数 4

回答已采纳

2回答

使用Python在youtube中搜索打开第一个视频

、、、

此代码在浏览器中打开搜索。

浏览 1提问于2020-04-10得票数 3

5回答

如何从其他网站获取数据？

、、、

我想创建一个网站，从其他网站提取信息，并将它们打印到我的网站上，我正在进行研究，所以我想听取一些意见，这个项目的最佳解决方案是什么？我听说Python使用解析器可以做到这一点，我只是想知道我应该走哪条路，应该使用哪种语言？

浏览 1提问于2013-06-14得票数 4

1回答

美汤经典迷惑

、、

使用Python和Beautifulsoup。CSS标记有点新手，所以我知道我正在犯一些初学者的错误，一个具体的例子将有助于我理解很长一段路。我正在尝试抓取页面中的链接，但仅限于某些链接。

浏览 8提问于2017-02-15得票数 0

回答已采纳

2回答

为什么BeautifulSoup找不到HTML类？

、、、

我正在尝试在python中使用requests和BeautifulSoup来抓取：r = requests.get(

浏览 0提问于2019-06-08得票数 1

3回答

有没有像HtmlAgilityPack (.NET)这样好的html解析器呢？

、、

我正在寻找一个像HtmlAgilityPack (开源.NET项目：)这样的好的html解析器，但可以与Python一起使用。有人知道吗？

浏览 2提问于2009-08-03得票数 2

回答已采纳

4回答

屏幕抓取窗体结果

、、

我最近被一个客户要求为他们的保险业务建立一个网站。作为这项工作的一部分，他们想要对他们的一个供应商的报价站点进行一些屏幕抓取。他们询问他们的API是否可以做到这一点，并被告知没有，但如果他们可以从他们的引擎中获得数据，他们可以随心所欲地使用它。我的问题是:是否可以对表单提交到另一个站点的响应执行屏幕抓取？如果是这样，我应该注意的陷阱是什么？抛开明显的</

浏览 1提问于2009-08-03得票数 3

回答已采纳

1回答

如何使用python在网页的HTML中搜索包含特定单词的URL？

、、

使用Python，我希望能够创建我从多个页面获取的URL列表，每个页面都有一个链接(尽管页面上可能有多个对同一链接的引用)，其中每个URL中都有重复的关键字。如何在页面的HTML中搜索包含此特定单词的URL？抱歉，如果这是很明显的事情，您能提供的任何帮助都将非常感谢。

浏览 38提问于2020-04-10得票数 1

回答已采纳

点击加载更多