BeautifulSoup/Python解析网站的问题_BeautifulSoup解析的问题_特定表的Python BeautifulSoup解析 - 腾讯云开发者社区

python、web-scraping、beautifulsoup、css-selectors、html-parsing

我相信这在过去可能会被问到，但我正在尝试解析一个网站(希望以某种方式自动解析最终一次解析多个网站)，但它不能正常工作。我可能在获取合适的标签或其他东西时遇到了问题，但本质上我想去这个网站，从创建的列表中取出所有的项目(可能是完整的href，也可能是一个单独的文档)，并将它们粘贴到一个文件中，我可以用一种易于阅读的格式分享它们到目前为止，这是我的代码： url =

浏览 16提问于2020-10-16得票数 0

1回答

姜戈BeautifulSoup FeatureNotFound

python、django、beautifulsoup

当尝试用Django使用BeautifulSoup刮一些东西时，它会返回：urlContent = urllib2.urlopen(url).read() 我尝试过不同的导入方式： from bs4 import BeautifulSoup</em

浏览 2提问于2014-09-06得票数 0

回答已采纳

2回答

尝试将数据从网站加载到json文件中。

python、json、python-requests

我试图将数据从一个网站加载到一个json文件中。当我尝试这段代码时，没有什么问题：import json print(r.text)print(r.json) 上面的代码显示:响应200的绑定方法

浏览 2提问于2020-05-10得票数 0

1回答

使用BeautifulSoup打印网站上的图像

python、web-scraping、beautifulsoup

我在python中练习使用BeautifulSoup，试图解析来自这个网站的信息： from bs4 import BeautifulSoup source = requests.get('https://www.vogue.com/fashion/street-style'

浏览 3提问于2020-06-05得票数 0

回答已采纳

1回答

如果内容包含一些字符串，如何使用python将内容与html标记一起删除

html、python-2.7、tags

我目前正在处理一些html格式的数据。这些文件的格式或多或少是这样的(请记住，为了简单起见，我已经删除了大部分内容，以便在线显示代码)：<TITLE>some header here</TITLE><PRE>

浏览 2提问于2018-03-19得票数 0

2回答

BS4返回[]而不是所需的HTML标记

python、html、parsing、beautifulsoup

我想要解析给定的网站并抓取表。在我看来，代码看起来是正确的。python和web解析新手from bs4 import BeautifulSoupdoc = BeautifulSoup(response.text, 'lxml-xml'

浏览 12提问于2020-11-15得票数 1

回答已采纳

1回答

<script>标签和HTMLParseError

python、beautifulsoup

我试图用BeautifulSoup解析超文本标记语言，却得到了奇怪的错误。下面是重现问题的最小代码。(Windows 7 32位，ActivePython 2.7)。from bs4 import BeautifulSoup<html>var pstr = "<li><font color='blue'>1</font>&

浏览 4提问于2012-05-05得票数 1

回答已采纳

3回答

无法使用Python和BeautifulSoup解析网站的html

python、html、beautifulsoup

我正在尝试从网站收集href ()，使用python和BeautifulSoup模块。但由于某种原因，我无法解析特定的html数据。这个问题的解决办法是什么？提前谢谢！这是我的密码soup = BeautifulSoup(

浏览 7提问于2020-07-15得票数 0

3回答

用python刮网站

python、web-scraping、beautifulsoup、scrapy、libraries

我试图在网上刮一个网站，以获取价格和标题从它。我已经看过多个教程和博客，最常见的库是漂亮汤和scrapy。如果有一种方法可以在不使用任何第三方库(如beautifulsoup和scrapy )的情况下抓取一个网站，那么就可以使用beautifulsoup。

浏览 1提问于2020-06-09得票数 1

回答已采纳

1回答

如何用Python中的BeautifulSoup解析多体标记中的文本？

python、html、beautifulsoup

我想解析这个网站：<span class="sharenumber" id="fb_share_span">2830</span>from bs4 import BeautifulSoup res = requests.get("https:/

浏览 2提问于2015-12-20得票数 2

回答已采纳

3回答

如何消除BeautifulSoup用户警告？

python、beautifulsoup

安装BeautifulSoup后，每当我在命令行中运行Python时，就会发出以下警告： BeautifulSoup([your

浏览 4提问于2015-11-04得票数 67

回答已采纳

2回答

使用机械化进行以下链接

python、web-scraping、beautifulsoup、mechanize

我想使用机械化python库来跟踪网站中的某些链接，但我唯一感兴趣的链接是<div>标记中的链接。问题是相关的，但他们是使用lxml解析器实现的，我不熟悉这个解析器，我更习惯使用BeautifulSoup。我已经使用BeautifulSoup找到了相关链接，但我不知道如何使用Mechanize (或其他东西)来跟踪这些链接。有没有办法把一个字符串传递给机械化，这样它就会

浏览 0提问于2013-01-24得票数 2

回答已采纳

2回答

Python:从TD标记中打印特定的文本行

python、parsing、iteration、beautifulsoup

我相信这是一个简单的问题。我正在解析一个网站，我试图在标签之间获得特定的文本。文本将== revoked，Active，Default I am using Python。我已经能够打印出所有的内部文本结果，但我还无法在web上找到针对特定文本的良好解决方案。以下是我的代码import urllib2 url =

浏览 0提问于2013-05-28得票数 0

回答已采纳

1回答

我有一个xml文件，是每周收到的。该文件包含我的客户可用的大约40个“活动”。在这40个活动中，我只需要8个。为了减少处理文件的时间，我需要选择8个“活动”，然后将它们组合到一个xml文件中。当我将文件完全展开时，我们有大约1.5 we的行。这就是为什么我急于限制我必须处理的内容。我的一个同事编写了一个java脚本，为树中的每个活动创建一个新的xml文件。生成的文件类似于123456.xml。从这里开始，我需要做<

浏览 0提问于2014-02-18得票数 0

10回答

使用Python进行Web抓取

python、firefox、webkit、web-scraping

我目前正在尝试抓取一个HTML格式相当差的网站(通常缺少结束标记，没有使用类或it，因此很难直接转到您想要的元素，等等)。到目前为止，我使用BeautifulSoup已经取得了一些成功，但偶尔(尽管很少)，我会遇到一个页面，在这个页面上，BeautifulSoup创建的HTML树与(例如) Firefox或Webkit略有不同虽然这是可以理解的，因为HTML的格式使这种模棱两可，如果我能够得到与Firefox或Webkit生成的相同<

浏览 3提问于2010-03-08得票数 9

回答已采纳

4回答

设置一个可以在Google App engine上工作的python屏幕抓取器

python、google-app-engine、screen-scraping

我希望设置一个自动屏幕刮板，将运行在谷歌应用程序引擎使用python。我想让它抓取网站，并将指定的结果放入应用程序引擎的实体中。我正在寻找一些关于使用的说明。我看过漂亮的汤，但不知道人们是否可以推荐其他可以在Google App engine上运行的东西。

浏览 1提问于2010-03-09得票数 3

回答已采纳

1回答

如何使用BeautifulSoup从表中获得第一个和第三个td？

python、html、html-table、beautifulsoup、html-parsing

我目前正在使用Python和BeautifulSoup来抓取一些网站数据。我试图从格式化如下的表中提取单元格：上面的HTML的问题是，BeautifulSoup将它作为一个标记读取不幸的</e

浏览 0提问于2013-08-14得票数 6

回答已采纳

2回答

html文件中两个字符串之间的Bash Grep

bash、awk、sed、grep、html

=<br>)' 但是我的输出还没有完成。

浏览 0提问于2021-01-25得票数 1

1回答

如何使PHP识别本地安装的Python模块以执行Python脚本

php、python、html、apache、web-services

我有以下Python代码，稍后将使用PHP调用这些代码："""Code name: test.py"""myargs = sys.argv[1是在本地安装的：/home/pdubois/.local/lib/pytho

浏览 1提问于2014-06-03得票数 0

回答已采纳

1回答

用BeautifulSoup超链接访问表格数据

python、html、parsing、web-scraping、beautifulsoup

对于使用BeautifulSoup，我仍然有一些不理解的地方。我可以用它来解析网页的原始HTML，这里是"example_website.com"：for link in soup.find_all('a'):我不明白的是:我

浏览 2提问于2015-10-14得票数 2

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云