使用BeautifulSoup4更改html的结构

文章/答案/技术大牛

发布

1回答

python、html、beautifulsoup

我有一个具有以下结构的HTML： <a name='data'></a><div class='c4'>...</div> 我想按如下方式更改结构： <a name='data'> <div class='c0'>...<

浏览 10提问于2019-04-27得票数 0

回答已采纳

1回答

BeautifulSoup4输出中的布尔属性

python、beautifulsoup

我使用<script async ...>异步加载JavaScript文件。当我使用BeautifulSoup4将文件加载到Python中时，进行一些无关的更改并保存结果时，BeautifulSoup4会将我的<script>语句转换为<script async="" ...>有没有办法防止BeautifulSoup4附加多余的...=""？最低限度的

浏览 3提问于2017-10-23得票数 1

回答已采纳

2回答

如何解决“模块”对象没有属性“_base”的问题？

python

我正在尝试运行位于这里的investopedia api：from investopedia import * from . import _html5libFile "C:\Users\Z\AppData\Loca

浏览 3提问于2017-03-26得票数 8

回答已采纳

2回答

获取HTML代码的结构

python、html、beautifulsoup

我使用的是BeautifulSoup4，我很好奇是否有一个函数返回HTML代码的结构(有序标记)。下面是一个示例：<body><p>This is a simple example of html page</p></html</em

浏览 0提问于2014-07-08得票数 4

回答已采纳

3回答

用Python中的pip命令安装模块

python、python-2.7

我尝试安装用于BeautifulSoup解析的HTML库。我试着使用pip命令。我已经完成了预演。我在路径中添加C：\Python27 27；。我运行它，输入python并导入pip。没事的我输入 File "<stdin>", line 1>>>python -m pip i

浏览 10提问于2017-04-08得票数 0

回答已采纳

2回答

Python3.6 BeautifulSoup不工作

python、python-3.x、web-scraping、beautifulsoup、html-table

我的密码如下所示；plain_text = source_code.text或html = r.content soup = BeautifulSoup(html, "html.parser

浏览 0提问于2017-03-20得票数 0

回答已采纳

1回答

美汤还空套装

python、beautifulsoup、redhat

import urllib2html = url.read()打印Html会正确输出google的网页。我查找了一些其他可能的解决方案，他们提到安装解析器，但到目前为止还没有成功。此解决方案不适用于我的问题

浏览 0提问于2013-11-29得票数 0

3回答

安装“美丽汤”软件包失败。错误消息是"SyntaxError:调用‘print’时缺少括号“

python、python-3.x、beautifulsoup

我在我的Windows 8计算机上安装了Python3.5。我还安装了Pycharm社区版本5.0.4。我无法安装BeautifulSoup模块通过设置选项在Pycharm。error code 1 in C:\Users\Kashyap\AppData\Local\Temp\pycharm-packaging0.tmp\BeautifulSoup Python安装文件夹的路径为

浏览 4提问于2016-03-02得票数 36

回答已采纳

2回答

我是否需要上传整个BS4库才能在need服务器上使用它？

python、beautifulsoup

我不知道该在哪问这个，所以我要试试Stackoverflow.我想使用BS4作为网站上python脚本的一部分。如何导入BS4库以使用它？我是否必须将整个库上传到web服务器上才能使用它？

浏览 0提问于2018-11-28得票数 0

回答已采纳

2回答

BeautifulSoup soup对象创建一致错误

python、python-2.7、beautifulsoup、python-requests

我是个web抓取新手，我在使用漂亮的汤时遇到了一些困难，这似乎更多的是与安装有关，而不是代码本身。我已经安装了bs4，并想从网页上获取数据。lat=37.7772&lon=-122.4168") 这使我得到以下错误消息 TracebackFile "<ipython-input-62-a9912850b0dc>", line 1, in <modu

浏览 1提问于2017-02-13得票数 0

1回答

如何制作python项目的完整脱机安装程序

python、installation、lxml、offline

我想用这个requirements.txt为我的python项目编写完整的脱机安装程序Flask==0.11.1peewee==2.8.5pymongo==3.4.0PyYAML==3.12tqdm==4.10.0做这件事最好的方法是什么：使用以下命令从需求中下载所有包(应该在生产平台上这样做:Ubuntu14.04？)re

浏览 4提问于2016-12-24得票数 2

1回答

下载站点的HTML页面并抓取它以获取所需的数据，因为他们没有公共api

python、html

所以我需要从一个网站获取一些数据，问题是他们没有一个公共的api，所以我想下载html文件，然后搜索我想要的数据。我只是不确定是否有可能这样做，我认为这应该是正确的？流程是这样的我不确定如何以字符串的形式抓取页面，因为页面有一个类似于表的数据，他们实际上有一个xml文件的公共api，但它排除了我想要的数据，这就是

浏览 2提问于2019-08-28得票数 0

3回答

Python Beautiful Soup 'NoneType‘对象错误

python、html、beautifulsoup、findall

我正在使用美丽汤来获得网页主体中的超链接。下面是我使用的代码from bs4 import BeautifulSoup element但奇怪的是，它在其他页面上工作得很好(例如)。屏幕截图

浏览 2提问于2014-04-16得票数 4

2回答

使用DDoS保护解析站点

python-3.x、python-requests、selenium-chromedriver、ssl-certificate、undetected-chromedriver

我已经阅读了大量有关使用硒和色度驱动器的信息。什么都帮不上忙。CERTIFICATE_VERIFY_FAILED] certificate verify failed: unable to get local issuer certificate (_ssl.c:1129)> 为了避免这个错误，网络上的向导没有帮助

浏览 4提问于2022-03-07得票数 0

回答已采纳

1回答

Python -删除标记标记并从文件中读取html？

python、html、text、information-retrieval、data-extraction

我有一个名为BBC_news_home.html的文件，我需要删除所有标记标记，所以我只剩下一些文本。到目前为止我得到了： cleaned = '' f = codecs.open("BBC_news_home

浏览 2提问于2017-10-10得票数 0

回答已采纳

6回答

在beautifulsoup4中没有名为“python3”的模块

python、python-3.x、beautifulsoup

$ virtualenv test$ pip3 install beautifulsoup4import urllib.requestdef setUp(self):

浏览 0提问于2018-03-08得票数 8

1回答

Python -单击链接时抓取数据不会更改URL

python、python-2.7、web-scraping

我想从这里抓取数据：在该页面中有一个标题为“市场流动”的部分，下面有3列：“最活跃的人”，"%获得者“，"%失败者”，每一个都可以点击。该部分列出了10只股票。同样在第10只股票的末尾，有一个可点击的矩形“再加载10个”。我想要做的是点击"%获得者“，同时点击”加载10多个“，查看排名前20的获得者列表，并在Python中抓取数据。

浏览 1提问于2015-09-11得票数 1

1回答

BeautifulSoup无法解析长视图状态

python、html-parsing、beautifulsoup

我尝试使用BeautifulSoup4解析从检索到的html，如果打印出结果的汤，它的结尾如下：搜索原始html中的最后一个字符9IjaI，我发现它位于一个巨大的viewstate的中间。有什么提示，我可能做错了什么，或者如何解析这样<em

浏览 1提问于2013-08-09得票数 0

回答已采纳

2回答

Visual Studio Python的美汤

visual-studio、beautifulsoup

我正在使用Python的Visual Studio。我想安装用于web抓取的Beatifulsoup。作为解释器安装的Python 3.4。我执行了下面的代码，得到了"no module named bs4“错误。谢谢from bs4 import BeautifulSoup html = urlopen(&

浏览 21提问于2017-01-10得票数 0

1回答

如何从注释块中抓取数据并创建数据？

python、html、pandas、web-scraping、beautifulsoup

我试图从棒球场参考网站上提取HTML数据。我想去他们的网站，查看页面源，html标签就会在html代码本身中。但是，经过进一步的调查，我关心的html标记集都在注释块中。-并且直到HTML文件几乎结束时才结束。我可以用下面的代码提取HTML注释，但它附带了一些问题。，它在一个列表中，我只关心有数据的那个，它附带了新的行标记，我很难把播放器的标准打击字符串代码转换成html

浏览 3提问于2022-05-28得票数 1

回答已采纳

点击加载更多