使用Python和Bs4选择HTML对象

文章/答案/技术大牛

发布

0回答

python、beautifulsoup、python-requests

我目前正在用python和bs4训练代码，并且正在测试从这个站点选择对象：import requestsr = requests.get('http://www.metal-archives.com/lists/A') soup = BeautifulSoup当我用C

浏览 1提问于2016-12-25得票数 2

1回答

如何将BeautifulSoup对象保存到文件中，然后将其读取为BeautifulSoup？

python、beautifulsoup

我想将BeautifulSoup对象保存到一个文件中。因此，我将其转换为字符串，然后将其写入文件。然后，将其作为字符串读取后，将字符串转换为BeautifulSoup对象。url = "https://coinmarketcap.com/all/views/all/"soup = BeautifulSoup(html,"lxml") new_s

浏览 3提问于2018-10-24得票数 2

1回答

切割比件

scripts

我需要从文字中删掉特定的部分..。 </span> <a href="/sub/570168/">570168</a>

浏览 0提问于2021-04-17得票数 0

1回答

html5lib中的毛刺？

python、html5lib

File "/opt/virtualenvs/python3/lib/python3.8/site-packages/bs4/__init__.py", line 30, in <module>python3.8/site-packages/bs4/builder/__init__.py", line 314, in <module>

浏览 10提问于2020-12-17得票数 0

回答已采纳

2回答

使用BeautifulSoup get_text或findAll(text=True)时无法获得可见文本

python、html、beautifulsoup

我正在尝试使用bs4和python3.4.1从网页中提取可见文本。为此，我从汤中提取所有脚本和样式元素，然后继续从剩余的html中获取文本。为了测试目的，我使用x，y，z来观察我对汤的修改。html = urllib.request.urlopen('http://www.skilledup.com/articles/reasons-to-learn-python').re

浏览 5提问于2016-02-04得票数 0

回答已采纳

1回答

调用python中的js函数来使用document.getElementById

javascript、python、socket.io、getelementbyid、django-socketio

我最近询问了如何在python中调用js函数。人们给了我一些建议，比如使用js2py或pyv8，但问题是它不允许我使用以下js命令：所以我的问题是:有没有一种方法可以从python函数调用js，并且允许您使用上面的js命令？

浏览 5提问于2016-08-23得票数 1

回答已采纳

3回答

在python3中删除html中标记之间的换行符

python、python-3.x、beautifulsoup、html-parsing、removing-whitespace

我希望修剪掉所有的空格和新行，并将结果从到这个for link in url_list: r = requests.get(link) soup = BeautifulSoup(r.content,"html.parser

浏览 11提问于2017-02-17得票数 2

回答已采纳

1回答

无法从“BeautifulSoup”导入名称“bs4”

python-3.x、runtime-error

我使用Python3.7.0我不能使用BeautifulSoup属性bs4import csvsoup = BeautifulSoup(html)", line 1, in <module> from bs4 impo

浏览 0提问于2019-07-25得票数 0

2回答

我是否需要上传整个BS4库才能在need服务器上使用它？

python、beautifulsoup

我不知道该在哪问这个，所以我要试试Stackoverflow.我想使用BS4作为网站上python脚本的一部分。如何导入BS4库以使用它？我是否必须将整个库上传到web服务器上才能使用它？

浏览 0提问于2018-11-28得票数 0

回答已采纳

1回答

ModuleNotFoundError:即使在安装和重新安装之后，也没有名为“bs4”的模块

python、python-3.x、beautifulsoup

\Python\Python37\lib\site-packages\bs4\__init__.py", line 29, in <module> from .builder import builder_registryFile "C:\Users\Administrator\AppData\Local\Programs\Python\Python37\lib\site-packages\bs4\builder\\Python3

浏览 0提问于2019-04-28得票数 1

回答已采纳

2回答

xml.minidom能解析破碎的XML吗？

python、html-parsing

备注：我不能使用第三方模块，所以bs4和lxml不是一种选择。我是不是在xml模块中遗漏了一些东西，可以做我想要做的事情？

浏览 5提问于2017-12-13得票数 0

8回答

ImportError:没有名为BeautifulSoup的模块

python、beautifulsoup

我已经使用easy_install安装了BeautifulSoup，并尝试运行以下脚本import re '<body><p id="firstpara" align="center">

浏览 1提问于2011-04-14得票数 93

2回答

如何使用PythonVersion3x从网站读取html正文

python

我想连接和接收来自特定网站链接的http响应。我有许多Python代码：import os,sys,re,datetime import urllib.requestfp = urllib.request.urlopen("http://www.python</e

浏览 0提问于2015-08-14得票数 0

1回答

如何从OSX10.12.5上的bs4中从Python3中导入漂亮汤？

python-3.x、beautifulsoup

我试图解决在Python3中导入模块时出现的一个常见问题。我正在运行OSX10.12.5，并将Python3安装在我的MacBook Air上，并使用崇高文本来编辑和运行我的代码。/<myname>/Python/code-python3/Pgm#001", line 5, in <module>ImportError我不是在<

浏览 0提问于2017-07-04得票数 1

1回答

从漂亮汤的列表中选择链接

python、html、beautifulsoup

我正在尝试从列表中选择链接2000+项目长。最后，我希望能够按照列表中的链接打开下一页。我可以让but打印出我想要的li列表，但我不知道如何使用这些链接。我尝试添加了以下内容： print(link.get('href'))AttributeError：“”NavigableString“”对象没有属性“”get“” 我认为这与HTML仍然附加在代码上有关(即，当我打印li时，代码中会显示a、li和HREF标记)。f

浏览 9提问于2018-08-21得票数 1

1回答

如何在安装Python3.4的同时为Python2.7安装BeautifulSoup4？

python、windows、python-2.7、beautifulsoup

我在我的Windows8.1系统上安装了Python2.7.11和Python3.4.1。我用pip安装了BeautifulSoup4来运行代码(不是我的)。但是，pip自动将bs4安装到Python3.4.1。(我检查了它是否安装在C://Python34/lib/site-packages/bs4中) 我使用了命令提示符，将目录更改为C：\ Python 27(其中安装了P

浏览 1提问于2016-03-11得票数 0

回答已采纳

2回答

为什么这个特定的网站在解析时会导致递归错误？

python、recursion、beautifulsoup、html-parsing

我使用的是漂亮汤，它总是返回一个递归错误。我最初假设这是由于html中的4k列表元素造成的，所以我增加了递归限制，但这并没有解决这个问题。/Python.framework/Versions/3.5/lib/python3.5/site-packages/bs4/element.py"，第1126行，以解码indent_contents，在代码方面没有什么可发布的，对象的任何调用都会返回递归错误。f

浏览 10提问于2015-12-16得票数 3

回答已采纳

1回答

从python中的html中获取值的最佳方法？

python、regex、web-scraping

因此，我想在python中刮取属性值，目前我正在使用regex，但是它没有那么有效，所以我想知道我应该使用什么，因为很多人说regex对这类事情不好。这就是我想得到的。

浏览 2提问于2016-10-08得票数 1

回答已采纳

3回答

ModuleNotFoundError:没有名为'bs4‘的模块

python-3.x、beautifulsoup

当我尝试像这样导入BeautifulSoup时当我运行我的代码时，我得到了这个错误信息。ModuleNotFoundError: No module named 'bs4import csvimport bs4 page = requete.contentB

浏览 6提问于2019-01-15得票数 2

2回答

Spyder3崩溃后，安装jupyter-记事本

ubuntu-16.04、spyder

在笔记本电脑中，我使用的是Spyder3，在安装Jupyter-记事本之前没有任何问题。当从命令行运行spyder3时，将出现下一条消息：sudo -H pip安装html</

浏览 0提问于2018-09-22得票数 1

回答已采纳

点击加载更多