使用python中的漂亮汤从列表中获取数据

漂亮汤（Beautiful Soup）是一个用于解析HTML和XML文档的Python库。它提供了一种简单而灵活的方式来遍历、搜索和修改文档树。

漂亮汤的主要特点包括：

解析器灵活：漂亮汤支持多种解析器，包括Python标准库中的html.parser、lxml解析器和xml解析器等。可以根据需要选择最适合的解析器。
简单易用的API：漂亮汤提供了一组简单易用的API，使得解析文档树变得非常方便。可以使用标签名、属性、CSS选择器等方式来搜索和遍历文档树。
强大的文档处理能力：漂亮汤可以处理各种复杂的文档结构，包括嵌套标签、属性嵌套等。可以轻松地提取所需的数据。

使用漂亮汤从列表中获取数据的步骤如下：

导入漂亮汤库：在Python脚本中导入漂亮汤库，可以使用以下代码实现：

from bs4 import BeautifulSoup

创建BeautifulSoup对象：将要解析的HTML或XML文档传递给BeautifulSoup类，创建一个BeautifulSoup对象。可以使用以下代码实现：

soup = BeautifulSoup(html_doc, 'html.parser')

其中，html_doc是要解析的HTML或XML文档。

使用漂亮汤提取数据：通过漂亮汤提供的API，可以使用标签名、属性、CSS选择器等方式来搜索和遍历文档树，从而提取所需的数据。以下是一些常用的方法：

find()：根据标签名、属性等条件查找第一个匹配的元素。
find_all()：根据标签名、属性等条件查找所有匹配的元素。
select()：使用CSS选择器查找匹配的元素。

例如，如果要从一个包含多个链接的列表中提取所有链接的文本和URL，可以使用以下代码：

links = soup.find_all('a')
for link in links:
    text = link.text
    url = link['href']
    print(text, url)

这样就可以获取列表中所有链接的文本和URL。

腾讯云提供了多个与云计算相关的产品，其中与漂亮汤相对应的产品是腾讯云的Web+服务。Web+是一款全托管的Web应用托管平台，提供了简单、高效、安全的Web应用托管服务。您可以使用Web+来部署和管理Python应用程序，并通过Web+的控制台进行操作和监控。

更多关于腾讯云Web+的信息和产品介绍，请访问以下链接：

腾讯云Web+产品介绍

总结：漂亮汤是一个用于解析HTML和XML文档的Python库，可以通过标签名、属性、CSS选择器等方式来搜索和遍历文档树，从而提取所需的数据。腾讯云提供了Web+服务，用于全托管的Web应用托管，可以方便地部署和管理Python应用程序。

如何使用Beautiful从python代码中获得javascript函数的结果？

、、、、

我想从一个使用Python中的“美丽汤”的网站上抓取数据。网站根据用户的选择更改下拉菜单的值。在更改下拉菜单的值时没有api调用。仔细看一下，我注意到有一个javascript函数在内部调用，以获取下拉菜单的值。我的问题是下拉菜单的值不在页面源中。它们是通过调用js函数获得的，但是没有api调用，我不能请求那个值。有人能告诉我如何从python代码中调用javascript函数吗？我在用漂亮汤刮网。谢谢

浏览 7提问于2014-04-06得票数 1

回答已采纳

1回答

导入时出现Beautifulsoup错误

、

当我尝试导入漂亮的汤时，我得到了以下错误： Traceback (most recent call last): File "my_first_simple_script.py", line 2, in <module> from bs4 import BeautifulSoup ModuleNotFoundError: No module named 'bs4' 我尝试通过以下方式导入它:从bs4导入BeautifulSoup 我的python版本是3.6.1，并且漂亮的汤是：'beautifulsoup4==4.6.0‘ 我做

浏览 10提问于2017-06-19得票数 0

回答已采纳

2回答

化脓性加美汤

、

如何在py魅力中安装beautifulsoup4：单击“设置”，现在查找项目解释器。在这里，你可以通过点击屏幕右侧的绿色十字来添加漂亮的汤。我这样做是在py魅力，但在安装中出现了错误。错误信息是：回溯(最近一次调用)：文件"C:/Users/Rishi/PycharmProjects/untitled2/beautifuls.py"，第3行，从bs4导入BeautifulSoup文件“C：\Python34\lib\site-packages\bs4_init_..py”，第175行except Exception, e: ^ SyntaxError:无效语法

浏览 4提问于2016-07-15得票数 0

4回答

美丽的汤没有从网站上收集到一些数据

、、、、

我一直试图使用的漂亮汤来收集一些数据。但是，当我解析内容时，有些数据根本没有显示出来。这些数据字段在铬检查器中可见，但在“汤”中看不到。问题是，它们似乎不是文本元素。我认为它们是使用外部数据库提供的。我已经附上了下面的截图。还有其他方法可以刮掉这些数据吗？提前谢谢。谷歌检查员：美丽汤解析内容：

浏览 8提问于2021-02-12得票数 2

回答已采纳

3回答

无法从网站获取数据，因为URL在获取数据时不会更改，因此数据表为空

、、、

我刚刚开始使用python进行网络抓取。我使用了两个库来抓取:请求和漂亮的汤。我打开给定的URL，并在该页面上传递所需数据的日期间隔。当我按submit时，URL不会改变，但是数据在页面上。然后我就可以访问那个页面了。我就是这样访问这个网站的： r = requests.get("https://....... ") c = r.content soup = BeautifulSoup(c, "html.parser") 如果我想获取数据，我使用以下代码从存储数据的网站获取数据： all = soup.find_all("table", {

浏览 3提问于2017-02-20得票数 1

回答已采纳

2回答

我怎样才能从源码中卸载漂亮的汤？

、

我安装了extracting -3.2.0.tar.gz python setup.py install 从其中卸载它的命令是什么？我注意到有一个特定于linux发行版的包可用，它的名字叫python-beautifulsoup。我想安装系统特定的漂亮汤。我尝试过的： python setup.py uninstall

浏览 0提问于2012-01-30得票数 1

回答已采纳

1回答

使用python的Webscraping元素

、、、、

我目前正在使用漂亮的汤尝试和网络刮一个网站的数据，但是python模块正在阅读该页面的源代码。但是，在页面的源代码中，我所需要的信息并不存在，但是，如果我在chrome中右键单击页面并检查元素，它就是。我想知道python模块是否可以从网页中抓取元素，而不是源代码。在“美丽的汤”中，我试图搜索像这样的元素，但是它们没有出现或出现，因为它在源代码中搜索。我也不知道为什么或者为什么它不出现在那里。

浏览 2提问于2020-08-28得票数 0

回答已采纳

2回答

嵌套.xpath(@ attribute )给出了一个空的结果，如果某些标记没有该属性

、、

我正在用刮皮刮一个网站。有一个div列表，一些是显示，一些是显示块。我只想从显示块的div中获取数据。但是我无法从div获取样式属性。我还检查了堆栈溢出的解决方案 response.xpath("//div").xpath("@style").extract() 这给了我一个输出中的空白列表。它不是获取样式属性。或者我可以使用scrapy获得原始的HTML，然后在漂亮汤的帮助下从div获取样式属性？或者是如果我能得到字符串中的原始html，这也是有帮助的。我想要的只是它的风格。示例html :- <div class="asd">d

浏览 0提问于2018-04-27得票数 1

3回答

如何使用python解析ld+json

、、、

我一直在尝试一些网络抓取，我偶然发现了这个标签中的一些有趣的数据： <script type="application/ld+json"> 我已经能够用美丽的汤分离出那个标签 html = urlopen(url) soup = BeautifulSoup(html, "lxml") p = soup.find('script', {'type':'application/ld+json'}) print p 但是我还不能处理这些数据，也不能从那个标签中提取任何数据。如果我尝试使用正则表达式从其中获

浏览 2提问于2017-04-27得票数 9

1回答

安装Python和美观汤的问题

、、、

Answer marked below. It was two problems. I was missing a semicolon in the env var path, and the latest Beautiful Soup is incompatible with my python script. Using an older version allowed it to run. 我试图安装漂亮汤在Windows中使用"Setup.py安装“从一个CMD窗口。我知道下面的错误..。 Z:\Installers\beautifulsoup4-4.1.0>setup

浏览 2提问于2014-06-20得票数 0

回答已采纳

1回答

Python BeautifulSoup -展开所有<div>问题

、、

我对python很陌生，并且使用BeautifulSoup 从：中刮取数据。我能够在第一次战斗列表上预置所有我想要的操作，因为它在默认情况下是扩展的。但是，我在后面的列表中遇到了问题，因为我想要的数据隐藏在“div”的树中。在制作“汤”时，有没有办法在整个网页上扩展所有这些树？下面是我使用的当前代码行： headers = requests.utils.default_headers() headers.update({ 'User-Agent': 'Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:52.0)

浏览 0提问于2020-07-06得票数 0

2回答

我需要使用漂亮汤python从类标记中检索数据，而内部标记中没有数据。

、、

我需要使用ikman.lk漂亮汤 python库从“”检索数据。 <span class="t-small summary-count"> Showing 1-25 of 131 ads for <span>"Samsung Galaxy A5"</span>.</span> 我只需要得到“显示131个广告中的1-25”部分使用美丽汤库。我试过了 pgn = soup1.find("span", {"class": "t-small summary-count&#

浏览 0提问于2019-02-12得票数 0

1回答

我应该把python模块放在哪个目录中？

、

我是Python新手。我正试着装上漂亮的汤。到目前为止，我已经安装了pip。在美丽汤的网站上写着：首先，确保安装了必要的模块。在下面的示例中，我们使用了Beautiful 4，并在安装了Python2.7的系统上进行了请求。好吧，太好了-它要我把模块放在哪里？我是否将下载的项目放入python27 27/脚本？好的，接下来：安装BeautifulSoup和请求可以通过pip完成：以下是命令： $ pip install requests $ pip install beautifulsoup4 我假设我的代码将类似于python整数： >>>

浏览 3提问于2013-09-10得票数 0

回答已采纳

1回答

如何使用python-request获取js页面的标题？

、

我将此代码用于非JavaScript页面： session = HTMLSession() url = session.get("https://.......") spoon = BeautifulSoup(url.text, "html.parser") preTitle = spoon.find_all('title') preTitleStr = str(preTitle) a = preTitleStr.replace('<title>','') Title = a.replace('

浏览 103提问于2021-09-06得票数 0

2回答

使用python漂亮汤从oreilly媒体站点中提取图书名称

、、

我正在尝试从oreilly媒体网站上提取书名，使用python漂亮的汤。但是，我看到书名不在页面源html中。我正在使用这个链接查看书籍：附件是一个屏幕截图，显示的网页与前两本书与铬开发工具与箭头指向我想要提取的元素。我查看了页面源代码，但找不到书名--也许它们隐藏在主html中的其他链接中。我试图打开html中的一些链接，并搜索书名，但什么也找不到。是否可以使用美丽的汤从网站中提取第一或第二本书的名字？如果没有，还有其他的python包可以做到这一点吗？也许是硒？或者作为最后的手段.

浏览 10提问于2022-02-27得票数 0

回答已采纳

1回答

使用Python抓取Ajax

、、、、

我正在尝试获取这个网站的表中的数据，该表在页面加载后通过jquery更新(我有权限)：我目前使用selenium和漂亮汤来获取数据，但是因为这些数据在html源代码中不可见，所以我无法访问它。我尝试过PyQt4，但同样得不到更新后的html源代码。这些值在firebug和chrome developer中都是可见的，那么有没有python包可以利用它并将其提供给漂亮的汤呢？我不是一个庞大的技术人员，所以理想情况下，我想要一个解决方案，这将在Python或下一个最简单的软件类型。我知道我可以通过专有的“屏幕刮板”软件获得它，但那是昂贵的。

浏览 2提问于2012-05-04得票数 3

回答已采纳

1回答

如何在特定的google搜索python上获取所有urls

、、

因此，我试图创建一个程序，获取谷歌网页搜索中的所有urls，并按其在页面上的位置顺序返回所有urls的列表。因此，如果它是google搜索页面中“随机”的链接的顶部url，那么列表中应该返回的第一项应该是"“。这是因为它是你在google上随机搜索源代码时的第一个链接。我使用urllib3和re模块，因为我并不真正知道如何使用漂亮的汤或lxml，但是如果您可以在漂亮的汤和/或lxml中这样做，那也可以。到目前为止，这是我的代码： import urllib.request import re def find(start,end): urls = [] with

浏览 4提问于2018-03-08得票数 1

1回答

从我自己的页面解析HTML

、、

我已经构建了一个键盘快捷键:选择文本，然后按ctrl+alt+m -将文本灰显并将所选文本插入注释框中。但一旦刷新，灰色部分就消失了；如何将修改后的灰色文本保存回我的数据库？我想在用户提交评论时保存它。灰色部分是使用完成的。我似乎找不到一种方法来解析新的数据，而不使用漂亮汤，但美丽汤将要求我“获取与发出请求的URL相同的URL”。有没有更好的方法从我自己的页面获取数据？对其他可以达到类似结果的建议持开放态度。我在webapp2和jinja2中使用python。该页面的地址为：

浏览 0提问于2013-05-31得票数 0

回答已采纳

1回答

如何为学院安装漂亮的汤？

我安装了蟒蛇，并能使用jupyter笔记本以及熊猫。但我只是通过一个教程来做这件事。我该如何安装漂亮的汤？我要把这个放在命令提示符中吗？在jupyter笔记本里？我要打什么？作为一个包装，我要进口什么？我完全迷路了，谢谢我得到的错误是：(C:\Users\skull\Anaconda3\lib\site-packages\bs4_init_.py)：ImportError:无法从“bs4”导入名称“漂亮汤”

浏览 0提问于2020-09-29得票数 1

回答已采纳

1回答

在不改变地址Python/Selenium的情况下刮除动态加载的网站

、、、、

如果列表只在原始网站上单击之后才加载到div中，那么如何从< ul>标记中抓取列表呢？我尝试过使用Selenium来自动单击，但是由于它不会改变网站的https地址，所以我不知道如何获得这些加载的数据，否则这些数据会返回< ul>< /ul> with Beautiful汤。最终目标是在这个动态加载列表中获取大约400个< li>标记中的所有数据，直到单击按钮之后才能在检查工具中看到这些数据。网站是：手动单击“搜索”按钮后，将在< div>名称：下面加载所有适用位置的列表提前谢谢你！

浏览 5提问于2022-06-24得票数 0

1回答

不要从汤中获取数据

、、

我用python创建了bs4网络抓取应用程序。我的程序返回空列表以供审阅。因为汤程序正常运行。 from bs4 import BeautifulSoup import requests import pandas as pd data = [] usernames = [] titles = [] comments = [] result = requests.get('https://www.kupujemprodajem.com/review.php?action=list') soup = BeautifulSoup(result.text, 'html.

浏览 7提问于2021-12-10得票数 -1

2回答

用硒美汤寻找元素

、、、

一般来说，我对网络抓取和数据科学是个新手。根据不同的消息来源，美丽的汤比硒更快的抓取网页。我正在写一些在社交媒体评论中爬行的代码。我使用Selenium自动单击检索旧注释的按钮，并使用以下命令从注释中获取文本 driver.find_element_by_xpath() 我知道feature没有允许我直接输入xpath来查找元素的特性。在这种情况下，我是否应该摆脱对xpath的依赖，并尝试更轻松地使用可以由漂亮的汤使用的选择器呢？我的代码现在感觉非常笨重，需要几分钟的时间，尽管我只处理了大约120条评论。如果之前有人问过这个问题，我很抱歉；我在网站上找不到它。谢谢!

浏览 18提问于2019-07-24得票数 0

回答已采纳

1回答

Python BeautifulSoup:相当于浏览器node.innerText

、、、、

我一直在尝试使用pythons漂亮的汤库从一个爬行的网站中提取一些数据。我发现搜索一个节点并在其上使用.text来获取其内容是可行的，但不知何故会弄乱格式，字符串也不会像在网页上那样被格式化。我发现有一种在浏览器中使用.innerText的方法，它返回一个由一些html文本组成的字符串，就像用户复制粘贴它一样。在python中有没有等价物，或者我真的需要在浏览器中运行它？

浏览 38提问于2020-11-04得票数 0

1回答

使用python打开url的时间要求出现问题

、

我设计了一个python程序，它将打开一个url并从该url获取数据，比如电子邮件和数字。主要的问题是它非常慢，我想知道是否有一种方法来提高从url获取数据的速度。一些规格：程序在python里。我使用url 2打开url 寻觅取美汤 opener = urllib2.build_opener() opener.addheaders =(‘User’，'Mozilla/5.0') with open('Labgodata.csv') as csvfile: reader = csv.DictReader(csvf

浏览 1提问于2016-07-17得票数 0

1回答

如何访问python标准库文件？

、

不久之前，我才开始学习python，我希望更多地了解我导入的模块的功能和方法是如何工作的。我希望python库类似于javascript框架--在这里，我可以进入一个导入的文件，查看构建框架/模块的实际代码。但是当我在python子目录中搜索时，我发现模块是.lib格式的。那么，标准库模块是实际的python代码，我可以以某种方式检查它的功能吗？或者它们太深，我无法像这样研究它们？顺便提一句，对于非标准的图书馆进口，也就是漂亮汤，同样的规则会适用吗？我希望通过查看代码来了解webscraping是如何从底层抓取的。谢谢

浏览 1提问于2014-07-02得票数 3

回答已采纳

1回答

无法在python中导入漂亮的汤

、、、

我使用的是Python.7.10，并且已经使用pip安装了漂亮的汤。程序包已成功安装。但是当我尝试导入漂亮的汤时，我得到了这个错误： ImportError: No module named beautifulsoup 我检查了我的已安装模块列表，在已安装模块列表中找到了漂亮的汤模块：

浏览 0提问于2016-02-16得票数 3

回答已采纳

2回答

BeautifulSoup4不能安装在python3.5中的Windows7上

、、、、

我已经从下载了漂亮的Soup4-4.5.3.tar.gz，并将其解压缩到我的python工作目录(即而不是，我的python目录)。但是，当我跑的时候 from bs4 import BeautifulSoup 在我闲着的时候，错误信息突然出现： >>> from bs4 import BeautifulSoup Traceback (most recent call last): File "<pyshell#6>", line 1, in <module> from bs4 import BeautifulSoup File &#

浏览 0提问于2017-05-05得票数 5

1回答

美汤的安装

、、

我正在使用Python 2.7.13 我使用命令提示符安装了美观汤：easy_install beautifulsoup4，我收到了带有best match', 'downloading ..... etc ++和最后一个error:None的消息。然而，当运行一个脚本时，它说 from BeautifulSoup import * 我收到了错误信息 ImportError: No module named BeautifulSoup error: None是否意味着它已正确安装当你安装beautifulsoup时，它实际上是做什么的，它会永远存在吗？每次使用Pyt

浏览 1提问于2017-01-03得票数 1

3回答

如何测试是否成功安装了Python模块？

、、

我试着安装了漂亮的汤。我得到这样一个错误： <-- snip --> raise MissingSectionHeaderError(fpname, lineno, line) ConfigParser.MissingSectionHeaderError: File contains no section headers. file: /Users/Sam/.pydistutils.cfg, line: 1 'install_lib = ~/Library/Python/$py_version_short/site-packages\n' 当我通过：：！Python

浏览 1提问于2009-01-16得票数 3

回答已采纳

1回答

如何在没有分页请求和美观的情况下抓取页面？

、、

我正在抓取web (使用Python请求和漂亮的汤)，我需要浏览项目列表中的所有页面，但我需要单击下一页，到目前为止，代码只返回代码中的第50行 import pandas as pd import requests from bs4 import BeautifulSoup url = 'http://sistemas.anatel.gov.br/se/public/view/b/licenciamento' antenas = requests.get(url) if antenas.status_code == 200: print('Requisição be

浏览 2提问于2021-02-23得票数 0

3回答

清单和位置python

我需要编写一个函数，该函数从列表中的一个单词中获取一个位置列表，并与前面/后面的单词一起打印单词本身。因此，例如2、4、7需要打印：樱桃香蕉汤香蕉汤咖啡水香蕉糖因为“香蕉”出现在第2，4，7位置。 # my code positions = [2, 4, 7] list = ['apple', 'cherry', 'banana', 'soup', 'banana', 'coffee', 'water', 'banana', 'sugar']

浏览 3提问于2021-11-05得票数 1

1回答

Python刮W/O漂亮汤还是非默认模块？

、、

我对web抓取非常陌生，以前只使用Python来使自己成为一个使用套接字的IRC，等等。我想对我的IRC做的是让客户从我使用创建的一个免费博客中获取一个IP或IP列表。因此，自然，我需要做一些网络抓取，以获得这些信息。问题是，我如何做到这一点，而不要求一个客户端下载这个必须安装加载项，如美丽汤，以使它工作？问题摘要：需要在不使用第三方模块的情况下从网页中获取一些数据。我已经做了很多谷歌，但只有找到解决方案使用美丽汤。(即使是这样，也很难理解)

浏览 5提问于2013-09-08得票数 2

回答已采纳

2回答

漂亮的汤和机械化获得ajax调用结果

、、、、

嗨，我用python2.5和漂亮的汤构建了一个刮板，但我遇到了一个问题……部分网页是在用户单击某个按钮后生成的，这些按钮通过使用适当的参数调用特定的javacsript函数来启动ajax请求有没有办法模拟用户交互并得到这样的结果？我遇到了一个机械化模块，但在我看来，它主要是用来处理表单的…… 我将感谢任何链接或一些代码样本，谢谢

浏览 0提问于2010-04-10得票数 4

回答已采纳

1回答

使用Python的Webscrape容器

、、、

我正在尝试从这个网页上的容器中抓取内容：我通常使用漂亮的汤进行网络抓取，但在这种情况下，我发现它并不适用于这个网站。当我运行我的“汤”时，我只得到网站架构的细节，而不是网站上可用的容器中的内容。 page_link = 'check24.de/handytarife/vergleich?activeForm=sim' page_response = requests.get(page_link, timeout=5, verify=False, headers={'User-Agent': 'Mozilla/5.0'}) soup = Be

浏览 1提问于2018-10-31得票数 1

回答已采纳

1回答

页面源HTML与漂亮的soup检索到的HTML不一致

、、、

我正在尝试从IMDB抓取电影信息。在大多数情况下，它是有效的，但对于一些电影，标题是不同的HTML检索美丽的汤，然后是火狐显示的源代码。例如，当在IMDB中搜索witch时，我会得到这个页面：所以我搜索电影，然后用下面这行代码得到电影的URL： page = urlopen(url) soup = BeautifulSoup(page, 'html.parser') movieLink = soup.find('a', text = movieTitle)['href'] imdbLink = 'http://www.imdb.com

浏览 1提问于2017-06-13得票数 2

1回答

你能在BeautifulSoup找到汤的父级吗？

、、

我正在用python的漂亮汤工作，我正在做一个取回我的学校时间表的项目。这是个写得不好的网站。它是一个HTML表，每个单元格都包含另一个表。在那张桌子里，有数据。没有id或类。我成功地获得了我需要的所有表的列表，但是在表的父表中只有一个值(rowspan)，我无法访问这些值，但我仍然需要。当你真的有完整的来源躺在周围的时候，你能检查一下汤的父母吗？页： <td colspan="12" rowspan="4" align="center"> <table> <tr><td&g

浏览 2提问于2021-03-03得票数 0

回答已采纳

1回答

刮破的汤和漂亮的汤有什么区别？

我读过刮痕是一个网络爬行工具和美丽的汤是一个图书馆的刮痕。但我的朋友说，这两者是不同的，我们可以完成相同的任务，在美丽的汤，这是通过刮擦。我朋友的观点是真的吗？我也怀疑美丽的汤是刮刮的一部分，还是另一种？请告诉我

浏览 1提问于2015-02-25得票数 2

回答已采纳

1回答

BS4导入在eclipse中不起作用

、

我是python的新手。我想在eclipse中运行python脚本，因为我对此有点适应。我正在尝试导入和运行美丽汤在eclipse oxygen.Import是成功的，但我得到一个错误(未解决的导入汤)与以下code.However美丽汤是工作良好与anaconda.enter图像描述在这里从bs4导入BeautifulSoup as soup

浏览 4提问于2017-12-11得票数 0

1回答

从使用Ajax请求的网站抓取数据

、、、、

到目前为止，我已经做了一个从网站上抓取数据的程序，我用python、selenium和美丽汤制作了一个程序，当它想从像这样的网站的页面中刮取数据时，我必须点击一个名为"سابقه“的选项卡(顶部是سابقه)，然后网站使用Ajax请求获取数据，然后我循环遍历表，表有多个页面，所以我必须点击表下面的数字，然后再收集新的数据。我的问题是这个方法非常慢，因为我还必须从500页中收集数据，每页包含35个表。还有其他更快的方法吗?或者，如果解决方案在python中，那么在我的程序中激发Ajax请求并获得response.It的方法会更好。

浏览 3提问于2017-12-15得票数 0

回答已采纳

1回答

返回RSS的所有页面

、、

我正在使用python从rss页面抓取xml。我正在使用漂亮的汤来解析xml。输入是rss页面，例如，可以在上找到。我使用了几个与上面的链接格式类似的博客，每个博客的xml都可以在/feeds/posts/default?alt=rss中找到每个URL的数据使用urllib2下载并保存在变量xml中然后，我的python代码使用漂亮的方法来解析xml。 bs = BeautifulSoup(xml) items = bs.rss.channel.findAll("item") print len(items) #returns 25 for any site 我相信我只

浏览 0提问于2014-12-04得票数 0

2回答

使用python从.docx文件中提取特定的表和图像

、、

我正在尝试从word文档中提取一个特定的表格，该表格紧跟在标题“缩写列表”之后，并在.docx文件中紧跟在标题“图形研究”之后的图像。我已经能够使用python-docx代码提取标题，但是如何使用标题或它们的位置解析文档来检索图像和我正在使用if re.match("Graphical", img.previous_sibling.text)搜索图像的table.In美汤。我的python docx代码是： from docx import * document = Document('data/p21.docx') document.save('t

浏览 49提问于2020-07-16得票数 0

1回答

如何使用asp.net读取BeautifulSoup页面？

、、、、

我正试着用漂亮的汤从网页上抓取一些数据。当我试图将HTML文档转换为一个漂亮的汤对象时，我遇到了一些问题。当我运行代码时 soup = BeautifulSoup(html_doc) 我得到的错误消息是： SyntaxError: Non-ASCII character '\xa9' in file C:/Users/mlee/PycharmProjects/BsTest/htmlparse.py on line 683, but no encoding declared; see http://python.org/dev/peps/pep-0263/ for

浏览 4提问于2015-06-10得票数 1

回答已采纳

1回答

无法导入安装了所有包的漂亮汤

、、

我也在我的笔记本电脑上安装了蟒蛇。所以它给了我这条信息 (C:\Users\jinfe\anaconda3\lib\site-packages\bs4_init_.py) ImportError:无法从“bs4”导入名称“美丽汤”

浏览 3提问于2022-02-08得票数 -1

2回答

使用漂亮汤从脚本标记中抓取数据

、

我是一个python美容汤库的新手，我正在尝试从一个网站的highcharts中抓取数据。我发现我需要的所有数据都位于一个脚本标签中，但是我不知道如何抓取它们(请参见附件)有没有办法使用python漂亮的script从这个脚本标签中获取数据？

浏览 32提问于2020-07-07得票数 1

回答已采纳

2回答

无法输入世界人口数字('https://countrymeters.info/en')‘

、

我试图从网站的中导入世界人口数据，但无法使用Python导入感谢和非常感谢帮助！

浏览 10提问于2022-06-02得票数 0

回答已采纳

1回答

构建类似于Python的Jon's的声誉跟踪器

Jon有以下，它是由C#构建的。我有兴趣用Python构建一个类似的应用程序，这样至少可以使用以下模块美汤违约我们显然需要从“”网站解析Bautiful汤的声誉通过defaultdict存储数据 --你怎么能建立一个类似琼恩的声誉系统呢？

浏览 3提问于2009-07-22得票数 1

回答已采纳

2回答

python3.4中的漂亮汤不能在pycharm中使用

、、

我使用的是ubuntu14.0LTS和pycharm IDE，如何下载和安装美汤，并将美汤库添加到pycharm中。我试着使用pip install，它不工作。

浏览 0提问于2014-07-18得票数 2

1回答

用JS流行Python刮取数据

、、

我想知道，我们能否从使用Python生成的页面上弹出的弹出中刮取特定字段的数据？如果是，请建议。我试图刮它，但它没有被发现，并返回给我一个空的名单。我正在用Python和美丽的汤来做这项工作。

浏览 5提问于2017-02-10得票数 0

2回答

如何在Python中使用VPN进行VPN抓取？

、、、、

我已经做了一个Python程序，它用美丽的汤在网上抓取IMDB，以制作一个mySQL数据库，里面有不同类别中所有收视率最高的电影的表。到目前一切尚好。我的问题是，我是在挪威做这件事的，而且很多电影片名都被翻译成了挪威语。例如，在从挪威IP地址打开的IMDB的顶部列表中，"The Shawshank Redemption“被翻译为"Frihetens Regn”。我希望所有的标题都是英文的。也许有一些免费的VPN，你可以从Python中激活，并与Beautifulsoup一起工作？或者有没有人有其他的解决方案？

浏览 197提问于2019-12-28得票数 2

回答已采纳

2回答

在数据库中搜索Mysql

、、、

有数据表Programmer和Lang Programmer行：ProjectID，Person Lang行：Id，name 在编程器中有数据: 1，John；3，Mike；2，汤米在Lang有: 1，Java；2，C#；3，Python 如何获得像这样的数据：爪哇约翰 C#迈克 Python汤米使用Mysql和PHP，我不知道。

浏览 3提问于2012-07-12得票数 1

回答已采纳