Python Beautiful Soup解压src时出错_尝试使用Request和Beautiful Soup获取奇怪字符时出错_使用python解压.Z文件时出错 - 腾讯云开发者社区

python、html、beautifulsoup

我正在努力学习美汤。我使用下面的网址来学习。当我尝试运行代码时，我得到下面的错误。 FileNotFoundError: [Errno 2] No such file or directory: 'what_is_beautiful_soup_in_python-Google_Search.html' Python模块和HTML文件都保存在同一个文件夹中。文件名= what_is_beautiful_soup_in_python-Google_Search谁能帮我解决这个问题？ from bs4 import BeautifulSoup soup = BeautifulSo

浏览 24提问于2020-03-11得票数 1

1回答

使用python下载CSS和JS

python、web-scraping、beautifulsoup、python-requests

我想使用python下载web的内容(CSS和JS，可能还有HTML)。我如何下载它们而不是将它们的名字打印在文本文件中？到目前为止这是我的代码 import requests from bs4 import BeautifulSoup as bs from urllib.parse import urljoin # URL of the web page you want to extract url = "http://books.toscrape.com" # initialize a session session = requests.Session() #

浏览 3提问于2022-04-08得票数 1

回答已采纳

2回答

有没有办法使用Selenium of Beautiful Soup得到2015-2020年间每年1月份的“这个家”的Z值？

python、selenium、selenium-webdriver、web-scraping、beautifulsoup

从下面的链接中，我希望能够抓取数据。然而，当我使用Beautiful Soup时，我在html中找不到它，并且Beautiful soup不起作用。此外，我想也许我可以使用selenium来抓取这些数据，但我也找不到这些内容。你知道我会如何使用selenium或Beautiful Soup来获得2015-2020年间每年1月的“这个家”的Z估计值吗？提前感谢您的帮助。我正在使用Python。

浏览 0提问于2020-08-17得票数 1

1回答

如何将特定链接存储为列表，然后单击它们

python、html、list、matrix、web-scraping

我一直在关注一个关于如何通过网络抓取网页http://kanview.ks.gov/PayRates/PayRates的教程。纪念碑可以在这里找到：https://medium.freecodecamp.org/better-web-scraping-in-python-with-selenium-beautiful-soup-and-pandas-d6390592e251。这个网站的布局类似于我想获取信息的网站：https://www.giiresearch.com/topics/TL11.shtml。我唯一的问题是giiresearch网站上的报告标题链接没有按照时间顺序排列，例如。以下

浏览 28提问于2019-03-25得票数 1

1回答

如何处理美汤4中的<br> </br>和<br/>？

python、html、parsing、web-scraping、beautifulsoup

我正在尝试使用python和Beautiful Soup4来替换一些html中的每一个换行标记。文档中有<br>、<br/>和</br>标签，但由于Beautiful Soup处理标签的方式，每当它找到一个<br>时，它就会删除它与它看到的下一个</br>之间的所有内容。有什么办法可以解决这个问题吗？

浏览 3提问于2014-12-19得票数 1

1回答

BeautifulSoup HTMLParseError.这有什么问题吗？

python、beautifulsoup

这是我的代码： from bs4 import BeautifulSoup as BS import urllib2 url = "http://services.runescape.com/m=news/recruit-a-friend-for-free-membership-and-xp" res = urllib2.urlopen(url) soup = BS(res.read()) other_content = soup.find_all('div',{'class':'Content'})[0] print other

浏览 3提问于2012-12-20得票数 4

回答已采纳

1回答

使用BeautifulSoup在网页上查找特定文本

python、html、python-3.x、web-scraping、beautifulsoup

我正在尝试保存一个使用Python 3和Beautiful Soup 4的网站上的电影列表。问题是，我对Python和BS非常陌生，我真的不知道从哪里开始。网站是，电影列表紧跟在“过去的电影：”之后。我不知道如何提取那块数据。我一直在谷歌搜索，似乎Beautiful Soup在试图查找标签时效果最好，但我只需要它来找到一个文本列表，而不是在任何特定的标签中(该网站不是专业设计的)。有没有办法让Beautiful Soup和Python提取“过去的电影：”和“对于我们播放过的电影的完整列表，请点击这里”之间的文本？

浏览 3提问于2016-05-12得票数 6

回答已采纳

1回答

Python 3.6美丽的汤-在Web抓取过程中获取嵌入式视频URL的麻烦

python、web-scraping、beautifulsoup、python-requests、embedded-video

我正在尝试抓取一个网页，并使用Python3.6中的Beautiful Soup和requests模块检索网页上嵌入的视频的URL。当我在Chrome中查看网页上的超文本标记语言时，我可以看到视频的.mp4链接。但是当我使用requests和Beautiful Soup获取页面时，我找不到"video“节点。我知道视频窗口是一个嵌套的HTML文档。特别是，我想要抓取这个网页- http://videolectures.net/icml2015_liang_language_understanding/，并使用Beautiful Soup和requests模块获得视频链接- http:

浏览 25提问于2020-08-26得票数 4

2回答

Python中的递归与美汤

python、html、beautifulsoup、tail-recursion

所以我可能只是在这里装傻，不了解python的基本机制，但我正在尝试浏览和爬行一个网页，然后获得一个新的链接并递归地继续。 def go_to_next_page(soup, data, curr_link): print "Curr Link: " + curr_link # gather information and append to data new_link = "" # unless I find link with Beautiful Soup if new_link is not "":

浏览 0提问于2013-07-26得票数 1

3回答

python:使用BeautifulSoup的谷歌搜索抓取器

python、screen-scraping、web-scraping、beautifulsoup、urllib

目标:传递一个搜索字符串到google上搜索，然后抓取url，title和小的描述，与url标题一起发布。我有以下代码，目前我的代码只给出前10个结果，这是谷歌对一个页面的默认限制。我不确定在网络抓取过程中如何真正处理分页。此外，当我查看实际的页面结果和打印出来的内容时，也会出现差异。我也不确定解析span元素的最佳方法是什么。到目前为止，我的跨度如下所示，我想删除<em>元素并连接其余的stings。最好的方法是什么？ <span class="st">The <em>Beautiful Soup</em> Theater

浏览 1提问于2012-07-17得票数 6

1回答

用漂亮汤中的Python字典修改HTML元素

python、django、beautifulsoup

当我尝试使用Beatiful和Python字典修改NoneType元素时，我得到的‘’对象不支持项分配。这是一个程序，它将从一个模板创建一个HTML文件。要更改的值是从表单中的用户接收的。这是我现在的代码 data = { 'banner-url': ['src', request.POST.get('banner_url')], 'banner-link': ['href', request.POST.get('banner_link')],

浏览 0提问于2019-09-12得票数 0

回答已采纳

1回答

查找表类Python

python、web-scraping、beautifulsoup

我在使用python/Beautiful Soup进行网络搜索时，找不到桌子 import requests from bs4 import BeautifulSoup url = 'https://www.espn.com/nba/player/gamelog/_/id/3907387/ben-simmons' page = requests.get(url) soup = BeautifulSoup(page.content, 'html.parser') t = soup.find_all('table' , class_='T

浏览 7提问于2020-03-09得票数 0

2回答

美丽的汤找不到线

python、html-parsing、beautifulsoup

在解析http://en.wikipedia.org/wiki/Israel时，我遇到一个包含文本的H2标记，但Beautiful Soup为它返回了一个None类型： $ python Python 2.7.3 (default, Apr 10 2013, 05:13:16) [GCC 4.7.2] on linux2 Type "help", "copyright", "credits" or "license" for more information. >>> import bs4 >>>

浏览 0提问于2013-08-30得票数 2

2回答

出现错误的BeautifulSoup响应

python、html、beautifulsoup、html-parsing

我正试着用废话把我的脚弄湿。我试着用自己的方式浏览文档，但在第一步我就遇到了一个问题。这是我的代码： from bs4 import BeautifulSoup soup = BeautifulSoup('https://api.flickr.com/services/rest/?method=flickr.photos.search&api_key=5....1b&per_page=250&accuracy=1&has_geo=1&extras=geo,tags,views,description') print(soup.pret

浏览 0提问于2014-07-16得票数 11

回答已采纳

2回答

刮擦可见文本

python、web-scraping、beautifulsoup、urllib2

我是一个绝对的新手领域的网页刮和现在，我想从一个网页上提取可见的文本。我在网上发现了一段代码： import urllib2 from bs4 import BeautifulSoup url = "http://www.espncricinfo.com/" web_page = urllib2.urlopen(url) soup = BeautifulSoup(url , "lxml") print (soup.prettify()) 对于上面的代码，我得到以下结果： /usr/local/lib/python2.7/site-packages/b

浏览 2提问于2016-11-12得票数 0

回答已采纳

1回答

我能用selenium webdriver读取浏览器的url吗？

python、selenium、beautifulsoup、selenium-webdriver

我在beautiful Soup4 and Selenium webdriver中使用python2.7。现在，在我的webautomation脚本中，我将打开链接或URL并进入主页。现在我需要单击一些anchor Labels来浏览其他页面。我到目前为止都是这样做的。现在，当我要转到一个新页面时，我需要从浏览器获取新的URL，因为我需要传递用于网页抓取的Beautiful Soup4。所以现在我关心的是如何以动态的方式获得这样的URL？如果有建议，请多多指教！

浏览 0提问于2013-01-05得票数 8

回答已采纳

1回答

heroku上的美味汤？

python、django、heroku、beautifulsoup、virtualenv

我试图在heroku上使用Beautiful soup部署一个应用程序，并运行一个类似"python manage.py“的命令。我的命令使用Beautiful soup库。虽然这个命令在我的本地机器上工作得很好，但它在heroku上找不到漂亮的soup模块。我试着用pip install漂亮汤安装它，然后将它添加到需求文件中，并使用git推送更新。但是它仍然找不到漂亮的soup模块。我知道这有点具体，而且我对heroku，django还是个新手。我不确定如何调试它？有人能给我指引正确的方向吗？

浏览 2提问于2012-11-08得票数 1

2回答

打印不带标签的h1标题

python、beautifulsoup

使用Beautiful Soup4，我尝试打印不带标签的h1内容。我使用的是python 3.6和Beautiful Soup 4。 from urllib.request import urlopen from bs4 import BeautifulSoup html = urlopen('https:/place_holder.com/') bs = BeautifulSoup(html.read(), 'html.parser') headings = bs.find_all('h1')

浏览 6提问于2019-08-09得票数 0

1回答

如何将javascript值从网页加载到python中？

javascript、python-3.x

当我检查网页上的代码时，我可以看到html和javascript。我已经使用Beautiful Soup来导入和解析html，但是有一大段是用javascript编写的，它从可编程逻辑控制器(PLC)中提取变量。在我用Beautiful Soup加载和解析之后，我找不到python中的数据--只有html代码。 PLC正在被网页直接读取，我看到实时值在我面前更新，但我不能直接导入它们。屏幕截图显示的是inspect窗口中的代码。假设我想用class="on"属性导入变量id="aout7"，我该怎么做呢？

浏览 3提问于2019-03-13得票数 0

4回答

Ruby的美丽汤最接近的等价物是什么？

python、ruby、beautifulsoup

我喜欢Python中的Beautiful Soup抓取库。它就是这样的。在Ruby中有类似的东西吗？

浏览 9提问于2009-03-12得票数 15

回答已采纳

1回答

使用漂亮汤和输出错误进行JSONdata解析

python、json、python-requests

当我运行以下代码时，会产生以下错误： import requests import json from bs4 import BeautifulSoup JSONDATA = requests.request("GET", "https://thisiscriminal.com/wp-json/criminal/v1/episodes?posts=1000000&page=1") JSONDATA = JSONDATA.json() for line in JSONDATA['posts']: soup = Beautiful

浏览 52提问于2019-06-10得票数 0

回答已采纳

2回答

Beautiful Soup的extract()出错

python、beautifulsoup

我正在开发一些屏幕抓取软件，遇到了美汤的问题。我使用的是python 2.4.3和Beautiful Soup 3.0.7a。我需要删除一个<hr>标记，但它可以有许多不同的属性，所以简单的replace()调用不会删除它。给定以下html： <h1>foo</h1> <h2><hr/>bar</h2> 和以下代码： soup = BeautifulSoup(string) bad_tags = soup.findAll('hr'); [tag.extract() for tag in bad_tag

浏览 0提问于2009-05-12得票数 0

回答已采纳

2回答

使用Beautiful Soup获取源代码中的完整URL

python

我正在看一些源代码，我偶然发现了这段代码 <img src="/gallery/2012-winners-finalists/HM_Watching%20birds2_Shane%20Conklin_MA_2012.jpg" 现在在源代码中的链接是蓝色的，当你点击它时，它会带你到图片所在的完整URL，我知道如何使用Beautiful Soup在Python中获取源代码中显示的内容我想知道如何获得一旦单击源代码中的链接后获得的完整URL？编辑:如果我得到了<a href = "/folder/big/a.jpg"，你如何通过python或漂亮的汤找出

浏览 1提问于2013-07-31得票数 10

1回答

用Python中的Selenium，美观汤刮光盒覆盖

python、selenium、beautifulsoup

我有一点困难，让我的代码，以解决问题。我正在尝试使用selenium、漂亮的汤和python来抓取覆盖层或灯箱的内容。我不太清楚覆盖是如何创建的，但我认为它的ajax 当我运行下面的python2.7代码时，火狐浏览器打开，导航到页面，点击正确的链接并显示覆盖到用户，我可以检查它的标签和标记使用火狐，但我不知道如何让python访问覆盖。这位新手若能提供任何帮助，将不胜感激。 #Import the beautiful soup library from bs4 import BeautifulSoup # import urllib2 library to actually go get

浏览 1提问于2015-11-24得票数 3

回答已采纳

3回答

美丽的汤在使用get_text ()后不能使用

python、beautifulsoup

我正在做网络抓取，我只想从任何网站的文本，所以我使用的Beautiful Soup。最初，我发现get_text()方法也返回了JavaScript代码，因此为了避免遇到应该使用extract()方法的问题，现在我遇到了一个奇怪的问题，在提取script和style标记之后，Beautiful Soup甚至在新的` `html中都无法识别它的主体。我先说清楚我在做这件事 soup = BeautifulSoup(HTMLRawData, 'html.parser') print(soup.body) 在这里，print语句打印了所有的html数据，但当我这样做时 soup =

浏览 20提问于2015-07-05得票数 3

回答已采纳

3回答

BeautifulSoup4 :文本中的符号

python、html、python-2.7、beautifulsoup

我很难用BeautifulSoup4.(我是个十足的Python/BeautifulSoup新手，所以如果我笨的话，请原谅我) 为什么下面的代码： from bs4 import BeautifulSoup soup_ko = BeautifulSoup('<select><option>foo</option><option>bar & baz</option><option>qux</option></select>') soup_ok = BeautifulSoup(

浏览 3提问于2013-06-05得票数 1

回答已采纳

1回答

Django & Python单元测试-查找Div类

python、django、unit-testing、beautifulsoup

我正在用python编写一个测试，首先，使用Beautiful Soup，我想通过查找某个Div:Class来检查它是否转到了一个特定的页面。我的测试中的代码行是： soup = BeautifulSoup(response.content) check_tag = len(soup.findAll('div', {'class': 'booking-test'})) self.assertEqual(check_tag, 1) 当我运行测试时，它返回失败消息： self.assertEqual(check_tag, 1

浏览 0提问于2013-10-07得票数 0

2回答

使用BeautifulSoup解析并获取全文结果

python、beautifulsoup

我完全是新手，我从BeautifulSoup和Python开始，我想在全文中得到一个结果，而不需要任何HTML标记或其他不是文本的元素。有关信息，我使用HTML5文档。我做了这个： #!/usr/bin/env python import urllib2 from bs4 import BeautifulSoup html_content = urllib2.urlopen("http://www.demo.com/index.html") soup = BeautifulSoup(html_content, "lxml") # Synthax fo

浏览 4提问于2014-09-25得票数 0

回答已采纳

1回答

美丽汤解码错误

python、html、beautifulsoup

我是在一个工作，我需要解析一个美丽的汤网站。这个站点是的，但是当我尝试在HTML码的元代码中查看站点的编码时，什么也没有出现。我试图在本地解析HTML，并下载了网页，但我遇到了一些解码错误： # manta web page downloaded before html = open('1.html', 'r') soup = BeautifulSoup(html, 'lxml') 这将生成以下堆栈跟踪： Traceback (most recent call last): File "E:/Projects/Python/webki

浏览 1提问于2013-09-24得票数 0

1回答

嵌入式视频获取url

python、video、kodi

好吧，我已经在这个问题上挠头太久了。我正在尝试使用Beautiful Soup和Python 2.7.6中的requests模块来检索网页上嵌入的视频的url。我检查了chrome中的html，我可以看到视频的url，但是当我使用request和Beautiful Soup获得页面时，我找不到" video“节点。从源代码上看，视频窗口看起来像是一个嵌套的html文档。我已经找遍了，也找不到为什么我找不到这个。如果有人能给我指出正确的方向，我将不胜感激。谢谢。以下是其中一个视频的url：我看到有人回答了同样的问题，有人能帮帮我吗？

浏览 0提问于2016-11-16得票数 0

2回答

Python -无法在mac上安装模块

python、module、installation

我已经下载了Beautiful Soup 4.3.2并将CD放到了我磁盘上的正确位置。当我使用'python setup.py install‘时，运行了大量的代码行，但是我得到了这个问题：错误:无法创建'/Library/Python/2.7/site-packages/bs4'：权限被拒绝有人知道这是为什么吗？非常感谢!

浏览 2提问于2015-06-11得票数 0

1回答

如何使用多重处理从漂亮汤网页中提取链接？

python、beautifulsoup、python-multiprocessing

我有一个链接列表，我为每个链接创建一个美丽的Soup对象，并从页面的段落标记中刮掉所有的链接。因为我有数以百计的链接我想要从，一个单一的进程将花费更多的时间比我想要的，所以多处理似乎是理想的解决方案。这是我的密码： import requests from bs4 import BeautifulSoup from multiprocessing import Process, Queue urls = ['https://hbr.org/2011/05/the-case-for-executive-assistants','https://signalvnoise

浏览 6提问于2015-08-26得票数 0

回答已采纳

1回答

Python 2.7:如何分离提取的文本？

python、python-2.7、csv、beautifulsoup

我正在使用Python2.7和Beautiful soup从URL中获取一些文本，但我希望在每一行中分隔提取的文本。这就是我从URL中提取文本并将输出放入CSV文件的方法： # import libraries import csv import urllib2 from bs4 import BeautifulSoup # specify the url url = 'http://www.bkfrem.dk/default.asp?id=19' # query the website and return the html to the variable â€˜pag

浏览 3提问于2018-02-11得票数 0

回答已采纳

6回答

使用Beautiful Soup按类名获取内容

python、beautifulsoup

使用Beautiful Soup模块，如何获取类名为feeditemcontent cxfeeditemcontent的div标记的数据？是不是： soup.class['feeditemcontent cxfeeditemcontent'] 或者： soup.find_all('class') 这是HTML源代码： <div class="feeditemcontent cxfeeditemcontent"> <div class="feeditembodyandfooter">

浏览 5提问于2012-07-04得票数 16

回答已采纳

2回答

在带有Beautiful的python解析中使用xml数据的理想方法是什么？

python、html、xml、parsing、beautifulsoup

在用Beautiful解析python时，将xml转换为文本的理想方法是什么？当我使用Python2.7 BeautifulSoup库进行html解析时，我可以进入"soup“的步骤，但是我不知道如何提取所需的数据，所以我尝试将它们全部转换为string。在下面的示例中，我希望提取span标记中的所有数字并将它们相加。有更好的办法吗？ XML数据：代码： import urllib2 from BeautifulSoup import * import re url = 'http://python-data.dr-chuck.net/comments_324255.

浏览 2提问于2017-01-19得票数 0

2回答

如果要用python抓取图像，如何在Python中选择<div data- image =‘.“”>

python、html、css、beautifulsoup

我正在使用Python从一个网站上抓取一些图片。来自该网站的所有图像都使用<div data-image="https://......">进行存储。如何使用Python(Beautiful Soup 4)下载图片？非常感谢!

浏览 36提问于2020-08-12得票数 0

1回答

调用tag.string时出现BeautifulSoup递归错误

python、beautifulsoup

这是一个非常奇怪的错误，我似乎找不到。 import urllib2 from bs4 import BeautifulSoup url = 'http://www.crummy.com/software/BeautifulSoup/bs4/doc/' soup = BeautifulSoup(urllib2.urlopen(url)) print soup.title 这将返回 <title>Beautiful Soup Documentation â€” Beautiful Soup 4.0.0 documentation</title> 正如预

浏览 0提问于2012-12-20得票数 1

1回答

XBMC中包含哪个美汤版本？

python、beautifulsoup、xbmc

我正在尝试用Python结合XBMC来做一些网站抓取。当我查看Beautiful Soup的网站时，它的最新版本是版本4。当我查看XBMC时，它显示为版本3.2.0 ()。现在有没有人知道XBMC中使用的是哪个版本？

浏览 0提问于2013-09-25得票数 0

4回答

BeautifulSoup不能解析网页吗？

python、parsing、beautifulsoup

我现在正在使用漂亮的汤来解析网页，我听说它很有名，也很好，但它似乎不能正常工作。下面是我所做的 import urllib2 from bs4 import BeautifulSoup page = urllib2.urlopen("http://www.cnn.com/2012/10/14/us/skydiver-record-attempt/index.html?hpt=hp_t1") soup = BeautifulSoup(page) print soup.prettify() 我认为这是一种简单的方式。我打开网页，把它传给漂亮的汤。但这是我得到的： Warning

浏览 0提问于2012-10-15得票数 5

回答已采纳

2回答

美汤找不到桌子

python、beautifulsoup

我正在尝试用Python和Beautiful Soup从网页上的一个表格中收集一些数据。然而，当我从页面中进行选择时，我得到的结果与在浏览器中得到的结果不同。具体地说，这些表完全缺失。以下是Firefox开发工具检查器中表格的屏幕截图： ? 这是我从Beautiful Soup得到的输出： ? 我尝试过使用urllib而不是request，也尝试过使用不同的超文本标记语言解析器(html.parser和lxml)。所有的结果都是一样的。关于这里可能发生的事情以及我如何绕过它来访问表中的数据，有什么建议吗？ import requests from bs4 import Bea

浏览 15提问于2020-04-25得票数 0

回答已采纳

1回答

无法使用BeautifulSoup替换HTML

python、html、beautifulsoup

我一直试图使用这里提供的代码来使用Python编辑HTML文件： # Python program to modify HTML # with the help of Beautiful Soup # Import the libraries from bs4 import BeautifulSoup as bs import os import re # Remove the last segment of the path base = os.path.dirname(os.path.abspath(__file__))

浏览 1提问于2021-08-09得票数 0

回答已采纳

2回答

为什么美丽的汤忽略了CDATA

python、beautifulsoup

我正在为雅虎天气API (python2.7)使用Beautiful： url = 'http://weather.yahooapis.com/forecastrss?w=2344116' page=urllib2.urlopen(url).read() soup = BeautifulSoup(page) 但在此之后，在解析的url中，没有任何CDATA。为什么美汤忽视了这一点？如何防止忽略CDATA？在xml中： <img src="http://l.yimg.com/a/i/us/we/52/11.gif"/> 在已分析的页面中：正如

浏览 4提问于2014-10-26得票数 0

回答已采纳

2回答

为什么BeautifulSoup找不到特定的表类？

python、web-scraping、beautifulsoup

我正在使用Beautiful Soup来尝试从石油价格网上刮掉商品表格。我可以找到第一个div，table，table body，以及表体的行。但是在其中一行中有一列，我使用Beautiful soup找不到它。当我告诉python打印特定行中的所有表时，它没有显示我想要的表。这是我的代码： from urllib2 import urlopen from bs4 import BeautifulSoup html = urlopen('http://oil-price.net').read() soup = BeautifulSoup(html) div = soup.f

浏览 0提问于2014-02-09得票数 1

回答已采纳

4回答

用美汤移除特定的标签

python、beautifulsoup、tags

目前，我正试图用python和Beautiful Soup一起编写一个脚本，以更改indigo文件(.igs)中的摄像机，但我遇到了一个特定的问题： <scenedata> <tonemapping> <camera>...</camera> </tonemapping> <camera>...</camera> </scenedata> 我只想删除不在“调色”标签中的“相机”标签。我试过soup.find('').replace，_with和soup.select(&

浏览 5提问于2021-12-12得票数 0

2回答

变量文件名未被视为文件，无法打开

python、file-io

这是我使用Python的第三天，我确信一些简单的东西被忽略了。我正在尝试索引html文件名列表，将索引的html文件名设置为var，然后尝试打开该文件。计划是遍历文件名列表。不幸的是，var不是作为文件读取的，而是作为名称读取的。我认为这是一个很容易回答的问题，但我就是找不到。那么，我做错了什么呢？任何帮助都将受到高度的感谢。下面是我的代码： file_list = [] for root, dirs, files in os.walk(r'C:\Aptana\Beautiful'): for file in files: if file

浏览 0提问于2013-12-12得票数 0

2回答

如何通过python获取用户为HTML页面输入的文本？

python、html、beautifulsoup

如何通过python获取用户为HTML页面输入的文本？例如： <html> <input id="post_form_id" name="fooput" value="" /> </html> 现在，用户在文本字段中输入值abcxyz。如何使用python获取该值？我已经知道它是如何通过javascript实现的，但我想使用python来实现它。另外，我已经尝试过Beautiful Soup，但它只能返回字段的预设值。所以我能做到 soup=BeautifulSoup(open("myhtmldoc

浏览 1提问于2012-06-13得票数 2

回答已采纳

1回答

使用Python Selenium在JavaScript中渲染页面

javascript、python、selenium、web-scraping

我正在使用Python Splinter Selenium (Chromedriver)进行网页抓取。该页面有一个用JavaScript创建的表，但是当Beautiful Soup解析它时，该表不在那里。我在渲染表格时遇到了问题，所以我可以用Beautiful Soup来解析它。它如何在Selenium中做到这一点呢？如果我不能，我应该使用什么库？下面是我所拥有的一个示例： import pandas as pd from bs4 import BeautifulSoup as bs import pymongo import requests from splinter import B

浏览 27提问于2020-12-09得票数 0

1回答

美丽汤找到嵌套的div

python、parsing、beautifulsoup

我正试图解析一个类似于Python->Beautiful 的网页我需要从 <div class="p-offer__price-new">199,99 ₽</div> 我试过这个代码： soup = BeautifulSoup(data) res = soup.findAll("div", {"class": "poffer__price-new"}) print(res) 但结果是空的- [] 如何获得这些数据？示例URL：

浏览 0提问于2018-11-18得票数 1

回答已采纳

1回答

用Python + Beautiful Soup刮掉任何包含5个数字的字符串

python、regex、scrape

我住在德国，那里的邮政编码在大多数情况下是一个5位数字f.e.53525。我真的很想从一个网站上提取这些信息使用美丽的汤。我是Python/Beautiful Soup的新手，我不确定如何将“在一行中查找每5个数字+”空格“翻译成Python语言。 import requests import urllib.request,re from bs4 import BeautifulSoup source = requests.get('DOMAIN').text soup = BeautifulSoup(source, 'lxml') soup.find_

浏览 0提问于2018-05-29得票数 2