努力获得一个干净的优秀与美丽的汤_美丽的汤问题，努力获得地址和时间_如何提取一个评论与美丽的汤？ - 腾讯云开发者社区

python、python-3.x

我有以下代码，它按预期运行，但在计算字符数和最长行的长度时有一些问题。下面是我的代码： def stats(file_name): n_chars = 0 n_words = 0 n_lines = 0 longest_line = 0 with open(file_name) as f: lines = f.readlines() n_lines = len(lines) longest_line = max([len(line) for line in lines]) words = [

浏览 11提问于2018-08-13得票数 0

回答已采纳

1回答

即使在python中安装了bs4之后也不能使用bs4

python、beautifulsoup、module、pip、python-import

我安装了漂亮的汤，并尝试在bs4中使用VScode。我检查空闲的地方，我可以找到美丽的汤，但当我试图导入在我的vscode，它不是运行在这里是图片我正在学习python，在过去的两天里，我一直在努力解决这个问题。请帮我解决这个问题。我在其他地方检查这个问题，那里的解决办法没有效果。

浏览 1提问于2022-02-08得票数 -2

回答已采纳

1回答

BS4导入在eclipse中不起作用

python、eclipse

我是python的新手。我想在eclipse中运行python脚本，因为我对此有点适应。我正在尝试导入和运行美丽汤在eclipse oxygen.Import是成功的，但我得到一个错误(未解决的导入汤)与以下code.However美丽汤是工作良好与anaconda.enter图像描述在这里从bs4导入BeautifulSoup as soup

浏览 4提问于2017-12-11得票数 0

3回答

使用Python2.7刮擦/分析投注赔率

javascript、python、web-scraping、python-2.7

我试图用Python 2.7创建一个过程，它从不同的博彩网站(如betfair、ladbrokes等)检索投注赔率，以便进行统计分析。我对python相当陌生(我对所有的I.T术语都很难理解)，但我做了一些研究，并提出了以下结构。 from urllib import urlopen import re response = urlopen('http://beta.betfair.com/football/event?id=26821411') html = response.read() jay = re.compile(b'.*id="m57290-s

浏览 0提问于2012-03-19得票数 1

1回答

漂亮的汤-选择没有类的下一个span元素的文本

python、web-scraping、beautifulsoup

我试图使用美丽的汤刮从rottentomatoes.com的电影引号。页面源很有趣，因为引号是由span类“粗体quote_actor”直接进行的，但是引号本身没有类，例如()：。我想使用美丽汤的find_all捕捉所有的引号，没有演员的名字。我尝试过很多没有成功的事情，例如： moviequotes = soup(input) for t in web_soup.findAll('span', {'class':'bold quote_actor'}): for item in t.parent.next_siblings:

浏览 2提问于2017-10-04得票数 1

回答已采纳

2回答

在有漂亮汤的字符串之前获得一个元素

python、string、python-2.7、parsing、beautifulsoup

我正在使用“美丽汤”搜索一组整数值，并生成与名称匹配的这些值的列表。然而，我遇到的问题是，网站对我需要的元素(“列表-条目”)使用了一些非常模糊的类名，这些元素被复制在其他元素中，我不想抓住这些元素。到目前为止，我的代码看起来是： from bs4 import BeautifulSoup as bs import requests url = "http://beautifulnumberssite.com/" html = requests.get(url).text soup = bs(html) names = soup.findAll("h1",

浏览 1提问于2016-12-30得票数 1

回答已采纳

1回答

在安装了两个版本的pyCharm的情况下进行漂亮的汤类安装

python、pycharm

我使用PyCharm编写Python，首先我用python2.7.12配置了PyCharm，在2.7.12环境下安装了Beautiful Soup包。然而，我现在已经在PyCharm中安装了Python3.5.2，并且我想在3.5.2的PyCharm中使用美丽汤，但我不能导入bs4，因为解释器无法找到2.7.12包文件夹中的美丽汤包。所以我尝试在3.5.2控制台中pip install bs4，但它告诉我包已经安装在2.7.12文件夹中。那么，现在如何在PyCharm中导入3.5.2中的美丽汤呢？

浏览 24提问于2016-07-28得票数 0

回答已采纳

2回答

试着用漂亮的汤隔开一栏

python、beautifulsoup、html-parsing、wikipedia

我试图隔离Location列，然后最终将其输出到数据库文件中。我的代码如下： import urllib import urllib2 from bs4 import BeautifulSoup url = "http://en.wikipedia.org/wiki/List_of_ongoing_armed_conflicts" response = urllib2.urlopen(url) html = response.read() soup = BeautifulSoup(html) trs = soup.find_all('td') for t

浏览 0提问于2015-03-08得票数 1

回答已采纳

1回答

解析美汤时转换为<( &lt；)

python、beautifulsoup、html-escape-characters

我使用漂亮的汤来解析一个包含<br>的字符串，美丽的汤将其解释为<br>。有没有办法让漂亮的汤停止这样做，这样当<br>被正常解析时，<br>不会被触及，并被视为普通字符串？

浏览 0提问于2019-04-01得票数 0

1回答

我怎样才能用美丽的汤锁定下一个子元素文本呢？

beautifulsoup

使用美丽汤，我试图提取在下图突出显示的数字。我能够锁定和输出整个span类，但我只想要锚定文本字符串。我如何告诉美丽汤，我想要的下一个子元素只值？我期望输出是90NBHA138J2C255D431U 我的尝试到目前为止， target=soup.findAll('span',{'class':'data data_mpn'}) print target 目标字符串的图像

浏览 1提问于2013-08-19得票数 0

回答已采纳

5回答

用漂亮汤获取所有HTML标签

python、html、beautifulsoup

我正试图从美丽的汤中得到所有html标签的列表。我看到了所有的东西，但我必须知道标签的名字，然后再搜索。如果有类似的文本 html = """<div>something</div> <div>something else</div> <div class='magical'>hi there</div> <p>ok</p>""" 我怎么能得到这样的名单 list_of_tags = ["<div>",

浏览 8提问于2016-03-19得票数 40

回答已采纳

2回答

BeautifulSoup不查找表行

python、web-scraping、beautifulsoup

我试图从中获取信息，但是使用漂亮的汤只返回<table>的两个<tbody>子表中的第一个表行中的一个。在google返回中进行检查：当美丽的汤回来时： <table cellpadding="2" cellspacing="1" class="data" defaultsort="currentpos" enablesort="true" id="Leaderboard" onsort="Leaderboard.sort" width="

浏览 1提问于2018-04-06得票数 0

回答已采纳

2回答

包含多个全文行的python美观汤标记，很难以通用的方式找到。

python、beautifulsoup、parent-child

关于使用漂亮汤从一行中提取文本，有多个问题可以回答，但是，我找不到获得正确文本的解决方案，例如： <div> <div> <span>2</span> <span>bananas</span></div> <div> <span>3</span> <span>oranges</span></div> </div> 泛化以产生产出的： 2 bananas 3 orang

浏览 6提问于2022-06-24得票数 0

1回答

带有BS4和Show按钮的

python、json、web-scraping、beautifulsoup、web-crawler

我正在使用美丽汤4作为我的网络爬虫，我正在尝试通过。它有一个更多的button，而不是页面，我正在努力弄清楚如何在没有Selenium的情况下完成这个。我查看了show按钮的API源代码&我想我找到了JSON，它是：from= 100&in_unit=true&primary_terms等等。我不知道如何在我的代码中实现这一点。我想我首先要说的是： data = requests.get(url.format(page)).json() 但不知道在那之后该怎么办。

浏览 4提问于2021-01-19得票数 0

1回答

在未安装的情况下使用/导入美观汤4

python、beautifulsoup

正如“美丽汤”的文件所述：如果所有这些都失败了，“美丽汤许可证”允许您将整个库打包到应用程序中。您可以下载tarball，将其bs4目录复制到应用程序的代码库中，并在根本不安装它的情况下使用Beautiful。这正是我想要的，我所做的.直到在我的代码中使用它。我不知道如何导入Beautiful 4，与v3不同的是，没有独立的BeautifulSoup.py，只有包含大量python脚本的bs4目录。当你在你的项目中有源代码的时候，有谁有关于如何使用漂亮汤4的例子吗？

浏览 2提问于2012-06-12得票数 3

回答已采纳

3回答

如何刮除YouTube频道创建者并链接到他们的频道？

python、web-scraping、beautifulsoup、youtube

我试着用漂亮汤从视频页面中提取频道创建者的名字，以及他们频道的链接。我试过使用class_关键字参数。因此，我得到了[]。我该怎么办？我是否需要通过父母的div标签，然后“下去”，就像他们在“美丽汤”中说的那样？对于特定的标记和类，我应该如何/可以使用soup.find呢？ soup = BeautifulSoup(response.text, "html.parser") videotitle = soup.find("meta", {"property":"og:title"})["content"

浏览 2提问于2020-02-06得票数 2

回答已采纳

1回答

谁能用英文写出这段代码的确切含义: soup.find_all("p"，class_=“删除线”)

web-scraping

我想用英语来解释这段代码到底是什么意思。我试过从美丽的汤中学习代码，我得到了提示，但我不能获得信心。 soup.find_all("p", class_="strikeout") 代码说找到所有的标签，这是 ..。还有一些东西

浏览 32提问于2019-08-22得票数 0

1回答

在html中插入注释

python、html、python-2.7、beautifulsoup

我试着用漂亮的汤在html中插入一个注释，我想在头关闭之前插入它，我正在尝试这样的东西 soup.head.insert(-1,"") 它在</head>之前插入，但是值得到实体编码的。美丽的汤文档标签，但我应该如何插入评论，因为它是。

浏览 1提问于2014-03-14得票数 2

回答已采纳

1回答

利用find_partial_text实现Splinter抓取href

web-scraping、beautifulsoup、splinter

我是新的网页抓取，并试图从一个HTML页面检索一个href使用Splinter和美丽汤。这是我的密码 # hem1 url="https://astrogeology.usgs.gov/search/map/Mars/Viking/cerberus_enhanced" browser.visit(url) hem1=browser.find_link_by_partial_text('Sample').get("href") 这将接收到错误。 AttributeError：“ElementList”对象没有属性“get” 任何帮助都是非常感谢

浏览 3提问于2020-11-18得票数 0

1回答

我在使用漂亮的汤查找xml中的<name></name>时遇到问题

xml、beautifulsoup

我正在尝试使用beautifulsoup.name获取漂亮的汤返回文本。但它只是给了我一个美丽汤对象的文档。对于如何使用Beautiful返回XML文件中的文本，有什么建议吗？ import BeautifulSoup as bsoup f = open(file) soup = bsoup(f) f.close() f = soup.name This code will return [document] But I'm looking to for a function in beautiful soup to return: <name>car</n

浏览 3提问于2014-06-28得票数 0

回答已采纳

1回答

美丽的汤找不到这个html

python、python-3.x、web-scraping、beautifulsoup

Python3 -美丽的汤4 我正在尝试解析网站上的天气图：https://www.wunderground.com/forecast/us/ny/new-york-city 但是，当我抓取天气图时，html但漂亮的汤似乎抓住了它周围的一切。我是新来的美丽汤。我认为它无法捕捉到这一点，因为它不能解析他们正在进行的标记，或者因为填充图形的javascript没有加载，或者不能被BS解析(至少我使用它的方式是这样的)。就我的代码而言，它是非常基础的 import requests, bs4 url = 'https://www.wunderground.com/forecast/us

浏览 14提问于2019-04-24得票数 3

回答已采纳

2回答

无法计算出美丽汤对象的编码

python、encoding

我一直在用“美丽汤：”打印这个网站的文本使用lxml解析站点会返回乱七八糟和奇怪的字符，其他解析器根本不会返回任何内容。我尝试将编码指定为UTF-8，以匹配站点<meta charset="UTF-8">，但没有成功。什么是正确的解析器使用，我将如何实现它？我是一个初学者的美丽汤，并会真正感谢一个简单，明确的解释。谢谢! from bs4 import BeautifulSoup import urllib.request URL = urllib.request.urlopen("http://www3.forbes.com/entrepren

浏览 5提问于2016-11-20得票数 0

回答已采纳

1回答

如何用漂亮汤提取代码的某一部分

python、beautifulsoup、python-3.9

我在做一个私人项目，我有一个关于美汤的问题。我使用python 3.9.2和BeautifulSoup4.9.3。我的html代码是：style="transform-origin:50% 50%;transform:rotate(382deg)，我想得到零件:382 get。现在有谁用美丽的汤来做这个吗？谢谢。

浏览 5提问于2022-09-28得票数 -1

回答已采纳

1回答

问题:如何使用漂亮汤获取标记属性值的列表

python、web-scraping、time、beautifulsoup、datetime-select

我想从当地一家电影院的网站上刮点东西，当某部电影在运行时，我会一直拍下去。我找到了一张表格，其中列出了如下形式的时间： [<time datetime="2020-01-31T21:15:00+01:00">21:15</time>]. 如果我用漂亮汤作为x.find_all(“时间”)。我得到了上面所示的所有时间。但我只想要“日期时间”，所以在本例中，2020-01-31T21: 15: 00 + 01: 00。现在当我搜索x.find_all(‘time’)‘日期时间’时，我得到以下错误： TypeError: list indices must

浏览 3提问于2020-01-30得票数 0

回答已采纳

1回答

我应该把python模块放在哪个目录中？

python、python-2.7

我是Python新手。我正试着装上漂亮的汤。到目前为止，我已经安装了pip。在美丽汤的网站上写着：首先，确保安装了必要的模块。在下面的示例中，我们使用了Beautiful 4，并在安装了Python2.7的系统上进行了请求。好吧，太好了-它要我把模块放在哪里？我是否将下载的项目放入python27 27/脚本？好的，接下来：安装BeautifulSoup和请求可以通过pip完成：以下是命令： $ pip install requests $ pip install beautifulsoup4 我假设我的代码将类似于python整数： >>>

浏览 3提问于2013-09-10得票数 0

回答已采纳

1回答

BeautifulSoup中的选择方法无法用空格选择属性值

python、html、beautifulsoup、html-parsing

city = soup.select('a[href="/city/london d12"]') 上面的代码得到了一个错误消息： ValueError:不支持或无效的CSS选择器："a[href=/city/london“ 我想知道是否有一个解决办法或替代美丽的汤？ <a title="London" href="/city/london d12">london</a>

浏览 9提问于2015-12-15得票数 2

回答已采纳

3回答

从HTML脚本元素内部提取对象键的值

python、beautifulsoup、html-parsing、lxml

<div class="heading-dom view"> <script type="application/javascript"> window.realty = {"user_id":4243456};

浏览 5提问于2017-12-15得票数 2

回答已采纳

3回答

Regex检查给定字符串是否为相对URL

python、regex

首先，我读过关于如何检查字符串是绝对的还是相对的URL。我的问题是，我需要一个regex来检查给定的字符串是否是一个相对 URL，也就是说，我需要一个regex来检查一个字符串是否以任何协议或双斜杠//开头。事实上，我正在做与美丽汤的网页刮，我想检索所有相关的链接。“美丽汤”使用以下语法： soup.findAll(href=re.compile(REGEX_TO_MATCH_RELATIVE_URL)) 所以我才需要这个。测试用例是 about.html tutorial1/ tutorial1/2.html / /experts/ ../ ../experts/ ../../

浏览 5提问于2015-07-15得票数 2

回答已采纳

1回答

网络抓取中插值值的处理(漂亮汤)

python、web-scraping、beautifulsoup

我正在做一些与Python和美丽汤的网络擦拭。我遇到了一个问题，我得到的结果包含原始Javascript插值，而不是值本身。所以，而不是 <span>2.4%</span> 我可以从Chrome检查员那里看到，我得到的是： <span> {{ item.rate }} </span> 从美丽的汤中得到的结果。我是不是做错了什么(类似的代码在不同的网站上工作，所以我不这么认为，但可能是错的)？或 ( b)是否有办法处理这一问题？我的代码： url = "https://example.com" response = req

浏览 0提问于2019-03-22得票数 0

回答已采纳

1回答

哪个类最适合读取和表示HTML文件？

objective-c、macos、cocoa

这是个初学者的问题。基础课程中的平台和课程数量非常庞大，所以我希望so社区有一个现成的答案。这是我的用例：我希望读取html文件并提取p标记中的所有文本。我不需要显示html标记。但是如果Webkit有一个解决方案，我很乐意使用它。在蟒蛇世界里，答案将是美丽的汤。我正在寻找OSX基础套件的等价物或任何可能达到目标的类。

浏览 2提问于2013-05-29得票数 1

回答已采纳

1回答

BeautifulSoup误解了<area>标签

python、beautifulsoup

我使用漂亮汤从烟草文档中提取元数据，如： soup = BeautifulSoup(input) meta_data = soup.document.metadata 这将正确标识所有标记，但 <area>GEE,ED/OFFICE; N408</area> “美丽的汤”将区域标记标识为两个单独的标记：一个空的区域标记<area></area>。带有内容GEE,ED/OFFICE; N408的空标记这个错误是因为<area>是一个HTML而发生的吗？如何获得漂亮的汤来正确地将GEE,ED/OFFICE; N408

浏览 2提问于2014-07-29得票数 1

回答已采纳

2回答

漂亮汤-从里面的文字中获取标签和它的父母？

python、web-scraping、beautifulsoup

使用美丽的汤可以做到以下几点： for heading in soup.find_all('h1'): print(heading.text) Top Rated Movies 然而，是否有一种方法来提取标签本身，给出文本？从上述示例向后工作的一种方法，类似于： soup.find_tag('Top Rated Movies') h1

浏览 6提问于2022-11-01得票数 0

回答已采纳

1回答

用于查询控制台的Python？

android、python、google-api

我想从控制台获得我的一个Android应用程序的详细信息(即安装的数量，以及当前的评级)。我最好用Python来做这件事。我不喜欢沿着屏幕抓取/美丽的汤路线，所以我一直在寻找一个相关的API。我还没找到呢。因此，我的问题是：这种基于Python的Google是否存在(如果存在，那么它在哪里？) 如果没有，我还可以使用其他基于Python的库吗？如果不是，人们会推荐什么样的非Python替代方案？

浏览 2提问于2014-04-22得票数 1

2回答

漂亮的汤-用特定的类或文本捕获所有链接。

python、beautifulsoup

我试图捕捉所有相关的链接，从一个美丽的汤网页。我需要的所有链接都有class="btn btn-gray"和文本<a...>More Info<> 提取这些链接的最佳方法是什么？

浏览 5提问于2015-10-01得票数 4

回答已采纳

1回答

在webserver服务器上安装python模块

python、beautifulsoup、webserver、cpanel

我想在我的cpanel虚拟主机上运行一个python脚本。我可以在我的get服务器上运行通用的.py文件，但如何让它与美丽的汤一起工作

浏览 0提问于2017-04-09得票数 0

2回答

Python美丽汤循环

python、loops、beautifulsoup

我试图让一个循环多次遍历这些链接，它只运行一次，并且似乎排除了除“美丽汤”代码之外的所有其他代码 import requests import bs4 x = 0 while x < 3: print(x) res = requests.get('https://en.wikipedia.org/wiki/Special:Random') soup = bs4.BeautifulSoup(res.text, 'lxml') i = soup.select('.firstHeading') pri

浏览 1提问于2021-03-14得票数 0

回答已采纳

1回答

如何在python中获取html页面中文本的偏移量

python、web-scraping、beautifulsoup

我正在做一个网页抓取，以提取一些文本使用美丽的汤。我正在成功地从网页中提取所需的文本，但我的新要求是与文本一起提取文档中文本实际开始和结束的偏移量/位置。有没有可能使用漂亮的汤或任何有用的软件包来实现这一点？请提供您的想法和建议... 谢谢

浏览 5提问于2016-06-08得票数 2

1回答

我在jupyter笔记本上安装了BeautifulSoup4。尝试使用"from bs4 import BeautifulSoup“时出现错误

python、selenium、web-scraping、beautifulsoup

from selenium.webdriver import Chrome from selenium.webdriver.chrome.service import Service from selenium.webdriver.chrome.options import Options` from bs4 import BeautifulSoup import pandas as pd to ‘您试图在Python2下使用Python3特定版本的美丽汤。这是行不通的。支持Python2的漂亮汤的最终版本是4.9.3’ ValueError:源代码字符串不能包含空字节

浏览 7提问于2022-09-24得票数 0

1回答

如何从网站获取文本，知道它包含在<p>中，并使用Python使用特定的CSS类？

python、html

我需要从Twitter状态URL获取文本，如下所示：我知道有Twitter，但是我想在循环中尽可能多地进行查询(我存储了几个ids )，而查询Twitter意味着处理限制的代码。获得： Quéabuso el gol de Bale.Lleva el balón desde los 3/4 y le gana la carrera a Bartra y con el defensa pegado，por debajo de Pinto 85‘ 获得：我推荐数字海洋--最… 获得： #Halamadpic.twitter.com/61nJpT5TAO 实际状态

浏览 1提问于2014-04-25得票数 0

回答已采纳

2回答

如何使用“美丽汤”从<script>标记内的字典中获取值

beautifulsoup

如何使用美丽汤从下面的productId标记中获得<script>的值 soup.find('script') <script> gtmData.productData['34597834'] = { "productId": 1234, "foo": 1, "bar": 2, } <script> 我想检索productId的值

浏览 3提问于2020-03-22得票数 1

回答已采纳

3回答

如何检查我的BeautifulSoup版本并将其还原为旧版本？

python、beautifulsoup

我正在使用漂亮的汤，并且我得到了一些带有开始标记的some解析器错误等等。我在crummy的网站上读到，有一个建议是回到老版本(3.08)。我正在使用Ubuntu，我就是这样做的： sudo apt-获得安装python-漂亮的汤来安装它。如何检查我现在的版本？如何使用apt-get强制执行特定的版本？(以及如何卸载我现在拥有的) 谢谢(我是新来的ubuntu) 最新版本的ubuntu 10.04

浏览 4提问于2010-08-09得票数 8

回答已采纳

1回答

使用Beautiful Soup，我如何迭代所有嵌入的文本？

python、beautifulsoup

假设我想从HTML中删除元音： <a href="foo">Hello there!</a>Hi! 变成了 <a href="foo">Hll thr!</a>H! 我想这是美丽汤的工作。如何选择标记之间的文本并像这样操作它？

浏览 1提问于2009-05-06得票数 6

回答已采纳

1回答

我怎样才能通过“美丽汤”获得这些信息？

python-2.7、beautifulsoup

我如何找到价值，例如，与美丽的汤上下文？这就是我在Python中打印我的Beautiful时得到的一些信息。 <script> (function (root) { root['__playIT'] = {"context":{"dispatcher":{"stores"} }(this)); </script>

浏览 1提问于2016-09-16得票数 0

1回答

查找包含div和span的路径文本

python、dataframe、beautifulsoup

我是一个Python3的初学者，我正在为一个网站做硒项目我想要的文本位于路径("//div[@class='classname']//span[@class='classname2']).text下但是没有美汤我就不能提炼出来 for i in postsContainer.extract(): soup = bs(i) people.append([soup.find("div",{"class":"classname"}).text]) 但是如果没有//span部分，它就不能工作。我

浏览 0提问于2021-02-10得票数 0

2回答

代码不在BS4上，但可以在“检查元素”中找到

python、html、beautifulsoup

我已经尝试制作一个网站，使用美丽的汤4搜索g2a的游戏价格(按等级)。问题是，当我查看HTML代码时，它清楚地显示了第一个结果(GB2.3)的价格，但是当我在Beautiful 4中搜索类时，同一个类的标记之间没有任何区别： #summoningg2a r = requests.get('https://www.g2a.com/?search=x') data = r.text soup = BeautifulSoup(data, 'html.parser') #finding prices prices = soup.find_all(&

浏览 0提问于2017-03-08得票数 0

回答已采纳

1回答

BeautifulSoup更改HTML

python、beautifulsoup、python-requests

我注意到，当我从网页获得HTML与美丽汤，它不知何故改变。这是我用来获取它的代码： from bs4 import BeautifulSoup import requests url ="http://www.basketnews.lt/lygos/59-nacionaline-krepsinio-asociacija/2013/naujienos.html" r = requests.get(url) soup = BeautifulSoup(r.text) print soup 这里是原始HTML的一部分： <a href="/news-73149-valan

浏览 2提问于2014-05-05得票数 3

回答已采纳

1回答

web抓取python漂亮汤，javascriot

python、web-scraping、beautifulsoup

我想从这个网址得到产品名称：‘’我正在使用python和漂亮汤我试过了，但是它无法捕捉到产品列表，似乎列表中的产品没有被美丽的汤捕获。 mobile_page_url='https://telenor.se/handla/mobiler/' mobile_page_data=requests.get(mobile_page_url) mobile_page_soup=BeautifulSoup(mobile_page_data.text) mobile_page_soup=mobile_page_soup.select('div',{'class

浏览 1提问于2022-11-17得票数 1

3回答

如何使用漂亮的汤从商店中刮取数据

python、web-scraping、beautifulsoup

我现在是一个学生，我现在学习的是美丽的汤，所以我的讲师就像我一样从商店里收集数据，但是我不能擦拭产品的细节。目前，我正在尝试从中抓取数据。我只想弄清楚产品的名称和价格。有人能告诉我为什么我不能用漂亮汤刮数据吗？这是我的代码： from requests import get from bs4 import BeautifulSoup url = "https://shopee.com.my/shop/13377506/search?page=0&sortBy=sales" response= get (url) soup=BeautifulSoup(response

浏览 2提问于2020-05-28得票数 3

回答已采纳

1回答

美汤不能FindAll

python、beautifulsoup

我正在努力刮nature.com，以便对期刊文章进行一些分析。当我执行以下操作时： import requests from bs4 import BeautifulSoup import re query = "http://www.nature.com/search?journal=nature&order=date_desc" for page in range (1, 10): req = requests.get(query + "&page=" + str(page)) soup = BeautifulSoup(r

浏览 5提问于2015-06-06得票数 5

回答已采纳

5回答