Python抓取与漂亮的汤不能正确抓取某些数据行_Python web抓取与请求和漂亮的汤被需要的javascript阻止_使用漂亮的汤从网页中的url中抓取数据。Python - 腾讯云开发者社区

python、parsing、beautifulsoup、python-3.8

我正在探索python中的web抓取。我有以下代码片段，但这段代码的问题是提取的某些数据行不正确。这段代码会有什么问题呢？

浏览 9提问于2021-07-21得票数 0

回答已采纳

1回答

数据挖掘-在终端中挖掘Facebook配置文件和返回数据

python、facebook、access-token、data-mining

我对python编码有点陌生，我有一个项目，我决定编写一些代码，当输入一个Facebook用户URL时，它将返回他们的配置文件必须提供的所有数据。任何帮助都将是非常感谢的，或者如果您有类似的代码，我很想观察。我正在寻找在python中执行此操作。

浏览 4提问于2022-03-29得票数 -1

1回答

抓取url不变的分页表

web-scraping、beautifulsoup、python-requests、pagination

我正在尝试从下面的网页中抓取表格中的：有没有人能带我到正确

浏览 26提问于2021-05-25得票数 1

2回答

抓取特定文本的网页(字符串)

python

在stackoverflow上的第一个帖子，所以如果我没有正确发帖，我道歉。我试图抓取网页的信息，只有当一个特定的文本字符串存在。我只是使用了漂亮的汤，但找不到包含我正在寻找的文本的元素。经过更多的研究，我尝试使用selenium，因为我知道一些动态加载的元素在漂亮的汤中是找不到的。到目前为止，我仍然找不到文本

浏览 0提问于2020-06-06得票数 1

2回答

使用漂亮汤从脚本标记中抓取数据

python、beautifulsoup

我是一个python美容汤库的新手，我正在尝试从一个网站的highcharts中抓取数据。我发现我需要的所有数据都位于一个脚本标签中，但是我不知道如何抓取它们(请参见附件)有没有办法使用python漂亮的script从这个脚本标签中获取数据？

浏览 32提问于2020-07-07得票数 1

回答已采纳

1回答

使用BeautifulSoup抓取的数据与源代码不匹配

python、web-scraping、beautifulsoup、mismatch

我是网络抓取的新手。我已经看过一些关于如何使用漂亮的汤来抓取网站的教程。作为练习，我想从一个房地产网站上提取数据。我想要抓取的特定页面是这个：我遇到的第一个问题是，使用经典的</e

浏览 4提问于2021-05-02得票数 1

2回答

如何使用selenium web驱动程序托管由web抓取支持的后端服务？

python、selenium、selenium-webdriver、flask、web-scraping

因此，我正在开发一个项目来抓取一个网站并将数据传递给用户，但是我正在使用带有python/flask的selenium/selenium web驱动程序。我本来打算用漂亮的汤，但我抓取的网站需要在页面上进行一些交互。我有一切工作与刮刀，我只是试图找出一种方法，使这项工作，如果我想要托管在一个网站上使用的服务，如heroku。有没有一种聪明的方法可以不用打开浏览

浏览 20提问于2020-05-03得票数 1

1回答

为什么通过漂亮汤导入的html与实际的html不同？

html、beautifulsoup

嗨，我正在制作一个程序，它在堆栈溢出中为搜索词抓取结果。我需要知道抓取的最大页面，但是通过开发工具查看的html结构和通过漂亮汤获得的html信息是不同的。网址：soup = BeautifulSoup(result

浏览 1提问于2020-08-30得票数 1

1回答

利用漂亮汤刮网时的颜色编码

python、web-scraping、beautifulsoup

我正在使用Python中的漂亮汤来做web 抓取。网站上的文字有红色字体颜色的名字，我需要有颜色代码。我正在使用网站上的文本作为我的培训数据的纳(仅为正确的名称)。我怎么才能用漂亮汤得到颜色码呢？现在我的代码看起来是这样的。

浏览 2提问于2021-08-07得票数 1

回答已采纳

1回答

内部跟踪事务Python

etherscan、web3.py、python、internal-transactions

我一直试图找出使用python获取网络内部/跟踪事务的最佳方法。我在论坛上读过其他主题，其中说这些内容没有记录在区块链上，所以web3.py不是一个选项，您必须使用一种专门的EVM来使用契约来模拟给定的事务，我试图避免这种情况，因为在python上似乎很复杂.我正在考虑使用以太扫描站点内部交易净额，我可能会使用漂亮的汤进行网络抓取，但我不知道是否有人知道一个更好的方法，它可以使用基于python</

浏览 0提问于2020-02-28得票数 3

回答已采纳

9回答

BeautifulSoup和Scrapy crawler有什么区别？

python、beautifulsoup、scrapy、web-crawler

我想做一个网站，显示亚马逊和易趣产品价格的比较。其中哪一个会工作得更好?为什么？我对BeautifulSoup比较熟悉，但对Scrapy crawler不太熟悉。

浏览 323提问于2013-10-30得票数 146

回答已采纳

1回答

是否有无监督培训的情感论坛数据？

sentiment-analysis、unsupervised-learning

其想法是：这将

浏览 0提问于2018-10-17得票数 0

1回答

用精美的汤从HTML中抓取表格

python、python-3.x、web-scraping、beautifulsoup

我正在尝试用python3从中抓取数据。该网站包含了基于冠军的FPS多人游戏“圣骑士”的玩家数据。我想要得到一个基于冠军的球员的统计数据，如网站所示。我面临的问题是，当我用Chrome检查页面源代码时，我得到了包含"table“标签的代码，它是干净的，我可以很容易地抓取它：但是当我创建soup对象时，我得到了一个不

浏览 2提问于2018-06-26得票数 0

3回答

如何使用Beautiful从python代码中获得javascript函数的结果？

javascript、jquery、python、html、web-scraping

我想从一个使用Python中的“美丽汤”的网站上抓取数据。网站根据用户的选择更改下拉菜单的值。在更改下拉菜单的值时没有api调用。仔细看一下，我注意到有一个javascript函数在内部调用，以获取下拉菜单的值。我的问题是下拉菜单的值不在页面源中。它们是通过调用js函数获得的，但是没有api调用，我不能请求那个值。有人能告诉我如何从pyt

浏览 7提问于2014-04-06得票数 1

回答已采纳

2回答

在Azure上计划web抓取作业并在ADLS上存储结果

python、azure、u-sql

我有一个python作业，它使用漂亮的汤从job上抓取数据。我尝试使用U-SQL执行脚本，但我一直收到一般的错误消息：我没有过多地研究这个错误，因为我不确定是否有可能通过U-SQL来抓取web。这是否可以使用U-SQL，如果不可以，我可以使用哪个Azure资源来计划此脚本并将结果存储在Azure数据湖存储上？

浏览 2提问于2018-01-03得票数 0

2回答

接受单词开头的漂亮汤find.all()

python、beautifulsoup

我正在抓取一个网站，里面有一个漂亮的汤，它的类名如下： <a class="Component-headline-0-2-109" data-key="card-headline" href="/articlepolitics-senate-elections-legislation-coronavirus-pandemic-bills-f100b3a3b4498a75d6ce522dc09056b0"> 主要的</

浏览 29提问于2020-12-18得票数 0

回答已采纳

1回答

返回RSS的所有页面

python、rss、beautifulsoup

我正在使用python从rss页面抓取xml。我正在使用漂亮的汤来解析xml。每个URL的数据使用urllib2下载并保存在变量xml中然后，我的python代码使用漂亮的</

浏览 0提问于2014-12-04得票数 0

2回答

调用Twitch时BeautifulSoup不返回html

python、web-scraping、twitch

我正在尝试为Twitch做一个网络抓取器，它将获得流的标题和流信息。我可以从其他网站中取出页面的特定部分，但当我放入一个流时，它看起来不像inspect元素中的html。它看起来就像一团乱麻。

浏览 20提问于2021-01-08得票数 0

1回答

有没有可能用漂亮的汤刮出一个“动态网页”？

python、html、selenium、beautifulsoup

我现在开始用漂亮的汤来抓取网站，我想我已经掌握了基本的知识，虽然我缺乏网页的理论知识，但我会尽我最大的努力来表达我的问题。我所说的动态网页是这样的:一个网站，它的HTML会根据用户的动作而改变，在我的例子中，它是可折叠的表格。我想获得一些"div“标签中的数据，但是当你加载页面时，数据</em

浏览 1提问于2016-11-22得票数 4

3回答

“美丽的汤”查找()并不能找到类的所有结果

python、html、web-scraping、beautifulsoup

信息肯定在那里(我打印了汤以检查)，所以我不知道为什么前30 react-contextmenu-wrapper之后的所有东西都丢失了。= BeautifulSoup(html, "html5lib") print(main) 1.感觉我的搜索结果被截断了。

浏览 6提问于2019-10-05得票数 1

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云