无法使用BS4从eastbay.com中抓取数据？

从问题描述来看，您想要使用BS4从eastbay.com中抓取数据，但遇到了问题。我将为您解答这个问题。

BS4是一个Python的库，用于解析HTML和XML文档。它提供了一种简单而灵活的方式来从网页中提取数据。然而，有些网站可能会采取一些反爬虫的措施，导致无法使用BS4进行数据抓取。

针对这个问题，您可以尝试以下几个步骤来解决：

检查网站的robots.txt文件：robots.txt是网站用来指示搜索引擎爬虫的文件。有些网站会在robots.txt中设置禁止爬取的规则，您可以查看一下是否有相关的限制。
模拟浏览器行为：有些网站会检测请求的User-Agent头部信息，如果检测到是爬虫，则会拒绝响应。您可以尝试设置一个模拟浏览器的User-Agent头部信息，以绕过这个检测。
使用代理IP：有些网站会根据IP地址来判断请求的来源，如果检测到是频繁的爬取请求，则会拒绝响应。您可以尝试使用代理IP来隐藏真实的IP地址，以避免被封禁。
分析网站的动态加载方式：有些网站采用了JavaScript动态加载数据的方式，这种情况下，使用BS4直接解析静态HTML是无法获取到数据的。您可以使用Selenium等工具来模拟浏览器的行为，等待页面完全加载后再提取数据。
考虑其他数据抓取工具：如果以上方法都无法解决问题，您可以尝试其他的数据抓取工具，比如Scrapy、PyQuery等。

需要注意的是，数据抓取涉及到网站的合法性和隐私保护等问题，请确保您的行为符合相关法律法规和网站的使用规定。

希望以上解答对您有帮助。如果您有其他问题，请随时提问。

无法使用BS4从eastbay.com中抓取数据？

python、selenium、web-scraping、beautifulsoup

3Abrand%3AUGG%3Abrand%3AUnder+Armour%3Abrand%3AVans%3Abrand%3Aadidas%3Abrand%3Aadidas+Originals& 我试图从这个页面中抓取数据我的第一个问题是，使用BS4时，我无法从网站获取任何数据。BS4。我尝试了这样的东西，从另一个网站的脚本修改而来，URL中也没有分页： url = "https:&

浏览 18提问于2019-04-18得票数 0

回答已采纳

1回答

访问HTML注释中的标记

python、html、web-scraping、beautifulsoup

我已经通过BS4熟悉了使用Python进行web抓取的过程。我还没有找到嵌入在注释中的DOM标记的解决方案。例如，当试图从.html页面()获取数据时，检查页面上的表显示：我通常可以用BeautifulSoup抓取。但是，当我查看实际的页面源时，上述表被包含在注释标记中： <!</di

浏览 0提问于2018-12-11得票数 0

回答已采纳

1回答

无法从网站中抓取数据: Python BS4

python、web-scraping、beautifulsoup

我正在尝试使用带有python的从BS4中抓取数据。我尝试过许多方法，但无法检索到任何信息。看起来这是API什么的直接响应。有人能帮我朝正确的方向走吗？谢谢,

浏览 0提问于2018-10-29得票数 0

回答已采纳

1回答

无法使用bs4抓取数据

web-scraping、beautifulsoup、tripadvisor

我试图从Trip Advisor酒店获取"value“数据的星级，但我无法使用类名获得数据:以下是我尝试使用的代码： review_pages=requests.get("https://www.tripadvisor.com我已经尝试了该页面中的多个类名称，但我得到了各种字段，如数据，评论等，但我不能获得唯一的服务气泡评级。

浏览 16提问于2019-03-07得票数 1

1回答

美汤在股票跟踪器上的应用

python、beautifulsoup

我试图从Robintrack中抓取数据，但是，我无法从增加/减少部分获得数据。我只能抓取主页数据。这是我的汤 import bs4from urllib.request import urlopen as uReq from bs4 import BeautifulSoup

浏览 18提问于2020-07-25得票数 0

回答已采纳

1回答

无法获得正确的div从表中获取数据

python、web-scraping、beautifulsoup

我正在尝试从上抓取数据，在经历了大量的攻击和试验之后，我仍然无法识别如何从表中获取数据？import requestsurl = "https://gmatclub.com/forum/decision-tracker.html

浏览 2提问于2021-05-25得票数 1

回答已采纳

1回答

美丽的汤刮

python-3.x、python-2.7、web-scraping、beautifulsoup

我遇到了旧的工作代码无法正常工作的问题。我的python代码是用漂亮的汤抓取一个网站，并提取事件数据(日期、事件、链接)。我的代码是拉取位于tbody中的所有事件。每个事件都存储在一个<tr class="Box">中。问题是我的抓取器似乎在这个<tr style ="box-shadow: none;>之后停止了，在它到达这个部分(这是一个包含3个我不想抓取的事件的站点广告的部分)之后，代码停止从</e

浏览 12提问于2020-09-30得票数 2

回答已采纳

1回答

无法使用请求和bs4抓取数据

beautifulsoup、python-requests、python-3.7

我编写了一个从电子商务网站提取数据的脚本，并使用bs4抓取页面内容并请求提取数据。当我在我的机器上本地运行这个脚本时，一切都很好。它需要3-4秒来列出数据，但它确实有效。所以它会抓取数据6-7次，然后就会抛出一大块错误。作为一个初学者，我对此一无所知。以下是从Heroku找到的完整回溯日志： 2020-09-11T18:39:48.896959+00:00 app[worker.1]: Traceback (most

浏览 3提问于2020-09-12得票数 0

1回答

使用bs4* python抓取时，不会呈现完整的超文本标记语言*

python、html、web-scraping、beautifulsoup

我正在尝试从极客那里收集数据，用于我自己的简单的抓取和分析项目。我正在使用bs4和requests - python2 我需要抓取这个url上的所有问题， ques_page = requests.get('https://practice.geeksforgeeks.orgques_page.text, 'lxml') get_ques = ques_soup.find('div', class_="pan

浏览 13提问于2019-01-02得票数 0

回答已采纳

1回答

用beautifulsoup4从天才网站抓取评论

python、html、web-scraping、beautifulsoup、expand

我问这个问题是因为当我用bs4抓取页面时，我找不到注释的部分，因为它们在一个可扩展的容器后面。如果我从浏览器中查看页面的html，即使我没有点击“展开”按钮，也可以看到注释，但是当我用bs4抓取时，我在html源代码中找不到它们。我怎样才能解决这个问题？有一种方法可以用bs4刮掉评论吗？(我想避免使用selenium，因为我必须刮掉很多数据，而且使用selenium，这可能太慢了)。

浏览 2提问于2021-12-15得票数 -1

2回答

基于日期抓取表数据

python、web-scraping、beautifulsoup、screen-scraping

我正在尝试抓取kurs事务的表from bs4 import BeautifulSoupheaders={ "User-Agent":"Mozil

浏览 0提问于2020-11-24得票数 0

3回答

无法下载网页的完整源代码

python

我正在尝试使用python请求库来抓取网页。但我无法下载完整的html源代码。当我使用我的web浏览器检查元素时，它给出了完整的html，我相信它可以用于抓取，但当我使用python请求库访问这个url时，那些包含数据的html标记就消失了，我无法从这些标记中抓取数据。下面是我的示例代码：from bs4 import BeautifulSoup

浏览 5提问于2019-07-30得票数 1

2回答

如何从html中提取特定的信息到python？

python、html、web-scraping

这是我第一个使用python或任何编程语言的“真实世界”应用程序。我使用我找到的一个教程构建了一个基本的web刮板，并试图添加信息并在此基础上创建比它更有用的东西。到目前为止，我遇到的问题是收集到的信息相对容易获得，但是现在我不得不从这里的代码中提取代价，放到我的python脚本中。from bs4 import BeautifulSoup as soup my_url = "https://www.new

浏览 6提问于2017-10-19得票数 2

2回答

将数据从Tripadvisor导入Google电子表格或Excel

excel、web-scraping、import、tripadvisor

是否可以获取此数据的列表：阿姆斯特丹所有餐馆的名单。如果可能的话，还有详细的地址等等。非常感谢！

浏览 1提问于2020-09-17得票数 0

1回答

如何从简写或重定向的URL中获得真正的(最终) url？(用于使用python进行抓取)

python、beautifulsoup

接受网址： (这是来自app的缩短网址)最终网址： (这是我想要的最终网址。)当我试图抓取接受的URL时，它被链接到重定向的URL，并且无法刮除html.(使用bs4) 使用代码？？强文本从可接受的URL中查找最终URL的任何方法。

浏览 5提问于2022-06-21得票数 -1

1回答

Web通过python抓取问题，不能读取html文件吗？

python-3.x、web-scraping、beautifulsoup

web抓取Python已经有一段时间了，最近我遇到了这个问题。BeautifulSoup似乎无法读取html文件。例如，我正试着从这个网站上抓取from bs4 import BeautifulSoupurl_episode = 'https://www.thetvdb.comurl_episode)

浏览 1提问于2020-04-06得票数 0

1回答

用Python从网站中抓取HTML数据

python、html

我试图从某些网站中抓取某些HTML数据，但我似乎无法刮掉我想要的部分。例如，我给自己设置了从中获取追随者数量的挑战，但我似乎无法做到这一点。from bs4 import BeautifulSoupimport json html

浏览 1提问于2016-10-12得票数 0

回答已采纳

1回答

用python抓取表

python、html-table、beautifulsoup、screen-scraping

试图从开放访问的学术文章中抓取表格，出于某些原因，我无法从本文中抓取这些表，这就是我所做的，但由此产生的ResultSet“表”是一个空列表。谢谢你的帮助。from bs4 import BeautifulSoup url_page = "http://www.sciencedirect.com/science/article

浏览 4提问于2017-08-26得票数 0

1回答

如何从承载HTML之外的表数据的网站中刮表？

python、html、pandas、beautifulsoup、python-requests

我正在尝试从这个表URL：中抓取表数据在之前的测试中，我使用了以下Python包:从bs4导入BeautifulSoup导入请求导入mysql.connector作为pd从sqlalchemy导入create_engine 有人能告诉我用这种HTML设置使用python脚本来抓

浏览 3提问于2022-04-02得票数 -1

回答已采纳

1回答

如何在Python中对带有图片的表格进行and抓取并导出到Excel中？

python、web-scraping、beautifulsoup

我正试着从URL上盗取一张桌子我可以使用Scrapestorm工具抓取表格数据。我是python的新手，不能从这个URL获取数据。from bs4 import BeautifulSoup soup = BeautifulSoup(page.te

浏览 61提问于2020-12-23得票数 1

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

无法使用BS4从eastbay.com中抓取数据？

相关·内容

无法使用BS4从eastbay.com中抓取数据？

访问HTML注释中的标记

无法从网站中抓取数据: Python BS4

无法使用bs4抓取数据

美汤在股票跟踪器上的应用

无法获得正确的div从表中获取数据

美丽的汤刮

无法使用请求和bs4抓取数据

使用bs4* python抓取时，不会呈现完整的超文本标记语言*

用beautifulsoup4从天才网站抓取评论

基于日期抓取表数据

无法下载网页的完整源代码

如何从html中提取特定的信息到python？

将数据从Tripadvisor导入Google电子表格或Excel

如何从简写或重定向的URL中获得真正的(最终) url？(用于使用python进行抓取)

Web通过python抓取问题，不能读取html文件吗？

用Python从网站中抓取HTML数据

用python抓取表

如何从承载HTML之外的表数据的网站中刮表？

如何在Python中对带有图片的表格进行and抓取并导出到Excel中？

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐