BeautifulSoup:获取未出现在html中的表？_汇总行未出现在gt表中_MySQL；函数值未出现在结果表中 - 腾讯云开发者社区

、、、

我正在尝试从这个URL中用python来抓取历史价格。我在chrome浏览器上查看了开发工具，其中有我想在<script>中获得的信息，它位于我附加了元素图像的<div id="market-stats">下面。我使用了漂亮的汤来清除数据，但似乎<script>中的信息从未出现在终端中。我的假设是这部分信息可能不允许抓取？ from bs4 import BeautifulSoup import requests url = "https://www.dotproperty.co.th/en/condo/2945/nai-har

浏览 2提问于2022-11-26得票数 0

回答已采纳

1回答

使用网页的Python解析的HTML与实际页面不同

、、、

我需要从表中获取和存储PM2.5和值。我使用BeautifulSoup4来抓取网页，但是我得到的解析HTML与实际页面不同。例如，我得到了这个而不是这个。我编写了获取表行和表数据等所需的代码，但是由于我分析过的HTML缺少表主体的行，所以它找不到它们，所以现在我只能看到分析过的HTML： from bs4 import BeautifulSoup import requests import pandas as pd url = "https://app.cpcbccr.com/AQI_India/" soup = BeautifulSoup(requ

浏览 1提问于2020-07-23得票数 0

回答已采纳

1回答

BeautifulSoup按编号指定表列？

、、、、

使用Python2.7和BeautifulSoup 4，我从一个表中抓取歌曲名。现在，脚本在表的行中找到链接；我如何指定我想要第一列？理想情况下，我可以改变号码，以改变哪些被选中。现在，代码如下所示： from bs4 import BeautifulSoup import requests r = requests.get("http://evamsharma.finosus.com/beatles/index.html") data = r.text soup = BeautifulSoup(data) for table in soup.find_all

浏览 7提问于2014-04-09得票数 1

回答已采纳

1回答

删除注释标记，但不满足于BeautifulSoup

、、

我正在使用BeautifulSoup练习一些网络抓取，特别是我正在查看NFL的游戏数据，更具体的说是这个页面上的"Team“表()。当查看表的HTML时，我看到如下所示： <div class="section_heading">...</div> <div class="placeholder"></div> <!-- <div class="table_outer_container"> <div class="overthrow

浏览 1提问于2018-10-18得票数 1

回答已采纳

1回答

使用python从站点保存文本文件

、

使用Python，我的任务只是从这个站点获取html源代码-- --并将第一个文本文件保存在名为"corporate_action_rpt_20220621.txt“的表中，现在，我可以使用BeautifulSoup读取这一行html，如下所示： <a href="2022/06/bzx_equities_corporate_action_rpt_20220621.txt-dl">corporate_action_rpt_20220621.txt</a> 下面是我使用的代码： import requests from bs4 import Be

浏览 10提问于2022-06-22得票数 0

回答已采纳

1回答

如何选择所有的'a‘标签

、、

我是BeautifulSoup和Python的新手。这是我的HTML： <html> <head></head> <body> <a href="https://google.com">Google</a> <a href="https://yahoo.com">Yahoo</a> </body> </html> 现在我的代码是： from bs4 import BeautifulSoup # Getting page souped ins

浏览 12提问于2020-11-06得票数 0

回答已采纳

1回答

解析HTML以从表行中提取数据

、、

我正在使用BeautifulSoup从纳斯达克网站提取股票信息。我想特别从HTML页面上的表行中检索信息，但总是得到一个错误(第12行)。 #import html-parser from bs4 import BeautifulSoup from requests import get url = 'https://www.nasdaq.com/symbol/amzn' #AMZN is just an example response = get(url) #Create parse tree (BeautifulSoup

浏览 1提问于2018-06-27得票数 0

1回答

如何使用Python BeautifulSoup从网页中解析选定的表

、、、

我希望解析本地体育活动的结果表(页面基本上只包含一个表)，但是当我尝试使用下面的脚本时，我只得到了“菜单”，而不是实际的结果列表。我遗漏了什么？ from urllib.request import urlopen from bs4 import BeautifulSoup import pandas as pd site = "https://rittresultater.no/nb/sb_tid/923?pv2=11027&pv1=U" html = urlopen(site) soup = BeautifulSoup(html, "lxml")

浏览 3提问于2017-06-07得票数 0

回答已采纳

1回答

Python BeautifulSoup:解析具有相同表的多个表是

、

我必须使用BeautifulSoup来解析表，但是有几个表具有相同的名称。请看下面的例子，在这种情况下，我需要表#6，它有"First goal stats:...“ enter image description here page site = requests.get(url, headers=headers) soup = BeautifulSoup(site.content, 'html.parser') tb = soup.findAll('table',{'id': 'btable'}) table_str

浏览 11提问于2021-10-05得票数 0

回答已采纳

2回答

是否有可能用python抓取html的伪元素中包含的数据？

、、、

我一直试图开发一个刮擦代码，从意大利梦幻足球网站上检索表格。为此，我想解析使用python、BeautifulSoup和熊猫的html。但是，当我用BeautifulSoup解析html代码时，我找不到任何表：此代码： >>> # import libraries >>> import requests >>> from bs4 import BeautifulSoup >>> # define url of interest, request it and parse it >>> url

浏览 5提问于2019-12-18得票数 1

回答已采纳

2回答

如何使用Python下载一篇新闻文章中的所有评论？

、

我不得不承认我不太了解html。我正在尝试使用python从在线新闻的一篇文章中提取所有评论。我尝试过使用python BeautifulSoup，但注释似乎不在html源代码中，而是出现在检查元素中。例如，您可以在此处查看。我的代码在这里，我被震撼了。 import urllib.request as urllib2 from bs4 import BeautifulSoup url = "http://www.dailymail.co.uk/sciencetech/article-5100519/Elon-Musk-says-Tes

浏览 1提问于2017-11-21得票数 0

3回答

美观汤与AJAX-table问题

、

我正在制作一个脚本，擦拭国际StarCraft 2比赛的团队液体数据库的游戏。() 不管我怎么说我都有个问题。我的脚本遍历了所有的页面，但是站点使用了一些我认为在表中的AJAX来更新它。现在，当我使用BeautifulSoup时，我无法获得正确的数据。因此，我循环浏览这些页面：等..。当您自己打开这些页面时，您会看到不同的页面，但是每次我的脚本都会得到相同的第一页。我认为这是因为当打开其他页面时，您会看到一些加载的东西，时间不长，用游戏将表更新到正确的页面。所以，我想“福汤”是快速的，需要等待表的加载和更新。因此，我的问题是：如何确保它接受更新的表？现在我使用下面的代码获取表的

浏览 3提问于2011-05-06得票数 0

回答已采纳

1回答

为什么Beautiful Soup找不到页面元素？

、、、

我是Bs4 noobie。我尝试了很多方法来实现这个功能，但现在我完全搞不懂了。在尝试解析此页面时：我正在使用下面的代码查找一个特定表 from urllib.request import urlopen from bs4 import BeautifulSoup year = 2021 team = "NYK" team_url = f"https://www.basketball-reference.com/teams/{team}/{year}.html" html = urlopen(team_url) soup = BeautifulSoup(h

浏览 21提问于2021-03-02得票数 0

1回答

如何从python的HTML表中的特定单元格中获取数据？

、、、

我试图在Python中使用BeautifulSoup。我对BeautifulSoup和HTML非常陌生。这是我解决问题的尝试。 soup = BeautifulSoup(open('BBS_student_grads.php')) data = [] table = soup.find('table') rows = table.find_all('tr') #array of rows in table for x,row in enumerate(rows[1:]):# skips first row cols = row.f

浏览 5提问于2015-03-07得票数 1

回答已采纳

1回答

使用Python网站访问web表

、、、、

我正在尝试访问NIST网站上的一个表格：假设我点击元素锌。我想检索能源，u/p和uen/p的信息到一个表的3列使用python2.7。我开始学习BeautifulSoup和机械。但是，我发现很难在与这个站点上的表相关的HTML代码中找到一个清晰的模式。我要找的是这样的方法： import mechanize from bs4 import BeautifulSoup page=mech.open("http://physics.nist.gov/PhysRefData/XrayMassCoef/tab3.html") html = page.read() soup =

浏览 4提问于2014-09-19得票数 2

回答已采纳

1回答

使用Python从Web读取表

、

我对Python很陌生，我正致力于从特定表上的网站中提取数据(最后一个表是共享模式)。我正在为此使用BeautifulSoup库，但我不知道如何实现它。到目前为止，下面是我的代码片段。由于页面有多个表，而且所有表都共享公共类和it，所以我无法选择正确的表，这使我很难为我想要的一个表进行筛选。 import requests import urllib.request from bs4 import BeautifulSoup url = "https://www.screener.in/company/ABB/consolidated/" r = request

浏览 6提问于2021-02-09得票数 3

回答已采纳

1回答

使用BeautifulSoup逐列解析HTML表

、

我需要使用BeautifulSoup解析一个超文本标记语言表格。该表有两列，其中第二列的数据类型为number。我需要找出Column2中所有数字的总和。我能够提取表数据，但我被困在这一点上。有人能帮帮忙吗。以下是到目前为止的代码。 import urllib from BeautifulSoup import * url = raw_input('Enter URL- ') html = urllib.urlopen(url).read() soup = BeautifulSoup(html) table = soup.find("table") for

浏览 1提问于2015-11-09得票数 0

1回答

BeautifulSoup发现所有表都为空

、、

我正试图从NOAA网站上刮出一个非常简单的表格：。该表是一个".dat“文件，站点显示在html中。当我使用BeautifulSoup读取内容时，我可以很好地看到内容。但是，当我搜索带有"find_all“或"find”的表时，我什么也得不到，即[]。这是我的初始代码： page = requests.get('https://www1.ncdc.noaa.gov/pub/data/cdo/samples/PRECIP_HLY_sample_ascii.dat') soup = BeautifulSoup(page.content,'html

浏览 0提问于2019-03-28得票数 2

回答已采纳

1回答

用Python2.7x从href标记中提取字符串

、、、

我目前正在使用Beautifulsoup4从HTML页面中提取href标签。我在Beautifulsoup4中使用的是Beautifulsoup4查询，它运行良好，并返回我正在寻找的'a href‘标记。返回内容的示例如下： "<a href="manage/foldercontent.html?folder=Pictures" style="background-image: url(shares/Pictures/DefaultPicture.png)" target="content_window" title=

浏览 3提问于2015-06-30得票数 0

回答已采纳

2回答

Web抓取没有得到所有的表

、、、

我编写了使用BeautifulSoup和Selenium的表的代码。然而，只获得了表的一部分。在访问时未出现的行和列不是由soup对象获得的。我确信这个问题发生在节选WebDriverWait(driver, 10).until (EC.visibility_of_element_located((By.ID,"contenttabledivjqxGrid")))中。 ..。我尝试了其他几种选择，但都没有给出预期的结果(在用Selenium更改日期之前，加载该表的所有行和列)。遵循以下代码： import os import time from selenium

浏览 4提问于2020-03-24得票数 4

回答已采纳

2回答

如何在Python中从网站抓取和迭代表

、

我试图在Python语言中抓取和迭代一个表，然后将其输入到一个pandas DataFrame中，但我甚至在使用BeautifulSoup查找表时都遇到了麻烦。这是我通常做的事情，但在源代码中似乎没有表格。我该如何拉出这个页面上的主表？ from bs4 import BeautifulSoup import pandas as pd import numpy as np import requests url = 'https://markets.ft.com/data/director-dealings' site = requests.get(url) soup =

浏览 21提问于2020-11-07得票数 0

1回答

如何使用美汤将汤输出到.html？

、、

我正在解析网页链接，我想将整个网页保存为.html格式的本地文件。我想直接将soup输出到本地的html文件中，以便将副本上传到S3-AWS？ from bs4 import BeautifulSoup import requests url_name = "https://<weblink>/" soup = BeautifulSoup(url_name,"html.parser") 现在，我想知道，像.txt一样，我们可以将soup输出到.html as well中吗？感谢您的建议。

浏览 0提问于2017-11-24得票数 1

2回答

使用BeautifulSoup进行网页抓取:表格不在页面源中

、

我正在尝试从位于以下网页上的表中抓取数据：以下是我到目前为止编写的代码。 from urllib.request import urlopen as uReq from bs4 import BeautifulSoup as soup my_url = 'http://ontariohockeyleague.com/stats/players/60' #open webpage, read html, close webpage uClient = uReq(my_url) page_html = uClient.read() uClient.close() #htm

浏览 16提问于2018-07-19得票数 1

回答已采纳

4回答

这里我的美丽汤find_all代码出了什么问题？

、、

我觉得我错过了一些非常基本的东西，但我被卡住了。我只想返回一个包含Beautiful Soup的表，但由于某种原因，它没有通过ID获取行score的表。我可以在此页面上根据ID指向其他div和表，但由于某种原因，此表不会返回任何内容。知道我错过了什么吗？ from urllib.request import urlopen from bs4 import BeautifulSoup import ssl url = 'https://www.sports-reference.com/cbb/boxscores/2020-01-14-19-clemson.html' html

浏览 0提问于2020-01-16得票数 0

2回答

美丽的汤只返回javaScript代码？

、、、、

我想从下面的网站抓取数据。我试图从网络选项卡中获取数据，但是它没有返回任何数据。然后，我尝试BeautifulSoup获取一些数据，但它只返回带有空tbody标记的Javascript。但是在in元素中，它在表中显示数据。 import requests from bs4 import BeautifulSoup url = 'https://dell.secure.force.com/FAP' headers = { 'Connection': 'keep-alive' } data = { 'pt': "f

浏览 5提问于2022-02-03得票数 1

1回答

Kaggle -完整的主板下载

、、

我正在尝试下载Kaggle领导板表，该表可以在一个单独的下使用。我使用了，也通过“原始数据”输出使用了，但是表数据是不完整的。下载的表--特别是--不包含关于'# of does‘和'Member (如果可用于竞赛的话)’的信息。我也尝试过刮表(基于可用的代码)，但是代码无法识别网站上的任何表： from bs4 import BeautifulSoup import requests import pandas as pd import re # Site URL url="https://www.kaggle.com/c/jane-street-market-p

浏览 0提问于2021-01-27得票数 4

1回答

抓取Java网页

、、

我已经找到并阅读了相当多关于抓取的文章，但不知何故，作为一个初学者，我不知所措。我想从一个表()中获取数据我尝试了一下漂亮汤，可以得到一个可用的option_tags列表(参见soup object中的选项)。我现在正在为获取实际内容/如何访问每个日期/选项的表并保存到例如pandas df中而烦恼。有什么建议从哪里开始呢？下面是我获取选项的代码： from bs4 import BeautifulSoup import requests resp = requests.get("https://www.senamhi.gob.pe/mapas/mapa-estaciones/

浏览 3提问于2019-02-19得票数 0

3回答

我正在尝试使用python和漂亮的汤从一个网站获取表数据，但它返回脚本。

、、、

我尝试了BeautifulSoup，但它从URL中擦去了脚本。 url = 'https://ekartlogistics.com/shipmenttrack/FMPP0944216480' from bs4 import BeautifulSoup from urllib import request, parse read = request.urlopen(url) soup = BeautifulSoup(read, 'html.parser') print(soup.prettify()) 它与其他HTML脚本一起返回脚本。我正在尝试从这

浏览 5提问于2021-11-12得票数 1

回答已采纳

1回答

抓取表，其中包含<br> (不显示)

、、、、

我无法使用BeautifulSoup从html中获取表格。我尝试过xpath，但我不知道它是如何工作的……我想找到这首歌的歌词，但它没有出现在“汤”中。为什么？有没有可能用BeautifulSoup得到它？xpath是最好的替代方案吗？来自的示例。简化我的代码： from bs4 import BeautifulSoup import requests import re import urllib url = "https://www.musica.com/letras.asp?letra=113" soup = BeautifulSoup(requests.get(u

浏览 0提问于2018-05-25得票数 1

1回答

提取HTML表并将它们存储在单独的文件中

、、、

我编写了一个代码来提取表的子部分，但是我希望从输入中提取每个标记，然后将它们存储在一个单独的html文件中。 from bs4 import BeautifulSoup soup = BeautifulSoup(myInput) table = soup.find('table', {'class': '*'}) 我希望代码显示输入文本上包含的所有表，但是它输出错误代码，因为*没有定义编辑：*意味着文件中的每个表，比如*.txt

浏览 0提问于2019-07-21得票数 0

回答已采纳

1回答

将网页中的表格抓取到python中

、

我正在学习西班牙语&为了帮助我学习不同的动词和它们的变化，我正在制作一些闪存卡，用在我的手机上。我正在尝试从网页中抓取数据。在页面上有几个表，我感兴趣的是靠近顶部的前五个表(现在，未来，不完美，未来和条件)。我听说BeautifulSoup很适合这些类型的项目。但是，当我使用prettify方法时，我在文本中的任何地方都找不到表？我想我遗漏了什么，我怎样才能在python中获得这些表？ import requests from bs4 import BeautifulSoup import re URL = 'https://www.linguasorb.com/

浏览 9提问于2021-01-19得票数 0

3回答

Python爬行表元素

、

我试图从这个网页()中提取与表(Team )对应的所有元素。我想从“团队”中提取所有的数字-(这一行:17132.17-0.51 1.66 1.66 104.7 96.5 .300 .319 .493 10.9 20.5 .228 .501 11.6 79.6 .148频谱中心269,47) import urllib2 from bs4 import BeautifulSoup htmla = urllib2.urlopen('http://www.basketball-reference.com/teams/CHO/2017.html') bsObja=Beautifu

浏览 2提问于2016-12-26得票数 1

回答已采纳

1回答

美汤找不到档次

、、、

我试着用bs4从一个NBA的统计网站上获取表格。该网站似乎没有使用JavaScript。 soup.prettify打印结果看起来很正常，但是我无法使用soup.find_all获得我想要的表。下面是我使用的代码： import requests from bs4 import BeautifulSoup url = 'http://stats.nba.com/team/#!/1610612738/stats/' page = requests.get(url) html = page.content soup = BeautifulSoup(html, 'html

浏览 5提问于2016-09-13得票数 3

回答已采纳

3回答

Python漂亮的汤，在网站上刮桌子

、

我最近开始对通过python库beautifulsoup4进行网络抓取感兴趣，我的目标是获取有关新冠肺炎案例的数据(在摩洛哥是一个良好的开端)；我的信息所在的网站是："“有一个包含所有信息的大表，我尝试这样做： U = 'https://www.worldometers.info/coronavirus/' response = requests.get(U) html_soup = BeautifulSoup(response.text, 'html.parser') info = html_soup.find_all('tr', cl

浏览 0提问于2020-10-16得票数 0

回答已采纳

1回答

在使用BeautifulSoup解析html时找不到表

、、

我正在尝试解析这个网站中的数据：我想提取表中的一些数据。但出于某种原因，我正在努力寻找它们。例如，我想要做的是 from bs4 import BeautifulSoup import requests url = 'http://www.baseball-reference.com/boxes/CHN/CHN201606020.shtml' soup = BeautifulSoup(requests.get(url).text) soup.find('table', id='ChicagoCubsbatting') 尽管html中存在一个具

浏览 2提问于2017-03-13得票数 0

1回答

BeautifulSoup4:缺少分析过的表数据

、、

我试图通过BeautifulSoup 4从中提取每股收益数据。当我解析数据时，使用默认的lxml和HTML5解析器丢失表信息。我相信这与Javascript有关，我一直在尝试实现PyV8，将脚本转换为可读的BS4 HTML。问题是我不知道从这里往哪里走。你知道这是不是我的问题吗？我读了很多帖子，今天我很头疼。下面是一个简单的例子。financeWrap包含表信息，但是beautifulSoup显示它是空的。 import requests from bs4 import BeautifulSoup url = "http://financials.morningstar.com/

浏览 0提问于2014-10-21得票数 1

回答已采纳

1回答

无法获得正确的div从表中获取数据

、、

我正在尝试从上抓取数据，在经历了大量的攻击和试验之后，我仍然无法识别如何从表中获取数据？ import requests from bs4 import BeautifulSoup url = "https://gmatclub.com/forum/decision-tracker.html" page = requests.get(url) soup = BeautifulSoup(page.content, 'html.parser') container = soup.find('div', attrs = {'class'

浏览 2提问于2021-05-25得票数 1

回答已采纳

1回答

使用python中的美观汤提取网页中数据丰富的节点

、、、、

使用python中的美丽汤提取网页中数据丰富的节点，有没有方法计算页面中标签的频率， import requests from bs4 import BeautifulSoup url = "http://www.amazon.in" r = requests.get(url) html = BeautifulSoup(r.content) 现在我想数一数所获得的html中所有标签的频率。

浏览 0提问于2015-04-21得票数 2

回答已采纳

2回答

无法在使用python和漂亮汤的网页中爬行一些href。

、、、

我目前正在使用Python3.4和bs4抓取一个网页，以收集塞尔维亚在Rio2016中播放的比赛结果。因此，url 包含指向她所播放的所有匹配结果的链接，例如。然后，我发现链接位于html源代码中，如下所示： <a href="/en/volleyball/women/7168-serbia-italy/post" ng-href="/en/volleyball/women/7168-serbia-italy/post"> <span class="score ng-binding">3 - 0</span

浏览 5提问于2016-08-22得票数 3

回答已采纳

2回答

用Python从雅虎财务中抓取历史数据

、

正如你们中的一些人现在可能知道的那样，雅虎似乎！金融已经停止了股票市场数据的API。虽然我知道fix-yahoo-finance解决方案的存在，但我试图通过直接从雅虎抓取历史数据来实现更稳定的代码解决方案。现在我要说的是： import requests from bs4 import BeautifulSoup page = requests.get("https://finance.yahoo.com/quote/AAPL/history?period1=345423600&period2=1495922400&interval=1d&filter=hi

浏览 8提问于2017-05-28得票数 4

回答已采纳

2回答

我想从Beautifulsoup类继承来完成以下任务

、、、、

我在Python3.5.1和Beautifulsoup4上运行。我现在有这样的代码： from bs4 import BeautifulSoup import html5lib class LinkFinder(BeautifulSoup): def __init__(self): super().__init__() def handle_starttag(self, name, attrs): print(name) 当我用下面的代码实例化这个类时：findmylink = LinkFinder()，当我用下面的代码findmylink.feed("

浏览 18提问于2016-09-24得票数 0

回答已采纳

1回答

Soup不会下载HTML Python中的所有内容

、、

我正在使用BeautifulSoup (bs4)从SSRN论文网址中提取数据，这里是引用https://papers.ssrn.com/sol3/papers.cfm?abstract_id=962461的网址。我需要的数据在页面右侧的PlumX指标小部件上。如果你将鼠标悬停在它上面，看看‘引用: 95’，我想摘录95。这在HTML中是这样的： `<li class="plx-citation"> <span class="ppp-label">Citation Indexes: </span>

浏览 34提问于2020-04-11得票数 0

回答已采纳

1回答

美丽汤:如何获取表格标题中元素的索引

、、

我正在尝试提取表标题中元素的索引，以便以后可以在表正文中使用结果选择适当的列。列的数量各不相同，但我需要的列在标题上保持不变。因此，我想知道，例如，‘index2’是表标题中的index2，因此我可以选择在下面的行中选择相关的<td>s，方法是选择<td>的索引号。以下是我的尝试： #TRIAL TO GET INDEXES FROM TABLE HEADERS from bs4 import BeautifulSoup html = '<table><thead><tr class="myClass">&

浏览 2提问于2014-07-28得票数 2

回答已采纳

1回答

如果存在两个表，则用Pythonic计数和刮擦跳过第一个表。

、、、、

我想从证券交易委员会的文件中获取.xml数据。它在中，但是，如果我到达一个没有.xml的页面，我想要html，可以帮助我理解如何迭代或跳过第一个表(如果有两个表)，如果只有一个表，那么如何获得第一个‘’href‘？ from urllib2 import urlopen import requests from bs4 import BeautifulSoup tableCount = 0 linklist = [https://www.sec.gov/Archives/edgar/data/1070789/000149315217011092/0001493152-17-011092-ind

浏览 2提问于2017-09-29得票数 0

回答已采纳

1回答

使用BeautifulSoup实现多页网页抓取

、、

我正在尝试用BeautifulSoup抓取这个网页的https://www.whoscored.com/Statistics，以便获得球员统计表的所有信息。我有很多困难，不知道有没有人能帮我。 url = 'https://www.whoscored.com/Statistics' html = requests.get(url).content soup = BeautifulSoup(html, "lxml") text = [element.text for element in soup.find_all('div' {'id&

浏览 10提问于2019-03-15得票数 1

1回答

从HTML标记中抓取javascript

、、

我正在尝试从这个网站http://www.smfederation.org.sg/membership/members-directory的所有字母表(Ato Z和0-9)中抓取名字但名字似乎隐藏在href ="javascript:void(0)"中下面是我的代码 import requests from bs4 import BeautifulSoup url = "http://www.smfederation.org.sg/membership/members-directory" for item in url: detail = re

浏览 10提问于2019-12-04得票数 0

回答已采纳

2回答

尝试遍历滚动条数组并从Web下载所有表

、、

我认为这个代码片段已经接近正常工作了，但是它并没有从它所指向的网站下载数据。我正在尝试下载名为“fs- table”的表，并希望将每个“fs-table”放在单独的Excel工作表中。 # pip install -U multi-mechanize import mechanize mech = mechanize.Browser() from mechanize import Browser from BeautifulSoup import BeautifulSoup from openpyxl import load_workbook from openpyxl import Work

浏览 1提问于2018-02-23得票数 2

回答已采纳

3回答

如何从该页中的表格中刮取文本？

、、、

我正在尝试使用和selenium从bs4和selenium页面上的单词列表中刮取单词及其含义，尽管我不知道如何在从bs4 find_all方法获得表html之后循环遍历<tr>和<td>标记： from selenium import webdriver from bs4 import BeautifulSoup root = "https://www.graduateshotline.com/gre-word-list.html" driver.get(root) content = driver.page_source soup = Beauti

浏览 0提问于2021-07-14得票数 1

回答已采纳

2回答

美汤线匹配

、、

我试图构建一个只包含表头和与我相关的行的html表。我使用的网站是。我正在尝试获取表头和表条目，这样我就不必每次都查找自己的名字。我想做的是：获取html页解析它以获取表的标题解析它得到与我相关的表标记(因此包含卢卡斯的表行)构建了一个html页面，该页面显示与me <code>F 210</code>相关的标题和表条目我现在所做的是： my entry添加到数组中，将这个数组传递给生成字符串的方法，该方法可以打印为html页面 def downloadURL(self)：全局输入文件句柄= self.urllib.urlopen(')输入= '

浏览 3提问于2011-09-24得票数 0

回答已采纳

4回答

Python和Beautiful Soup Web抓取

我正在尝试从这个网页上的表格中剔除统计数据：，但是我找不到表格的html。这是在python 2.7.10中实现的。 from bs4 import BeautifulSoup import json import urllib html = urllib.urlopen('http://stats.nba.com/teams/traditional/').read() soup = BeautifulSoup(html, "html.parser") for table in soup.find_all('tr'): print

浏览 0提问于2016-12-17得票数 0