Web从HTML文件中抓取表

文章/答案/技术大牛

发布

2回答

python、html、web-scraping

大家好，我希望得到一些帮助，在我的HTML文件中的表格，并将它们导入到csv文件。我是非常非常新的网络抓取，所以给我，如果我的代码完全错误。HTML文件包含我试图提取的三个单独的表；估计、抽样误差和估计中非零图的数量。urllib2table = "file:///C:/Users/TMccw/Anaconda2&

浏览 8提问于2017-07-19得票数 1

1回答

Python比较数据表

python、datatable、compare

我正在做一个项目，我需要比较数据从python与数据从excel或txt文件。我将尝试解释得更好:我从网站上抓取了一个数据表(7行1列的数据表)，我需要将这些值与txt或excel文件进行比较。此txt或excel文件有一个数据表，其中包含web抓取的数据表中存在的3个值(3行1列)。Web抓取数据表<

浏览 0提问于2020-05-28得票数 0

1回答

R:使用rvest从FIFA抓取表时出现的问题

r、web-scraping、dplyr、rvest

我试图从过去30年中至少参加过一次世界杯的每一支球队中收集数据。library(rvest)fifadata <- read_html("http://www.fifa.com/fifa-tournaments/teams/association=BRA/

浏览 1提问于2017-11-22得票数 0

1回答

如何将配置单元数据访问到html页面

php、html、hadoop、hive、hbase

我在hadoop中有一些抓取的数据。我已将数据从hbase表导出到hive表..所以现在我必须通过html，php等访问它的表格，这样我才能在web上显示它。他们有没有可用的教程或工具？我的最终目标是从hive表中搜索web上的一些记录。

浏览 3提问于2015-04-08得票数 0

1回答

使用R从网站中的表中抓取数据

css、r、web-scraping

我正在尝试学习R中的web抓取，并且尝试从下面的链接中从各种表中抓取数据。在页面的底部，有几张表格列出了不同的菜系，我想单独读一读。我尝试使用css-选择器，但我认为我使用它们是错误的，下面是我的代码片段：require(magrittr) connection = html_session("https://en.wikipedia.org/wiki/

浏览 3提问于2015-10-19得票数 0

回答已采纳

1回答

如何从web中抓取数据并读取表中的所有数据

我正在尝试从web中抓取数据，特别是从具有不同过滤器和页面的表中抓取数据，并且我有以下代码： url.colombia.compra <- "https://colombiacompra.gov.conumber_order=&state=&entity=&tool=IAD%20Software%20I%20-%20Microsoft&date_to

浏览 5提问于2021-07-21得票数 0

回答已采纳

1回答

Web抓取R中的html表

r、regex、web-scraping

我有一个网页：我知道我可以结合greprexpr()和regmatches()来提取我需要的信息。我还知道表中的每个单元格都以<TD>开头，以</TD>结尾，但我需要这些标记之间的信息。到目前为止，我有：htmlCode <- getURL("http://probabilityfootball.com/picks.htm

浏览 6提问于2018-03-03得票数 2

1回答

Web在Cheerio中抓取HTML表

javascript、node.js、web、web-scraping、cheerio

我对一个网络抓取项目有一个问题。下面是我需要抓取的页面的示例： <thead>..</tbody>有关更多细节，请参见以下页面：我想访问tr标签中的信息，但我无法实现。

浏览 4提问于2016-03-02得票数 1

回答已采纳

1回答

从Web抓取中删除HTML

python-3.x、web-scraping

python新手，正在尝试学习web抓取。我目前遇到了一个问题，试图弄清楚如何从最终产品中删除html。from bs4 import BeautifulSoupurl = 'http://web.mta.info/developers/turnstile.html' response(对于html，我不确定如何在这里发布它，它在终端中的实际

浏览 18提问于2020-04-19得票数 0

回答已采纳

0回答

Python BeautifulSoup找不到表ID

python、html、beautifulsoup

我在使用BeautifulSoup抓取表时遇到了一些问题。urlopenNone 当我右键单击表检查元素时，HTML看起来和我预期的一样，但是当我查看源代码时，唯一id =‘t

浏览 4提问于2017-06-08得票数 1

回答已采纳

2回答

从web链接中抓取表

r、web-scraping、html-table、rvest

我想从中提取Holdings表，我有以下代码： test_html = read_html(turl) 但是，在运行它时，我会得到以下错误：矩阵中的错误(NA_character_，nrow = n，nrow = maxp)：无效的

浏览 3提问于2017-11-22得票数 2

1回答

使用rvest从HTML表中进行Web抓取

javascript、html、r、web-scraping

我是web抓取的新手，我正在尝试抓取下表： <table class="dp-firmantes table table-condensed table->striped("https://www.hcdn.gob.ar/proyectos/resultados-buscador.html?")table <- html_nodes(link, 'table.dp-fi

浏览 17提问于2018-06-16得票数 0

2回答

HTML屏幕抓取-并非所有元素都在HttpWebResponse中

c#、screen-scraping

我目前正在尝试使用以下代码进行屏幕抓取：HttpWebResponse(theResponse.GetResponseStream(), Encoding.UTF8)) string s = reader.ReadToEnd();但是，我关心的数据( HTML表)不是结果的一部分。当我右键单击页面和ViewSource时，我也看不到我关心的HTML表

浏览 0提问于2012-06-22得票数 2

回答已采纳

2回答

web从表中抓取数据

python、web-scraping

我想刮一下本页的年度损益表、资产负债表和现金流量。https://www.google.com/finance?q=NYSE%3AIBM&fstype=ii&ei并将其放入数据帧中。有人能告诉我如何刮取年度损益表吗？这是我目前所拥有的。我可以看到汤中的数据，但我不知道如何得到它。Chrome/19.0.1084.46 Safari/536.5'}soup

浏览 4提问于2016-03-08得票数 1

回答已采纳

1回答

无法使用简单Html* Dom (PHP)找到并抓取某些Div*

web-scraping、simple-html-dom

经过几次尝试，我创建了这个小代码，它刮掉了所有的html div，请告诉我我做错了什么，以及你的想法。谢谢!(在底部:此页面中我正在寻找的部分的图片)include_once("simple_html_dom.php"); $html = file_get_<

浏览 4提问于2017-06-09得票数 0

2回答

WebScraping一张表不适用于

python、web、web-scraping、beautifulsoup、python-requests

我只是从web抓取开始，想尝试从这个中抓取表，但是当我开始查找表的类时，它不工作，而是显示了Nonefrom bs4 import BeautifulSoupsoup = BeautifulSoup(r.text,'html.pa

浏览 7提问于2021-04-02得票数 0

回答已采纳

2回答

使用ImportHTML和Google sheets进行web抓取

web-scraping、google-sheets、google-sheets-formula、google-sheets-importxml

我正在尝试用Google sheet和ImportHTML (以及它的变种，如ImportXML和ImportData)从网页上抓取股票行情。它可以在一些网页上工作，但不能在其他网页上工作。我无法从其中导入数据的网页的一个例子是。有没有办法下载或抓取这些数据？

浏览 9提问于2020-06-15得票数 0

1回答

使用Python Web抓取HTML表

python、for-loop、web-scraping、beautifulsoup、html-table

试图从纳斯达克主页题为“股票市场活动”的表格中提取指数和价值数据： html = urlopen(NASDAQ_URL).read() for row in soup('table', {'class': 'genTable

浏览 11提问于2015-10-31得票数 2

5回答

如何从其他网站获取数据？

python、database、parsing、web-scraping

我想创建一个网站，从其他网站提取信息，并将它们打印到我的网站上，我正在进行研究，所以我想听取一些意见，这个项目的最佳解决方案是什么？

浏览 1提问于2013-06-14得票数 4

2回答

使用R从网页中抓取表格和链接

r、dataframe、web-scraping、hyperlink、data-cleaning

我正在尝试抓取一个网站与R。我需要的表和该表中与表中正确的行相关联的链接。我可以得到表和链接，但是因为在web表中有两列有链接，表中的一些行没有链接，并且链接不能通过文件名进行排序和连接。library(rvest) content <- read_html("https:/&#

浏览 30提问于2021-01-29得票数 2

点击加载更多