腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如何
抓取
一个
有
嵌套
表
的
表
?
、
、
、
、
我正在试着刮一下附图中所示
的
表格。 ? 所需
的
输出: ? 我尝试过使用selenium和python
的
漂亮汤库来清理它。但是excel
的
输出都是乱七八糟
的
,尤其是
嵌套
表
部分。我想要如上图所示
的
输出。下面是该
表
的
HTML代码。</tbody> <
浏览 14
提问于2020-08-08
得票数 1
1
回答
BeautifulSoup
抓取
嵌套
表
、
、
我一直在尝试从
一个
使用大量表格
的
网站上
抓取
数据。我一直在研究美丽
的
汤文件,以及这里
的
堆叠溢出,但仍然迷失了。"center"><br /></td> </table> </tr>
有
相
浏览 4
提问于2015-05-05
得票数 6
回答已采纳
5
回答
嵌套
表
上
的
Watir slow
、
、
、
、
我正在使用watir-webdriver从带有
嵌套
表
布局
的
页面中进行
抓取
。举个例子,我在建立了
一个
很小
的
玩具网站。要搜索包含苏联和巴西元素
的
最内部
表
,我使用以下代码:require "watir-webdriver"br.gototable(:text,reg).table(:text,reg).table(:text,reg
浏览 0
提问于2011-06-17
得票数 1
回答已采纳
2
回答
如果没有类或id属性,
如何
使用bs4 4/python在一组
嵌套
表
中找到所需
的
表
?
、
、
、
我
有
以下复杂
的
HTML结构,我必须从这个结构中解析
嵌套
的
表
,并从我想要
的
表
中
抓取
。页面上有很多表格。我很安静,想不出怎样才能到达那张有数据可刮
的
桌子。这是页面的URL。
浏览 5
提问于2013-11-20
得票数 0
回答已采纳
1
回答
htmlagilitypack选择节点返回null
、
、
、
我使用此代码来获取页面信息,但现在站点已更改,并且我
的
应用程序返回null错误。//td[2]").InnerText}).ToList(); <div role="tabpanel" class="tab-pane fade " id="tab3
浏览 47
提问于2018-08-12
得票数 1
回答已采纳
1
回答
cocoa,具有核心数据数据源
的
表
视图
、
、
我
的
目标是用从核心数据获取
的
实体填充
一个
表
视图。我已经为我
的
主窗口视图创建了
一个
自定义控制器类。我还有一些代码来获取我
的
类别实体NSEntityDescription *entity; NSLog(@"categories %@&q
浏览 2
提问于2013-06-19
得票数 0
回答已采纳
1
回答
glue爬虫ETL后
的
雅典娜流水线查询
、
、
、
、
我
有
要进入S3存储桶
的
数据,我想每小时对其运行一次查询。数据以JSON
的
形式传入。我
抓取
它,在数据上运行作业以将其转换为ORC格式,然后再次
抓取
它以创建
一个
比原始JSON更快
的
表
(因为它们
嵌套
得很深)。我正试着和雅典娜一起查询数据。这里
的
问题是,最后
一个
爬虫应该创建新
的
表
,而不仅仅是同
一个
表
的
分区,因此在运行作
浏览 19
提问于2019-02-12
得票数 1
1
回答
使用BeautifulSoup找不到深度
嵌套
标记ID
、
我试图从中
抓取
NBA数据,但我遇到了BeautifulSoup抛出深度
嵌套
标记
的
问题。我试着用soup.find(id='opponent-stats-per_game')来
抓取
“对手每个游戏统计”
表
。然而,我得到了None
的
结果。如果我试图找
一个
在树上更高
的
div,那么它会剪辑更深
的
孩子。 有人能给我一些指导吗?我对使用BeautifulSoup进行网络
抓取
相当陌生。
浏览 1
提问于2019-04-03
得票数 0
回答已采纳
1
回答
从标记中提取惟一
的
类名
、
、
、
我正在把(对我来说)相当大
的
数据刮成
一个
漂亮
的
汤对象。典型
的
抓取
结果是600页或更多
的
html标记,
有
许多
嵌套
的
表
。我试图更好地理解结构,以便有效地将数据从
表
中提取出来。这些汤对象中有多达500个
表
,其中有许多“重复”
表
类。以下是两个例子。<table class="TableClass1"> <table class=&qu
浏览 0
提问于2020-01-10
得票数 0
回答已采纳
1
回答
如果网站
有
多个
表
,
如何
抓取
特定
的
表
?
、
、
我最近写了
一个
脚本,从
一个
网站()上
抓取
一些财务数据,这样我就可以跟踪项目交易量
的
变化。我过去常常使用它从'table20‘中获取值。soup = BeautifulSoup(current_page, 'html.parser')但是,tbl现在是
一个
没
浏览 0
提问于2020-03-23
得票数 0
1
回答
在python中从
嵌套
的
URL中
抓取
和解析
表
、
、
、
我想出了怎么刮擦如果页面有
一个
表
,则从HTML页面中删除
表
,但现在我需要刮擦和解析
表
从子链接,这是在母链接,我想我需要循环通过所有的子链接来解析它
的
表
,我感兴趣
的
。我
的
尝试 这是我目前
的
尝试刮擦并从HTML页面解析单个
表
,但我不知道
如何
从
嵌套
的
HTML页面中
抓取
和解析具有唯一
表
名
的
表
,并在最后
浏览 33
提问于2020-07-28
得票数 1
回答已采纳
1
回答
Python漂亮汤
抓取
桌
、
我不确定我是不是抓到了正确
的
标签。这是我到目前为止所拥有的。当我悬停在那个标签上时,它会高亮显示这个
表
吗?
浏览 6
提问于2014-04-02
得票数 2
回答已采纳
1
回答
C/C++:在
嵌套
表
中,
如何
在__index函数中找到顶部?
、
在有
一个
嵌套
的
表
和使用
一个
元与__index函数。在__index函数中,我只接收
嵌套
的
表
和字符串索引。
如何
向后搜索以找到
表
的
根?
浏览 2
提问于2014-08-24
得票数 0
回答已采纳
1
回答
如何
获得具有特定内容
的
td
的
表
?
、
我将selenium用于web
抓取
:path_to_chromedriver = '/usr/lib/chromium-browser/chromedriverexecutable_path=path_to_chromedriver) element = browser.find_element_by_id('email') 现在,我
有
了
一个
网站,它生成大量
嵌套</
浏览 2
提问于2017-08-17
得票数 0
回答已采纳
1
回答
从添加到按钮按下
的
html中
抓取
网页
、
、
、
我试图从
有
一个
巨大
表
的
页面中
抓取
数据,该
表
将100个条目显示为默认值。底部
有
一个
select/选项,允许您将条目更改为200或全部。
如何
在刮
表
之前将selecter设置为All,因为我希望从所有条目中
抓取
,而不仅仅是前100项。 我使用node.js/JavaScript从页面中
抓取
。
浏览 1
提问于2016-10-17
得票数 0
回答已采纳
1
回答
Asciidoctor
嵌套
表
、
我试图在我
的
Asciidoctor pdf输出中创建
嵌套
表
,但我找不到语法。我已经按照表11中
的
示例进行了尝试:,但无济于事。
浏览 1
提问于2017-02-27
得票数 0
2
回答
Nutch正则表达式不能按我希望
的
方式爬行
、
、
好吧,我已经问过了,但我猜我没有问到stackoverflow期望
的
方式。希望这一次我能有更多
的
运气和答案。我要它爬行该网站和所有子链接。+^http://([a-z0-9]*\.).)*http://tigerdirect.com 基本上,我试图完成
的
是爬行他们
的
网站上
的<
浏览 1
提问于2013-04-20
得票数 2
回答已采纳
3
回答
从select语句查询
、
我们可以从查询中进行查询吗?select * from (select budgetyear from bg_year)
浏览 0
提问于2012-12-21
得票数 0
2
回答
如何
从网页中
抓取
表
,并排除在tables<td>标记中取消
的
特定
表
、
、
、
我想从
一个
特定
的
网页上刮一张桌子。问题是,
表
的
某些td包含包含另
一个
嵌套
表
的
嵌套
span标记。 我想从其中刮出
的
网页是下面的。我已经包含了
一个
表
的
小样本,我想用
一个
类工具提示图标包含在span标记中
的
嵌套
表
进行
抓取
。当
抓取
整个
表
时,
浏览 2
提问于2019-05-02
得票数 1
回答已采纳
1
回答
R:
抓取
嵌套
的
带链接
的
html表格(单元格中
的
表格)
、
、
对于大学研究,我尝试
抓取
FDA
的
表格(robots.txt允许
抓取
此内容) 该
表
包含19行和2列: https://www.accessdata.fda.gov/scripts/cdrh/cfdocs由于第2列
的
某些单元格包含
表
,因此此方法不会提供相同数量
的
项: # extract col 2 items html_nodes("td") %>% html_t
浏览 21
提问于2021-02-27
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
数据库里表太多?快速获取某张表的表定义语句有妙招
Excel跨表求和方法:结构不同的工作表,如何进行跨表求和?
好多个行列标题迥异的 Excel 表,如何快速合并成一个大表且求和?
没有了抄表员,电表是如何实现自动抄表的
如何修复无效的分区表
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券