腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
3
回答
如何用jQuery和XPath
抓取
网页?
、
、
、
然后,我可以运行一个脚本来
抓取
它和它所链接的
页面
。 我该如何开始用jQuery或javascript编写这个脚本呢?在jQuery/Javascript中是否有一个接口可以让我使用XPath来访问
页面
(以及它所链接的
页面
)上的元素?
浏览 3
提问于2012-03-08
得票数 4
2
回答
如何使用文本html字符串来
抓取
一个没有id的表?
、
、
、
、
我要
抓取
的表格没有特定的表格id,表格的高度/宽度级别与同一
页面
上的其他表格匹配,但
文字
html字符串是唯一的:那么"soup.find()“中的格式是什么来查找这个
文字
字符串呢?
浏览 1
提问于2017-09-17
得票数 1
1
回答
基于一个模板创建多个动态内容的
页面
我已经创建了一个
页面
,看上去与我想要的完全一样。例如,当我更改模板时,添加一个按钮。它必须在所有的
页面
上改变。 有可能用wordpress吗?我甚至不知道该从哪里开始搜索。我正在考虑放弃wordpress,只需要一个静态html/css/
js
模板,直接从数据库中提取数据.
浏览 0
提问于2020-02-15
得票数 0
2
回答
BeautifulSoup没有读取节标记中的html组件。
、
、
url).read()print table [] or null<section class="h
浏览 4
提问于2016-10-31
得票数 0
回答已采纳
1
回答
屏幕
抓取
JS
页面
、
、
我正在尝试
抓取
这个
页面
,但它不工作。我试过了 $html->load_file($url); 但是对于我想要
抓取
的问题(.trivia- found )却找不到。
浏览 3
提问于2013-07-03
得票数 3
回答已采纳
2
回答
浏览器中的Html与Python中请求的Html不同
、
、
、
PapaGordsmack/", headers=headers)print(html_contents) 我试图从特定用户的sky.lea.moe网站上
抓取
网页,但当我请求并打印html时,它与浏览器中显示的不同(在chrome上,查看
页面
源代码)。
浏览 20
提问于2020-02-09
得票数 0
1
回答
从html
页面
不显示数据的url读取数据
、
我正在尝试以下代码:if __name__ == '__main__': import requests r = s.get(link) print(sou
浏览 1
提问于2020-02-05
得票数 0
1
回答
有没有可能用NodeJS
抓取
任何给定的网址?
、
我已经阅读了一些关于
抓取
的文章,似乎NodeJS、ExpressJS、Request和Cheerio是我作为一个熟悉
JS
/jQuery的前端人员的首选方法。到目前为止,我读过的所有文章都集中在没有API的情况下从特定网站上
抓取
数据,而我想要实现的是一个工具,它可以获取任何给定的URL,并返回true/false来列出正在使用的通用库和链接的社交网络。由于CSS选择器,我选择的设置(如上)是合适的,还是仅限于
抓取
特定
页面
?
浏览 0
提问于2014-08-07
得票数 0
1
回答
是否更容易
抓取
AMP版本的网页?
、
、
、
、
我知道AMP协议要求Javascript的精简版本,我也知道Javascript (在一定程度上)使网站管理员能够检测/防止
抓取
。因此,从逻辑上讲,我认为
抓取
AMP网站会更容易一些。
浏览 11
提问于2019-04-08
得票数 0
2
回答
抓取
使用javascript注入html的网站
、
我试图用Node.
JS
抓取
一个网站,但当
抓取
html文件时,出现的东西是注入JavaScript的脚本标签,在查看有问题的JavaScript文件时,我似乎是正确的,因为我发现了我试图
抓取
的文本。在这个脚本被注入到html之后,我如何
抓取
文档?有什么办法吗?谢谢
浏览 22
提问于2020-11-04
得票数 0
回答已采纳
1
回答
使用Python从web xhr提要中
抓取
数据
、
、
、
我有两个问题: #these all return empty element sets 如何加载所有可见结果的
页面
编辑:在建议使用selenium之后,我构建了一个函数,它将使用Selenium/Chrome加载
页面
,然后将ht
浏览 1
提问于2017-01-17
得票数 1
回答已采纳
2
回答
木偶人爬行器大规模爬行
、
、
我们正在使用Puppeteer编写一个网络爬虫。我们写的木偶爬虫执行和爬行网站的网址没有问题的网页,如约1,500 - 5,000,但是,当我们执行的网站超过5,000,如果它在中间由于一些错误或崩溃而中断,那么它需要重新开始。如果出现任何错误,如何使基于Puppeteer的网络爬虫从爬行的最后状态恢复?在Puppeteer中有没有内置的函数?如何让这个木偶手无头的chrome web爬行通过一个队列系统?
浏览 14
提问于2020-12-05
得票数 2
1
回答
使用VBA从Yahoo拉取季度股票数据- 2020更新
、
、
因此,我已经能够编写一个脚本,能够从Excel中提取股票基本面数据。耶。我知道这个更新已经难倒了很多人。这是我当前的代码。我希望与网页互动,以便我可以拉资产负债表和现金流数据以及。此外,我希望从季度而不是年度的角度来看待这些数据。为了便于参考:https://finance.yahoo.com/quote/AAPL/financials?p=AAPL 这将需要我按下屏幕上的一个按钮;但是,我不确定如何进行这项工作。 Sub importData() Chart.Delete Dim
浏览 21
提问于2020-12-28
得票数 0
1
回答
如何在colly上启用
Js
、
我正在尝试从一个网站中刮取数据,但它返回以重新获得访问,请确保在重新加载
页面
之前启用了cookie和JavaScript。fmt.Println("item is already crawled") }) 我在文档“自动cookie和会话处理”中看到了,所以问题可能是
js
首先,可以尝试如何在colly中启用
js
?
浏览 5
提问于2020-10-04
得票数 1
2
回答
任何人在使用angular2时都会经历缓慢的加载时间
、
、
、
、
我有一个有
文字
记录和系统an的两个角度的应用程序。我所有的
js
和css都很小/很小,总共有11个请求,几乎没有任何图像。下面的是文件和加载时间的屏幕快照:这是速度测试结果:
浏览 4
提问于2016-12-05
得票数 4
1
回答
从
页面
抓取
时遇到麻烦
、
、
、
参考我的一个,我必须
抓取
一个酒店的评论(所有评论),例如这个我已经使用Selinium
抓取
了评论,但我的客户不想使用Selinium,因为它加载了整个
页面<
浏览 0
提问于2014-11-28
得票数 1
1
回答
具有单击处理程序和href属性的链接,哪个是由Googlebot调用的?
、
我的站点上有以下锚代码:对于人类用户,onclick将在不刷新
页面
的情况下使用它是否会忽略onclick,直接转到href中给出的
页面
,或者处理onclick,或者在索引我的网站时两者都做? 雅虎和必应也面临同样的问题,但最重要的是谷歌。
浏览 0
提问于2018-04-19
得票数 1
2
回答
除非启用了Javascript,否则使用php函数
、
、
我有一个网站,将
抓取
新的数据在第一页访问。我想使用AJAX来做这件事,这样我就可以在
抓取
过程中向用户提供至少一些loading.gifs,但这只有在启用了Javascript的情况下才能实现。我的站点使用了一个PHP模板引擎,所以我想把
抓取
函数放在html模板的<noscript>标记中。因为这将在所有PHP代码之后发生,所以我必须重新加载
页面
,以便可以使用PHP呈现/解析
抓取
的数据。
浏览 0
提问于2011-01-16
得票数 1
2
回答
查找带有字幕的一种特定语言的youtube视频
、
、
我想
抓取
Youtube上包含字幕/封闭式字幕(CC)的特定语言的视频。 我想
抓取
550马来人随机视频与马来字幕/(CC)。
浏览 3
提问于2020-04-21
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
爬虫抓取页面图片
如何吸引百度蜘蛛来抓取页面,蜘蛛抓取页面的因素
爬虫抓取页面图片 update
批量抓取页面图片 up!
JS技法-页面悬浮导航
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券