腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
从
站点
上
抓取
表
、
、
//*[self::td or self::th]")] print(data) 任何关于如何
从
表
中获取数据的见解都将受到高度赞赏。
浏览 6
提问于2020-10-26
得票数 0
回答已采纳
2
回答
如何将GSA与Day CQ集成
、
我应该如何
从
GSA连接DAY?我想知道是否有任何方法可以将GSA与Day CQ5 (CMS)集成。我们将邀请您对贵重物品发表意见。 希望能尽快扭亏为盈。
浏览 1
提问于2011-02-11
得票数 0
回答已采纳
2
回答
如何编写刮擦代码以获取不同格式的html
表
、
、
、
、
我以前使用过刮伤,但只从一个
站点
抓取
信息。我想使用刮除从不同网站上的目录中获取信息。在每个
站点
上
,这些信息都存储在一个简单的html
表
中,具有相同的标题。如何校准刮伤以
从
每个html
表
中获取数据,即使每个
站点
的
表
类可能不同?在更大的范围内,我想问的是,当我想访问不同格式的网站时,如何使用刮伤。我将在下面列出几个
站点
的html源代码和xpath的图片。
表
的字段,每个
站点
目录的字段大致
浏览 4
提问于2016-03-15
得票数 0
回答已采纳
2
回答
绕过屏幕
抓取
时出现的警告和错误
、
我创建了一个网页来屏幕
抓取
一个
站点
,同时
从
另一个
站点
抓取
;那个
站点
上有一些错误,所以它抛出了一个错误(预期的对象)。但最终我得到了完美的结果。请给我引路。
浏览 3
提问于2009-03-05
得票数 0
1
回答
Web从不同
站点
抓取
数据
、
、
编写
抓取
器不是问题,匹配来自不同
站点
的数据(可能有很小的差异)才是问题。为了通用起见,假设我
从
两个或更多不同的
站点
上
抓取
了类似的东西: public int id; public String surname; } 如果我
从
两个不同的
站点
抓取
这些内容,我会遇到
浏览 6
提问于2014-05-31
得票数 0
1
回答
如何
从
所有的博客,Multisite到主网站的帖子?
、
、
、
如何显示
从
多
站点
到主
站点
的所有帖子?请帮帮我。谢谢。
浏览 0
提问于2018-08-13
得票数 2
2
回答
谷歌单张
上
的IMPORTxml
、
、
、
、
试图在google工作
表
上
制作一个电子表格,用于
从
站点
中
抓取
数据。https://rsbuddy.com/exchange/?id=1745=IMPORTxml("https://rsbuddy.com/exchange/?id=1745","//*[@id='sell-pri
浏览 4
提问于2015-10-03
得票数 3
回答已采纳
1
回答
如何使用R
从
https
站点
抓取
表
、
、
我想从带有https的
站点
上
刮
表
。我想要有关未来合同细节的表格(合同,到期,批次大小,价格,NRML保证金,即保证金)。 我编写了
从
该
站点
获取
表
的代码,但它显示了两个错误。
浏览 1
提问于2016-02-16
得票数 0
1
回答
如何使用不同的URL重试失败的
抓取
?
、
我有一个功能刮刀,
从
数据库中
抓取
大量网站,并将结果读取到相同的数据库中。我
从
数据库中获取域,并手动附加。在网址
上
。即使这个url不正确,绝大多数
站点
都可以正确地重定向爬行器,但是对于一些
站点
,我得到了一个DNSLookup错误,因为没有重定向,即使该
站点
明显存在并且可以通过浏览器访问。我的问题是,有没有办法重试获得DNSLookup错误的
抓取
,但使用不同的URL?我目前在errback中处理我的错误,我根据我得到的错误类型将必要的信息插入到数据库中。有
浏览 0
提问于2019-04-08
得票数 1
2
回答
如何在PHP中
抓取
ajax调用
、
请让我知道有没有可能在用PHP加载ajax后删除一些信息?我只对静态页面使用了SIMPLE_HTML_DOM。
浏览 2
提问于2015-09-17
得票数 0
1
回答
GWT多久检查一次动态
站点
地图?
、
、
我在一个相当大的
站点
上工作,它每小时生成一个动态的
站点
地图。现在,在工具中,
站点
地图还没有提交,我很害羞,因为我担心新内容(出现在动态
站点
地图中)不会很快被
抓取
。所以我的问题是: GWT多久检查一次提交的
站点
地图?我查看了这个线程爬虫检查sitemap.xml更新的频率是多少次?,根据我的理解,当
站点
定期更新时,谷歌会更频繁地爬行--但同样的情况也适用于GWT吗?
浏览 0
提问于2013-02-19
得票数 5
1
回答
如何在j2ee中获取rss中的新闻内容
、
、
我正在开发一个网站,应该得到其他网站的新闻内容,类似于。但不需要重定向到主持人那里去阅读新闻内容。现在我想问的是,如果有必要直接访问这些网站,从不同的网站获取整个新闻内容的最好方法是什么?对不起,因为我的英语不太好,如果我的问题不够清楚,我可以提前解释,谢谢。
浏览 5
提问于2014-08-14
得票数 1
回答已采纳
2
回答
从
“破坏”杂志收集价格
、
、
我试图自动化的价格,在一个游戏中,显示在电子表格(魔兽世界)。我正在使用TheUndermine杂志来获取价格。我想得到的是当前价格显示在我的电子表格。网站每小时更新一次。=importxml(“”)谢谢!
浏览 1
提问于2021-08-04
得票数 1
回答已采纳
1
回答
抓取
和非API交互
、
我可以只构建一个脚本来检查所有
站点
吗?例如,这是来自一个
站点
的标记: <b> In stock </b>所以我的脚本需要解析它来提取股票信息。据我所知,这种技术的问题是,如果
站点
更改了标记,那么我的刮刀可能会停止工作。 当API不可用时,我如何获得使用API的好处?Javascript能帮上忙吗?
浏览 1
提问于2015-01-20
得票数 0
1
回答
从
站点
抓取
链接
、
我想从一个网站
抓取
链接(示例:www.x.com/date/counter of news)。现在,我的解决办法是:www.x.com/2015/01/13/99901www.x.com/2015/01/12
浏览 1
提问于2015-05-19
得票数 0
1
回答
尝试下载html页面以创建一个非常简单的网络爬虫
、
、
、
我对在python
上
使用html页面是个新手。我正试图在我的PC
上
离线运行BBC
站点
,为此我编写了一段python代码。我已经做了下载网站上的所有html页面的功能,通过在主页
上
找到的链接(使用regex)。我的所有链接都在本地目录中,但它们都被称为sub0、sub1、sub2。我需要一种方式去通过主页
上
的所有链接,并改变他们的整个路径。
浏览 1
提问于2014-01-08
得票数 1
2
回答
上传一个完整的可湿性粉剂网站,而不重做设计/主题部分
、
、
、
当涉及到多
站点
时,这相当耗时。非常感谢您的帮助。真的。
浏览 0
提问于2013-05-15
得票数 0
回答已采纳
5
回答
在Google Cache中保存网页需要多长时间?
我听过很多人问信息在Google Cache中保留多长时间。对我来说,这是无关紧要的(至少在有人诽谤我的名字之前是这样)。
浏览 3
提问于2008-12-08
得票数 4
回答已采纳
1
回答
在将XML导入Google电子表格时感到困惑
、
、
、
、
我正在尝试将每日体育直播赔率导入到谷歌电子表格中。我使用的是importhtml,但我相信我使用的网站已经更新为XML。我喜欢把它组织成电子表格的简单性,而不是去网站,这也有助于我比较赔率。更具体地说,我需要(通过每场比赛)球队名称,现场得分/结果,当前线和收入线。任何帮助都是非常感谢的。提前谢谢。
浏览 24
提问于2019-11-09
得票数 0
1
回答
从
flash
站点
获取内容
、
我一直在使用php-curl
从
基于html的
站点
获取内容,并使用http分析器监控流量,是否可以
从
flash
站点
抓取
某些文本(该文本在
站点
上
X秒后更新)?
浏览 1
提问于2012-07-25
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
网站爬虫抓取规则是什么?如何提升相关技巧?
ITKEE社区版本V.3.0.0重大来袭
要怎么才能知道这个网站的权重在搜索引擎上是高的呢?
百度不收录原因分析——Spider抓取篇
如何将改版损失降到最低
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
即时通信 IM
活动推荐
运营活动
广告
关闭
领券