腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
屏幕
抓取
带有
.
exe
href
链接
的
页面
curl
、
screen-scraping
我正在尝试使用curl从以下网页获取实时水流数据:https://www.waterrights.utah.gov/cgi-bin/dvrtview.
exe
?SYSTEM_NAME=BEAVER%20RIVER 使用: bret@ubuntu:~$ curl https://www.waterrights.utah.gov/cgi-bin/dvrtview.
exe
我怀疑这与通过可执行文件dvrtview.
exe
调用via服务器上
的
数据库而生成<
浏览 16
提问于2019-06-06
得票数 0
1
回答
IMDB网络爬虫- Scrapy - Python
python-3.x
、
scrapy
、
python-3.6
、
scrapy-spider
,asc'] urls = response.css('h3.lister-item-header > a::attr(
href
response.urljoin(url),callback=self.parse_movie) item['actors
浏览 21
提问于2018-08-26
得票数 0
回答已采纳
1
回答
将站点
屏幕
抓取
到新
的
浏览器窗口
asp.net
、
screen-scraping
我不确定我问
的
是不是可能。我有内部Sharepoint网站,只能通过有效
的
凭据(Windows/SQL身份验证)访问。从测试ASP.NET web应用程序,我执行了登录
屏幕
抓取
,获得_VIEWSTATE,__VIEWSTATEGENERATOR,__EVENTVALIDATION等,然后提供凭据和准备
的
PostData,并能够获得cookies,最后能够成功登录到安全
页面
。我得到了安全
页面
的html源代码。 现在,我需要在单独
的
浏览器窗口中启
浏览 0
提问于2018-05-24
得票数 1
3
回答
Scrapy LinkExtractor无法提取
带有
邮件地址
的
链接
:
python
、
hyperlink
、
scrapy
我使用LinkExtractor类来提取
页面
中
的
所有
链接
print link.url这将打印
页面
中
的
所有URL。但是我似乎不能得到
href
等于mailto: link
的
链接
。例如: <a
href
="mailto:example@gmail.com">Mail<
浏览 2
提问于2016-01-21
得票数 0
1
回答
WGET -从第三方网站下载特定文件(通过扩展或mime类型)
bash
、
shell
、
terminal
、
wget
我需要使用wget从网站获取所有的".js“扩展文件,包括第三方
的
扩展文件,但并不总是这样做。我
的
代码中是否遗漏了什么? 提前感谢!
浏览 24
提问于2020-04-29
得票数 0
1
回答
如何使用从selenium检索到
的
元素?
selenium
、
selenium-webdriver
如何有效地使用从Selenium检索到
的
存储在变量中
的
元素?我使用
的
是python。matching_threads.append(i)print(matching_threads)我从matching_threads
的
打印输出中得到以下内容我要做
的
是转到该元素,然后单击该元素右侧
的
元素。我不能理解
的
是,如何使用matching_threads中存储
的
信息检索sele
浏览 21
提问于2021-02-18
得票数 0
回答已采纳
1
回答
用于在不同
的
html标记之间
抓取
文本
的
Xpath查询
html
、
r
、
xpath
我正在使用R来
抓取
屏幕
。我已经
抓取
了一个
页面
,并且我已经设法找到了
页面
上在
页面
上某个位置找到
的
所有
链接
(具有name属性
的
锚标签内
的
锚标签),使用:现在,我已经从Curl
的
链接
中
抓取
浏览 0
提问于2013-09-27
得票数 1
3
回答
如何点击在
href
中有javascript:__doPostBack
的
链接
?
javascript
、
python
、
mechanize
我正在用python编写一个
带有
模块'mechanize‘
的
屏幕
抓取
器脚本,我想在一个在
href
中有javascript:__doPostBack
的
链接
上使用mechanize.click_link()我相信我正在尝试解析
的
页面
正在使用AJAX。>>> next_link.__class__.attrs=[('id',
浏览 1
提问于2009-09-13
得票数 7
回答已采纳
1
回答
刮掉似乎没有URL
的
页面
ruby
、
web-scraping
、
screen-scraping
、
nokogiri
、
mechanize-ruby
我试图在一个属于我
的
客户
的
网站上为这些职位列表提供更多
的
曝光机会。问题是,我需要能够
链接
到具体
的
工作列表,以便求职者申请。我试着保存列表
链接
。如果我能为求职者保存一个地址,让他们点击原始名单,然后再申请,那将是非常理想
的
。 这个网站为什么不提供这些
页面
的URL?如果我无法获得一个特定
的
地址,我想我可以得到它,这样用户就可以点击一个
链接
,该
链接
触发我
的
客户站点上
的</em
浏览 3
提问于2013-09-28
得票数 1
回答已采纳
1
回答
如何使用jquery或部分匹配匹配文本
jquery
我在锚点标记中有这个超
链接
现在,我希望当该
页面
被单击时,我会看到
带有
如下超
链接
的
页面
有没有可能我可以用jquery
抓取
var1。即使它部分匹配,它也是好
的
浏览 0
提问于2010-06-21
得票数 0
回答已采纳
1
回答
屏幕
抓取
-仍不工作
vb.net
、
visual-studio-2008
我想刮
的
html
页面
,有一些脚本运行,通常执行
的
脚本,以显示点击后
的
链接
。一些人提到了firebug,另一些人则谈到了我需要
的
代码
的
逆向工程。jQuery(this).addClass('activeLink'); ); 我正在使用vb.net,一些网站很容易使用firebug,在那里,通过查看脚本,我能够提取所需
的
数据该
链接
是和类别是我试图访问
的
。请注意,url不会更
浏览 3
提问于2010-03-13
得票数 1
1
回答
使用JavaScript制作HTML
链接
对搜索引擎优化是有效
的
吗?
seo
、
search-engines
、
javascript
我希望在WordPress站点上
的
每一篇文章中
的
内容区域中将匹配文本替换为html
链接
。 我是通过JavaScript实现
的
,如下所示。document.querySelectorAll( selector )[i].innerHTML = document.querySelectorAll( selector )[i].innerHTML.replace( term ,`<a
href
="https://yuis-programming.com/vpn&qu
浏览 0
提问于2020-01-14
得票数 1
1
回答
单击使用Ajax接收到
的
Anchor时重新运行函数?
javascript
、
jquery
、
ajax
我正在尝试使用jQuery和Ajax创建一个
页面
转换效果。然后,我使用ajax获取
href
并
抓取
容器div中
的
所有HTML,在本例中是
带有
transition id
的
div,并在内容之间进行一些衰落。因此,我将用使用ajax提取
的
HTML替换
页面
上
的
HTML。这是我第一次使用transitionLink类单击锚
链接
时,它非常有效,但是一旦我尝试单击另一个锚
链接
(在HTML中从ajax调用中接收到),
浏览 0
提问于2019-05-24
得票数 1
回答已采纳
2
回答
Perl,使用机械化来导航网页
perl
、
screen-scraping
、
www-mechanize
我有一堆网页,我想通过一个脚本导航和
抓取
所有的内容。我知道这个
链接
是每个
页面
上
的
第18个
链接
。我有以下代码作为测试,只需跟踪
链接
一次并
抓取
屏幕
:use WWW::Mechanize; p
浏览 0
提问于2012-03-22
得票数 0
1
回答
BeautifulSoup "find“方法莫名其妙地返回NoneType
python
、
beautifulsoup
我正在使用BeautifulSoup模块查找不同种类
的
水母菌类
的
图像和站点
链接
,将它们写入html文件,并将它们显示给用户。links.append(link["
href
"]) </a></html> webbrowser.open(&
浏览 37
提问于2020-03-29
得票数 0
回答已采纳
1
回答
使用python lxml
抓取
多个
页面
的Glassdoor
python
、
web-scraping
我使用下面的脚本通过Glassdoor
抓取
工作列表。下面的脚本只
抓取
了第一页。我在想,我怎么才能把它从第一页刮到最后一页呢? 如果有任何帮助,我将不胜感激
浏览 11
提问于2018-02-09
得票数 0
1
回答
如何使用webscrabe图像
链接
选项卡
html
、
python-3.x
、
beautifulsoup
、
python-requests
、
python-requests-html
我正在尝试网络刮图像标签,以便我可以得到它
的
链接
,我可以使用,这样我就可以直接去图像我正在制作
的
项目。,但不同
的
链接
,所以我如何区分这两者?图片
链接
的
HTML我希望我可以在这里放一个截图,因为这是很难理解
的
。1H5a1 1 0 0 0-1 1v14a1 1 0 0 0 1 1h7v-.01h7a1 1 0 0 0 1-1V5z"></path></svg></span>I
浏览 0
提问于2019-08-31
得票数 0
2
回答
我正在
抓取
一个亚马逊网站,使用selenium作为产品
链接
,但得到下面附加
的
错误
selenium
、
selenium-webdriver
、
web-scraping
、
selenium-chromedriver
、
screen-scraping
下面是我从亚马逊
抓取
产品
链接
的
代码,但得到了错误。我试图从多个
页面
抓取
链接
的
代码是很好
的
,3页后,给出了下面提到
的
错误。wbD = wb.Chrome('chromedriver.
exe
') pp2 = elem.find_element_by_ta
浏览 19
提问于2020-10-14
得票数 0
1
回答
JavaScript:将像素位置添加到每个
链接
的
href
javascript
是否可以将
href
-link
的
坐标添加到target-query中? 我
的
意思是这样
的
: <a
href
="index.php?action=create&id=123&x=[...]&y=[...]" id="123">Link 123</a> 这应该通过document.write()或其他方法将
页面
上
链接
(id)
的
坐标添加到查询中。PS:应该在没有J
浏览 6
提问于2020-10-20
得票数 0
2
回答
如何使用Nokogiri在
href
中加载javascript函数
ruby
、
nokogiri
我想在我
的
ruby项目中使用Nokogiri
抓取
一些html
页面
。在爬虫
页面
,有一些
链接
,我也想
抓取
。但问题是
链接
的
href
在javascript函数中。<a
href
="javascript:nextPage('some text','','other text')">Click here</a> 如何
浏览 3
提问于2016-02-18
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
教你分分钟学会用python爬虫框架Scrapy爬取心目中的女神
SEO优化中a标签超链接的代码优化总结
利用Python和Repl.it进行网页信息爬取
PHP实现远程抓取网站图片并保存在文件中
源代码超级链接
热门
标签
更多标签
活动推荐
运营活动
广告
关闭
领券