腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
抓取
Java
网页
、
、
我已经找到并阅读了相当多关于
抓取
的文章,但不知何故,作为一个初学者,我不知所措。
浏览 3
提问于2019-02-19
得票数 0
2
回答
在
Java
中从某个URL调用脚本?
、
、
、
、
为了方便起见,我使用
Java
解析一个随机网站的超文本标记语言,假设它是。在解析HTML数据之后,我希望提取其中的一些数据,并将其显示在显示器上。之后,用户将输入搜索词,并按下一个按钮。
浏览 0
提问于2012-03-30
得票数 0
回答已采纳
2
回答
通过
java
抓取
网页
、
、
、
、
我需要获取一个给定的
网页
,然后将HTML标记转换为XML标记,然后从这些XML标记中构建一棵树。我该怎么做呢??请给我一些好的链接或基于这些的教程,顺便说一句,我使用的是
Java
语言。 谢谢。
浏览 0
提问于2011-04-30
得票数 0
回答已采纳
1
回答
将特定的<div>类从html提取到webview
因此,我正在开发这个android应用程序,以利用学校
网页
并检索html文档中的特定内容。问题是,当我在android中使用webview时,我只被允许使用整个页面。例如,从我下面代码中包含的
网页
中,我有一小段来自我希望这是唯一出现在网络视图上的东西。有什么建议吗?提前感谢!
浏览 1
提问于2013-09-08
得票数 1
1
回答
如何使用
Java
获取外部
网页
的XMLHTTPRequest响应文本?
、
我很难解析来自外部网站的数据,例如,仅使用
Java
的stackoverflow.com。为了了解这个
网页
的内容,我去了,并在那里找到了我需要的所有信息XMLHTTPRequest response!问题是如何仅使用
Java
而不使用Servlets来获取这些数据。
浏览 5
提问于2016-03-17
得票数 0
回答已采纳
1
回答
将HTML div转换为
Java
/JSON对象?
、
、
、
、
有没有一种方法可以在我的代码中读取整个HTML格式的网站,然后将HTML转换成
java
或json对象?
抓取
一个站点并从某些div中提取文本是很酷的。有没有什么方法可以使用编组程序来做这件事?
浏览 97
提问于2021-07-30
得票数 0
1
回答
使用
Java
以编程方式读取动态创建的RSS提要
、
、
我在想,我们需要一些嵌入式
网页
,但这看起来就像是用大锤敲坚果一样。编辑:在浏览RSS提要时关闭javascript之后,仍然返回XML格式的提要数据,这在某种程度上加剧了我的困惑。
浏览 0
提问于2013-11-19
得票数 1
3
回答
将php页面转换为
java
代码
、
我有一个
网页
,即php页面,它是一个表格。我想把这个页面带到
java
中,即在
java
页面中,我想使用.php页面的网址显示此表单。这是可能的吗?如果是的话,是如何实现的?有问题的澄清: 我有一个
java
网页
。在这个
网页
上,我想要一个Iframe或任何类似的东西,它将显示一个使用php url的php表单,并执行保存操作。
浏览 1
提问于2012-07-02
得票数 0
回答已采纳
1
回答
如何获取crawler4j中的url是404还是301
是否可以在crawler4j中获取URL是404还是301? public void visit(Page page) { System.out.println("URL: " + url); HtmlParseData htmlParseData = (HtmlParseData) page.g
浏览 3
提问于2013-02-04
得票数 1
10
回答
使用
Java
进行Web
抓取
、
、
我找不到任何好的基于
Java
的web
抓取
API。我需要
抓取
的站点也不提供任何API;我想使用一些pageID遍历所有
网页
,并在它们的DOM树中提取HTML标题/其他内容。除了网络
抓取
之外,还有其他方法吗?
浏览 1
提问于2010-07-08
得票数 72
回答已采纳
1
回答
将Nutch web爬行功能集成到
Java
应用程序中
、
、
我会在我的
Java
应用程序中使用Apache从一个或多个网站
抓取
网页
。基本上,为了处理页面内容(文本等),我需要为web爬虫找到的每个
网页
调用我的
Java
应用程序的方法。如何做到这一点?
浏览 7
提问于2016-06-01
得票数 2
回答已采纳
1
回答
在没有BeautifulSoup的Python语言中将HTML表解析为列表
、
、
我想知道是否有一种方法可以从HTML表中提取数据,并仅使用HTMLParser将其解析到字典中。由于某种原因,我不能做这件事..
浏览 1
提问于2012-03-04
得票数 0
1
回答
从reddit URL获取原始URL
、
、
考虑这个链接:https://www.reddit.com/r/todayilearned/comments/6x6iz8/til_princess_diana_on_live_tv_shook_the_hand_of/?ref=share&ref_source=linkhttp://www.bbc.com/news/av/magazine-39490507/how-princess-diana-changed-attitudes-to-aids
浏览 0
提问于2017-09-01
得票数 1
1
回答
使用Facebook登录
Java
网页
、
我有一个
网页
,我可以登录到使用facebook连接。我需要从一个页面
抓取
html,但它需要首先登录。有谁知道如何使用
Java
中的facebook凭证来验证自己,这样我就可以
抓取
我需要的页面了吗?
浏览 1
提问于2014-04-10
得票数 0
回答已采纳
3
回答
Java
与PhantomJS的等价物是什么?
、
、
、
我想知道是否有与PhantomJS等同的
Java
库。我想要实现的是能够模拟表单登录和提交来自
网页
的操作,也可以做页面
抓取
。我知道jsoup做的是页面
抓取
,但不是页面自动化。 提前感谢!
浏览 0
提问于2013-11-04
得票数 15
2
回答
使用selenium/chromedriver阻止
网页
自动重载
、
、
我正在使用python和selenium包和chromedriver来
抓取
网页
。页面每30分钟自动重新加载一次(可能是通过
java
-script),这会破坏我的
抓取
进度。网络
抓取
是通过脚本和与页面进行进一步交互所需的javascript ist来完成的。 有没有可能通过chromedriver的标志来阻止页面重新加载呢?
浏览 24
提问于2020-11-13
得票数 0
回答已采纳
1
回答
在
Java
中给定img src时,我如何获得绝对路径的相对路径?
、
我现在正在使用
java
的
网页
抓取
器,我很好奇用
Java
做这件事最好的方法是什么。当我
抓取
该页面时,我可能会找到img src路径,如下所示其中,它可能相对于文件所在的某个子目录 谢谢
浏览 0
提问于2010-07-08
得票数 0
回答已采纳
1
回答
最近谷歌搜索控制台报告了一些放大器错误,当我没有申请amp在我的网站上的所有!
、
、
最近谷歌搜索控制台报告了放大器错误。在我的网站上根本没有应用放大器。那件事怎么可能?请查看下面的截图: 📷
浏览 0
提问于2018-12-24
得票数 2
1
回答
抓取
基于XML加载HTML的网站数据
、
、
我正在尝试使用
JAVA
中的JSoup库从
网页
中
抓取
数据。然而,这里的问题是,我想要
抓取
的数据是基于XML加载的,所以当我试图从HTML解析它时,它会显示出来 <!我如何
抓取
数据,因为在inspect元素中我可以看到完整HTML。
浏览 0
提问于2017-10-14
得票数 1
1
回答
在solr 6.4.1中搜索URL
、
我正在使用solr 6.4.1,并使用下面的内容来
抓取
一个url
java
-Ddata=web -Dc=corename -jar post.jar (urlname )我遇到了以下问题: URL (urlname)导致重定向到(urlname)/us/ SimplePostTool:警告: URL (urlname)返回的HTTP status为301 0索引的
网页
浏览 0
提问于2017-03-15
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
如何用java实现抓取网页图片
网页视频抓取插件-免费网页视频抓取插件
如何抓取网页中的表格
理解网页数据抓取的原理
网页抓取常见的问题有哪些?
热门
标签
更多标签
云服务器
ICP备案
对象存储
即时通信 IM
实时音视频
活动推荐
运营活动
广告
关闭
领券