腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如何从我爬行的
HTML
页面
解析
JavaScript对象?
、
、
、
、
但是,我如何获得该脚本并在Node.js应用程序中
解析
它呢?Cheerio也许能帮我找到剧本,但不会做得更多?或者可能会?我不知道怎么做,也不知道什么是最有效的计算答案。或者是最坚固的。
浏览 4
提问于2016-11-24
得票数 0
回答已采纳
3
回答
如何使用JAVA从
HTML
页面中只
解析
所需的表,并将结果导出到.CSV文件中?
我的文件夹中有一个.
html
页面。它有38个表,其中有不同的行。我的需求是,使用java程序,我只能选择表1、12、36、37并读取它们的数据。然后使用得到的数据,我需要生成一个.csv文件。有什么特定的
库
吗?我已经用谷歌搜索过了,但我只得到了一个表
解析
。提前谢谢。
浏览 0
提问于2013-06-19
得票数 0
2
回答
将
HTML
转换为XHTML更改欧元符号,从而阻止正确的XML
解析
、
、
、
、
我是通过使用Java中的SAX
解析
HTML
文件来
提取
信息。
解析
程序是给我的,它已经在使用SAX了,所以我想保持这种方式。我要做的是: 我将XHTML文件提供给
解析
库
,以便
提取
我想要的数据(编写处理程序、函数startElement()、字符()和endEle
浏览 0
提问于2013-10-21
得票数 0
4
回答
Java -从字符串中
提取
html
信息
、
、
、
、
所有的指南都告诉我如何从文本中删除
HTML
标记以
提取
它们之间的文本。我要做的是
提取
HTML
标记中的数据。
浏览 5
提问于2012-09-28
得票数 1
回答已采纳
1
回答
在python中将嵌套的
html
表转换为嵌套字典?
、
、
、
我正在编写一个应用程序,将从网站(通过调用RESR )接收的
html
表字符串数据转换为字典格式。问题是
HTML
表字符串的格式是嵌套的
HTML
表格式。过了一段时间在网上搜索,我找不到解决这个问题的办法。尽管它有很多解决方案来将json转换为
html
。我的
HTML
表字符串输入是: <tr> <table> <tr>和方法find_all()来查找
浏览 1
提问于2019-04-23
得票数 3
1
回答
从网页获取数据并将其显示在android应用程序中的有效方法
我已经尝试过xml
解析
器,但应用程序变得非常慢。
浏览 1
提问于2014-09-25
得票数 0
4
回答
如何从其他网页中
提取
内容并存储到数据
库
中
、
地狱之友"http://www.drf.com/race-results/BHP/USA/2012-06-23/D" 并且想要存储在我的数据
库
中,我需要获取比赛1,比赛2,race3
浏览 2
提问于2012-06-27
得票数 0
5
回答
Python regex后视需要固定宽度的模式
、
、
当尝试
提取
html
页面的标题时,我总是使用以下正则表达式:它将
提取
文档中标签之间的所有内容,并忽略标签本身。=</title>)')然而,这将不会考虑由于某些原因而具有属性或类似属性的潜在
html
标题。 有谁知道解决这个问题的好办法吗?任何建议都是值得感谢的。
浏览 1
提问于2010-04-10
得票数 9
回答已采纳
28
回答
您能提供
解析
HTML
的示例吗?
、
、
如何使用各种语言和
解析
库
来
解析
HTML
? 在回答有关如何使用正则表达式
解析
HTML
的问题时,将链接到单个注释,以此来显示正确的操作方法。为了保持一致性,我要求该示例在锚标记中
解析
一个href文件。为了便于搜索此问题,我要求您遵循以下格式
库
:
库
名称请将该
库
作为指向该
库
的文档的链接。如果您想提供
提取
链接以外的示例,请同时提供
浏览 110
提问于2009-04-21
得票数 69
1
回答
从CHM和EPUB文件中
提取
“封面图片”
、
、
、
如何从CHM和EPUB文件以编程方式可靠地创建PNG图像?所需的页面只是第一个页面,如“封面图片缩略图生成”。我已经查看了用于MacOSX的开源CHM QuickLook插件,用于实现这一点的源代码和Calibre,后者无济于事。
浏览 2
提问于2012-03-18
得票数 2
回答已采纳
1
回答
使用Java或任何其他语言加载和执行jquery和javascript脚本
、
、
我们需要从
html
文件中
解析
和
提取
内容。我们正在考虑使用jQuery来轻松地导航DOM并
提取
一小段信息。我们在Mozilla找到了用Java语言编写的。使用这个
库
,我们尝试加载一个名为file.js的文件,其中包含jquery脚本和几行jquery脚本代码,如下所示。</span></div></body></
html
>').find('div span').
ht
浏览 1
提问于2011-02-09
得票数 0
回答已采纳
1
回答
使用Indy httpserver在网页中查找关键字
、
、
、
、
我正在尝试使用Indy http服务器在网页中查找代理筛选器的关键字。我已经设置了一个代理和http服务器,它可以在网页浏览器上工作,但是当我在网页中找到一个关键字时,我会很吃力。如果有人能给我任何建议,那就太好了。编辑:好的,我在这里添加了一个函数,其中' stream‘是来自http服务器的内存流,'what’是我正在搜索的关键字,尽管它似乎不起作用…… function FindInMemStream(Stream: TMemorySt
浏览 1
提问于2013-04-16
得票数 0
1
回答
朱莉娅:网站刮吗?
、
几天来,我一直在努力用这个小代码从一个期刊网站获取新闻的标题和链接。function website_parser(website_url::AbstractString)splitted = split(r, "\n")问题是,一旦我从网站上得到了文本,我就想不出怎么继续下去了。如何检索特定元素(在本例中作为新闻的标题和链接)? 任何帮助都是
浏览 1
提问于2018-04-28
得票数 6
1
回答
使用python和lxml从大型
HTML
文件中
解析
和
提取
信息
、
、
我希望
解析
大型
HTML
文件并通过xpath从这些文件中
提取
信息。为此,我使用python和lxml。但是,lxml似乎不能很好地处理大型文件,它可以正确
解析
大小不超过16 MB的文件。通过xpath尝试从
HTML
代码中
提取
信息的代码片段如下:links = tree.xpath("//*[我还尝试使用
解析
方法从文件中读取代码,而
浏览 1
提问于2014-06-10
得票数 3
2
回答
Web Crawler与
Html
解析
器
、
、
、
web爬虫和
解析
器有什么区别? 他们的目的是一样的吗?
浏览 3
提问于2018-11-14
得票数 2
回答已采纳
1
回答
当我下载pdf格式的文件时,我遇到了一个Xml
解析
异常。
、
DOCTYPE
html
PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/x
html
1/DTD/xhtml1-strict.dtd"><head> 这在某些系统中发生,而在某些系统中,下载过程是工作文件。我可以添加一些东西到我创建的
html
浏览 0
提问于2015-09-03
得票数 0
1
回答
逻辑帮助- java regex
、
、
、
我有一个字符串,其中包含大于1的图像标记。现在我需要对alt=标记进行正则表达式。我是这样尝试的: Pattern p4 = Pattern.compile("<!\\[CDATA\\[(.*?)\\]\\]>"); if(m4.group().contains("<img src")) { Pattern p6 = Patt
浏览 0
提问于2013-04-26
得票数 0
回答已采纳
2
回答
html
文档中包含word的Get节点
、
、
、
、
我想编写一个脚本来检查文档中的关键字,并指定包含它们的
html
文档节点(可能指定一个唯一的标识符)。 我需要有经验的程序员的想法。很可能有一些
库</em
浏览 3
提问于2013-05-13
得票数 0
回答已采纳
1
回答
解析
HTML
文档并替换整个标记段的最佳方法
、
、
、
、
我试图找到从上到下
解析
HTML
文档的最佳方法,并替换某些不同的标记组,并创建一个更新的文件。我更喜欢使用Java、VB.NET或PHP。More text</p>有人做过这个吗?最简单的方法是什么?你能推荐一个好的
HTML
解析
器来使用吗?我正在
解析
的文档是XHTML,所以我考虑过使用java或SAX工具,但是,我发现这些都很麻烦,我想知道是否有更好的方法来处理一些现有的类。 非常感谢你的帮助。
浏览 2
提问于2014-10-03
得票数 0
2
回答
iOS:从
HTML
字符串中获取图像
、
、
、
我有一个从web上拉文章的应用程序,我需要检索文章中第一个图像的URL。以下是这些图像的代码示例:我只需要获取src的值。我该怎么做呢?
浏览 0
提问于2012-04-12
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
HTML 正文内容提取库 Boilerpipe
送给人类的 HTML 解析库
python渐进-html和json解析
Python对XML和HTML的解析
python爬虫初探:HTML解析器
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券