腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
9
回答
用于
解析
网页
链接
的
正则表达式
?
、
、
我正在寻找一个.NET
正则表达式
,从一个
网页
中提取所有的URL,但还没有找到足够全面的URL,以涵盖所有可以指定
链接
的
不同方式。是否有一种准则来统治他们所有的?还是我最好使用一系列不那么复杂
的
正则表达式
,只对原始HTML使用多变量传递?(速度与可维护性)
浏览 19
提问于2008-08-08
得票数 17
回答已采纳
2
回答
Facebook
链接
检查器
、
我正在建立一个网站,并正在寻找一种方式来实现Facebook
的
某个功能。我正在寻找
的
功能是
链接
检查器。我不确定这就是它
的
名字,或者它
的
名字是什么。当您在Facebook上发布
链接
时,例如youtube视频(或任何其他网站)
的
链接
,Facebook会自动检查它引导您
的
页面,并导入页面标题、收藏图标和一些其他图像等信息,然后将它们添加到您
的
帖子中,作为一种向阅读该帖子
的
任何人提供我已经有一个功能,允许用
浏览 1
提问于2012-01-23
得票数 0
1
回答
Java和Heritrix 3.1.x: Web内容
解析
?
、
、
、
、
由于Heritrix 3.x
的
开发人员文档大部分已经过时(其中大部分与Heritrix 1.x有关,因为大多数类都已更改或代码已被显着重写/重构),有人能告诉我系统中处理实际
网页
内容提取
的
相关类(或类)我想要做
的
是获取Heritrix将要抓取
的
网页
的
内容,然后将分类器应
用于
该
网页
的
内容?(分析结构特征等)我认为这个功能可能分布在ContentExtractor类和它
的
许多子类中,但我要做<
浏览 8
提问于2013-07-19
得票数 0
3
回答
如何过滤HTTP get响应?
、
我已经学习了如何创建HTTP Get请求方法来从URL检索数据,但我想过滤响应,只给我一个
网页
上
的
链接
列表。
浏览 0
提问于2012-09-06
得票数 1
回答已采纳
1
回答
如何从外部
网页
获取特定
链接
并使用javascript自动应用可单击事件?
、
、
假设我有一个URL example.com,我希望读取该页面的源,并获得一个特定
的
链接
,比如example1.com,并在其上进行一个可点击
的
事件,这意味着用户已经单击了从URL example.com到example1.com
的
链接
。
浏览 2
提问于2017-05-06
得票数 0
3
回答
用
正则表达式
检测dofollow反向
链接
、
这个
正则表达式
的
目的是找出一个
网页
是否包含指向给定域
的
反向
链接
,并且所有这些都必须在标记上有一个rel=“no追随者”属性。在任何
网页
上,我想检查是否存在这样
的
内容:,,在所有这样
的
链接
中都不能有"rel=nofollow“一种未优化
的
方法,我可
浏览 4
提问于2014-03-19
得票数 1
3
回答
如何使用Jmeter来测试页面上
的
所有
链接
,这意味着我想检查页面上
的
所有
链接
是否都正常工作?
、
、
、
、
我有一些想法,HTML
链接
解析
器,HTTP采样器将有所帮助。我尝试使用它,但不幸
的
是没有成功。 会表现得像蜘蛛..。
浏览 15
提问于2014-12-29
得票数 0
1
回答
来自C++兼容
正则表达式
的
.NET 11兼容
正则表达式
、
下面的regex
用于
.NET regex引擎(FYI,它所做
的
是
解析
表单name="value1,value2“name2 = value3
的
命令行参数,其中引号是可选
的
)我之所以在这里问这个问题,是因为我还没有找到任何工具/
网页
,可以轻松地测试
正则表达式
并让它在C++ 11中工作(而几乎所有其他平台都有工具)。指向在线(或脱机) C++ 11兼容regex测试工具
的
浏览 0
提问于2013-12-20
得票数 2
回答已采纳
1
回答
需要
解析
超文本标记语言文档中
的
链接
--使用html5lib之类
的
库还是其他什么?
、
、
我是一个非常新手
的
网页
建造者,目前正在创建一个网站,需要根据目标页面改变
链接
颜色。根据特定
的
用户输入标准,
链接
将被分类为不同
的
类别(例如,好
的
、不好
的
、中性
的
)--例如,用户会发现感兴趣
的
内容
的
链接
是蓝色
的
,用户(可能)不想看到
的
内容是普通文本
的
颜色,等等。我想我需要一种方法来
解析
网页
浏览 3
提问于2012-09-07
得票数 0
1
回答
使用PHP搜索文本块,返回MP3
链接
、
、
、
我刚刚在我
的
最新项目中遇到了一些PHP
的
小麻烦。基本上,我有一个文本块($text),我想搜索整个文本并返回所有的MP3
链接
。我知道它与
正则表达式
有关,但我就是不能让它工作。下面是我当前
的
代码: foreach($matches as $
浏览 2
提问于2010-08-19
得票数 0
5
回答
使用Ruby获取
网页
的
所有
链接
、
、
、
我正在尝试使用Ruby检索
网页
的
每个外部
链接
。我通过下面的
正则表达式
使用String.scan:谢谢!
浏览 2
提问于2011-07-15
得票数 12
回答已采纳
3
回答
XML
解析
器与
正则表达式
、
、
、
、
我要去获取
链接
,图像,文本等,并使用它来建立搜索引擎优化统计和分析
的
网页
。我一直在使用
正则表达式
,从来没有遇到过任何问题,然而,我一直从人们那里听到它不能做一些事情,老实说,我不知道为什么,但我害怕使用blah...but
解析
器,而更喜欢使用
正则表达式
那么,如果使用
正则表达式
一切正常,为什么我要在这里问您要使用什么?我认为,尽管到目前为止一切都很好,但并不意味着将来也会如此,所以我只想知道使
浏览 3
提问于2011-08-17
得票数 1
1
回答
改进StackExchange链路标记
我最近发布了以下
链接
的
答案:实际
链接
如下:令人惊讶
的
是,StackOver
浏览 3
提问于2019-11-24
得票数 1
回答已采纳
3
回答
如何从html页面中提取javascript,css和img标签
的
链接
?
如何从html页面中提取javascript,css和img标签
的
链接
?我是否需要使用
正则表达式
,或者已经有一些轻量级
的
库
用于
html
解析
?
浏览 1
提问于2011-06-27
得票数 2
0
回答
nginx proxy pass保留URL
、
、
、
我在nginx中实现了一个proxy_pass规则,它只适
用于
一些
链接
。我
的
规则是: resolver 8.8.8.8; proxy_pass"www.example.com/en/index.jsp“,然后proxy_pass将我
的
请求重定向到"www.destinyweb.en/index.jsp”。当目标
网
浏览 0
提问于2017-11-23
得票数 0
1
回答
如何构建
正则表达式
来分析
网页
上
的
所有
链接
?
、
我正在用PHP构建一个网络爬虫,
用于
Intranet (我们正在处理一个巨大
的
Intranet)。我设法使用cURL函数下载了一个
网页
,但现在我想扫描内容中
的
链接
。我试图找到所有明显
的
链接
,并将它们拆分到相应
的
方案/权限/路径/查询/片段中,这样我就可以正确地对它们进行索引。 有没有一个已知
的
正则表达式
可以匹配所有的
链接
,包括<img src="
浏览 0
提问于2010-11-13
得票数 0
回答已采纳
8
回答
如何用php获取
网页
的
Open Graph协议?
、
、
PHP有一个简单
的
命令来获取
网页
的
元标签(get_meta_tags),但这只适
用于
带有名称属性
的
元标签。然而,Open Graph Protocol现在正变得越来越流行。从
网页
中获取opg值
的
最简单方法是什么?content=""> <meta property="og:type&qu
浏览 1
提问于2011-09-17
得票数 27
回答已采纳
1
回答
请求和请求-html之间有什么区别?
、
我必须举办关于请求和请求
的
研讨会。我正在搜索,但找不到任何网站。请求和请求-html都有相同
的
方法,但是有什么区别呢?
浏览 8
提问于2022-10-18
得票数 0
1
回答
阅读
网页
Python 3.6
、
Python非常新手,正在努力掌握它
的
诀窍,我需要通过它
的
url检索
网页
,并返回它
的
内容。稍后将使用
正则表达式
对内容进行
解析
,以查找超
链接
等。(我不想用漂亮
的
汤)url = "http://stackoverflow.com"print (f.read()) 我意识到我
的
答案可能是非常错误
的<
浏览 0
提问于2017-11-10
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
网页中的超链接类型
用于链接数据的模版
如何创建指向网页的超链接
给人用的 Python 网页解析工具 Requests-HTML
python爬虫-解析网页的几种方法之BeautifulSoup
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券