腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
在PHP中可以从字符串的开头获取图像URL吗?
、
、
、
我可以成功地使用
正则
表达式来
抓取
所有图像的URL,但它也可以
抓取
文本中的最后一个google.com图像。 谢谢你的任何想法!!
浏览 0
提问于2012-06-24
得票数 1
回答已采纳
2
回答
使用C#
抓取
网页(Html)
、
、
、
目前,我正在做网页
抓取
使用
正则
表达式。但是我认为有时候弄清楚
正则
表达式太难了,所以我在想,XSL/XPath是C#中
正则
表达式的替代方案吗?另外,我想知道除了上面列出的两种技术之外,是否还有更先进的网页
抓取
技术。谢谢。
浏览 0
提问于2011-02-17
得票数 4
回答已采纳
4
回答
正则
表达式-匹配某些字符后的文本
、
我想从一些文本中
抓取
数据并将其转储到一个数组中。Example Data| Content: This is sample content我目前使用以下
正则
表达式来
抓取
=:).+)/另外,我不确定我这样做是否正确..但是看起来好像外括号会导致匹配返回一个数组。这是parens的函数吗?编辑:我正在使
浏览 1
提问于2012-12-18
得票数 12
回答已采纳
1
回答
Regex -仅从网页上的urllist中
抓取
根域
我想要的
正则
表达式代码只
抓取
.com域,没有任何子文件夹或.com之后的任何东西。 例如:在包含urls列表的网页上,我想
抓取
和,但不想
抓取
或
浏览 5
提问于2013-01-25
得票数 0
4
回答
simplexml可以用来浏览html吗?
、
、
、
我想在不使用
正则
表达式的情况下从表中
抓取
数据。我喜欢使用simplexml解析RSS提要,我想知道它是否可以用来从另一个页面
抓取
表。例如:使用curl或简单的file_get_contents()
抓取
页面;然后使用simplexml
抓取
内容?
浏览 0
提问于2011-07-09
得票数 20
回答已采纳
1
回答
preg_replace模式在花括号内,但忽略方括号内的“标志”
、
、
我有两个独立的
正则
表达式来实现这一点,但我需要原始字符串保持不变,所以我需要找到一种方法合并到单个
正则
表达式中,该
正则
表达式查找变量,但忽略标志。\s+\}\}~中的
抓取
变量第一个
正则
表达式工作,但返回带有标志的变量。
浏览 2
提问于2020-07-22
得票数 1
回答已采纳
1
回答
在Python中提取撇号之间的引号
、
、
、
我正在编写一个
正则
表达式来捕获带引号的文本。它可以工作,但是作为源文件的纯文本已将单智能引号转换为撇号。.+[\"|\'|\`]")'t know who is human. Don'
浏览 4
提问于2018-01-23
得票数 0
回答已采纳
1
回答
有没有可能在没有标签的情况下清理网页
抓取
?有没有可能用
正则
表达式让它变得清晰?
、
、
data = re.sub('<[^>]*>', '', string=html).lower() 我想
抓取
随机的页面。但是,因为不可能只
抓取
想要的内容,所以我提出了一个问题。划痕后使用
正则
表达式删除html是否有效?
浏览 4
提问于2020-05-23
得票数 0
2
回答
电子邮件的
正则
表达式冲突(Python)
、
我尝试在同一Pythonic
正则
表达式中同时获取用户名(如abc123@)和电子邮件(如(abc123@company.com) )。使用的
正则
表达式:re.match("^([A-Za-z])+([@]){1}$")re.match("^([A-Za-z0-9-_])+(@company.com){1}$") 大多数情况下,发生的情况是用户名被
抓取
,但电子邮件地址没有被
抓取
(试图将它们作为两个单独的实体
抓取
)--你知道发生了什么吗
浏览 0
提问于2021-11-30
得票数 0
1
回答
如何获取标记元素regex的标题类
、
我试图做一个
正则
表达式,抓住互联网标签元素的标题。尤其是在这个中我做了一个这样的
正则
表达式:.giornata_1_casa = Val(Regex.Match(Content, "<a href=""(.*)""class=""(.*)"" titl
浏览 2
提问于2015-02-05
得票数 0
2
回答
如何在ubuntu中安装simplehtmldom
、
我正在试着用php写一个屏幕
抓取
器。我做了一个噩梦,试图弄清楚如何做
正则
表达式。然而,我发现了一个库,它被认为可以在屏幕
抓取
时消除使用
正则
表达式的需要。它被称为simplehtmldom。
浏览 4
提问于2009-07-23
得票数 2
5
回答
抓取
任何以http开头的字符串,直到php中的第一个空格字符
、
我在php中使用preg_replace()
抓取
一些文本时遇到了问题。我只是尝试删除所有以http|https|www开头的文本,直到第一个空格字符为止。我目前在preg_replace()中使用:(http|https|www)\S+作为我的
正则
表达式。然而,我在运行代码时得到这个错误: Warning: preg_replace():Unknown modifier '\‘我可以在文本编辑器中使用相同的
正则
表达式,例如Sublime text 2,没有问题有没有其他方法可以用
正则
表达式
抓取
我
浏览 1
提问于2012-04-15
得票数 2
回答已采纳
1
回答
抓取
oddsportal信息
、
、
、
、
我使用的是Python3.5,实际上我关注的是使用BeautifulSoup/lxml/Selenium/PhantomJS进行3.5
抓取
我只是想用Python代码
抓取
我需要的所有数据。我可以很容易地用BeautifulSoup从静态HTML中
抓取
信息。我最近也发现了如何从动态url中获取信息,使用Chrome的网络选项卡,并在XHR选项下查看出现的HTTPrequest。它通常会给我从JS生成的html代码,在这种情况下,我可以继续使用
正则
表达式,用BS4
抓取
它。但实际上
浏览 2
提问于2016-01-14
得票数 1
1
回答
/和.jsp之间的字符串的
正则
表达式匹配
、
如果我将
正则
表达式匹配为 str = "/mypage/account/info.jsp" str.match('\/.*\.jsp') 我得到了整个字符串,但我只想
抓取
"info“ 如何仅使用
正则
表达式完成此任务
浏览 15
提问于2021-08-05
得票数 0
2
回答
使用
正则
表达式
抓取
一些文本
、
大家好,我在使用
正则
表达式获取电影标题时遇到了一些问题。我如何
抓取
标题之间的文本标签与
正则
表达式,请帮助我。
浏览 0
提问于2011-10-14
得票数 0
回答已采纳
1
回答
如何从帖子中
抓取
所有附件[视频、图像]并在模板中的UL中显示
现在,我正在使用
正则
表达式解析帖子中的所有图像,但它不是
抓取
视频。此外,我讨厌依赖
正则
表达式,因为它不可能也
抓取
url等与目前的实现。
浏览 0
提问于2013-12-18
得票数 1
2
回答
如何从vb.net中的原始IRC数据中获取昵称和消息
、
、
name@tw-32151D9B.hsd1.vt.comcast.net PRIVMSG #channel :message 我想
抓取
特定的信息输出给用户。我考虑过使用
正则
表达式,但我想不出如何让
正则
表达式
抓取
message,因为它之后什么都没有了。
浏览 0
提问于2010-06-02
得票数 0
回答已采纳
1
回答
如何重复一个Regex 10次
我在一个web
抓取
程序中使用以下
正则
表达式。它正在
抓取
html中的项目符号列表,但它只是抓住了第一颗子弹,而剩下的9颗却落在后面。 我怎么能修改它来
抓取
所有的10颗子弹呢?
浏览 2
提问于2014-12-05
得票数 0
回答已采纳
3
回答
查找直到行尾的文本
正则
表达式
、
我尝试使用
正则
表达式来查找特定的起始字符,然后获取该特定行上的其余文本。V:中音T:节拍 我想使用
正则
表达式来
抓取
"V:“和它后面的文本。有没有什么好的、快速的方法来使用
正则
表达式来完成这项工作?
浏览 2
提问于2011-10-24
得票数 5
2
回答
有没有标准化的网站地图格式?
、
、
、
我想建立一个网站,
抓取
几个网站网站地图。我在中遇到过几次这种格式。我想知道这是不是标准,或者有没有。 如果没有网站地图,那么
抓取
网站地图的最佳方式是什么?一个
正则
表达式,还是某个库?
浏览 0
提问于2013-02-21
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Sublime正则 Excel,不写代码也能做数据抓取和可视化
简化正则化:L₂正则化
Python数据抓取(3)—抓取标题、时间及链接
网页视频抓取插件-免费网页视频抓取插件
抓取整个网站-免费抓取整个网站数据信息软件
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券