腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
3
回答
如何
使用
nltk
正则表达式
从twitter获取流
数据
、
、
、
、
我是Python的新手,我的老板给了我一个任务
来
完成这个任务: 你的帮助将非常感激:)
浏览 2
提问于2011-07-28
得票数 1
4
回答
在运行时生成python regex以匹配从'n‘到无穷大的数字
、
、
我正在
使用
scrapy
抓取
网站并从中提取
数据
,scrapy
使用
基于regex的规则
来
检查页面是否必须
解析
,或者是否必须遵循链接。为此,当启动爬行器时,我从
数据
库获取最后关注的链接。我的站点urls看起来像http://foobar.com/page1.html,所以,通常情况下,规则的
正则表达式
会像这样跟随每个链接,就像/page\d+\.html一样。但是,我
如何
才能编写一个
正则表达式
浏览 2
提问于2011-03-06
得票数 1
回答已采纳
2
回答
从网页获取信息-在Iphone应用程序中显示
、
这听起来像是程序一直在做的常见任务,但我不确定它是
如何
整合到应用程序中的。(拉取webdata的过程叫什么?) 有什么方法或工具可以做到这一点?目前我还不熟悉
如何
处理iphone的网络
数据
。
浏览 0
提问于2009-10-05
得票数 1
回答已采纳
1
回答
Prestashop -
使用
模块(而不是覆盖目录)更改核心函数
我需要
解析
传递给Prestashop中任何静态页面的任何变量,并将所有以"http“(纯文本)开头的变量替换为"a href”。我已经有了
正则表达式
,但我需要知道
如何
在不修改核心函数和不
使用
类或控制器的覆盖目录的情况下
使用
模块
来
做到这一点。在将结果发送到tpl文件之前,需要对变量进行
解析
;我已经找到了一个覆盖ObjectModel类的解决方案,但我需要在模块中执行
此
操作。问题是我不清楚
如何
做到这一点,因为Objec
浏览 0
提问于2012-06-27
得票数 1
回答已采纳
4
回答
simplexml可以用来浏览html吗?
、
、
、
我想在不
使用
正则表达式
的情况下从表中
抓取
数据
。我喜欢
使用
simplexml
解析
RSS提要,我想知道它是否可以用来从另一个页面
抓取
表。例如:
使用
curl或简单的file_get_contents()
抓取
页面;然后
使用
simplexml
抓取
内容?
浏览 0
提问于2011-07-09
得票数 20
回答已采纳
9
回答
屏幕
抓取
器是
如何
工作的?
、
、
、
、
我听到人们一直在写这些程序,我知道他们是做什么的,但他们实际上是
如何
做到的呢?我在寻找一般的概念。
浏览 3
提问于2008-10-01
得票数 20
回答已采纳
3
回答
Android -从网站拉取
数据
的选项?(HTML)
、
、
例如,我希望能够在每天开始时从以下页面获取文本: 有没有一种本机方法
来
解析
我想要的信息? 或者我需要第三方库?或者我需要查看屏幕
抓取
?
浏览 3
提问于2010-09-29
得票数 1
回答已采纳
2
回答
PHP Magento屏幕
抓取
、
、
我完全可以为几乎任何事情编写一个屏幕
抓取
器,但我遇到了一个主要问题。我
使用
get_file_contentsto收集产品页面的html。您需要登录才能查看产品页面。这是一个标准的magento登录,那么我
如何
在我的屏幕
抓取
器中解决这个问题呢?我不需要完整的脚本,只需要一个方法的建议。
浏览 0
提问于2011-01-04
得票数 2
回答已采纳
2
回答
使用
字符串
解析
值
、
我正在
使用
BufferedReader读取一个文件,并尝试
使用
正则表达式
解析
出一个字符串。我想要
解析
的字符串如下所示,而且,在这个字符串的前面和结尾都应该有文本。而且,我只想
解析
这个字符串的值(Ex.我想从读取的字符串中
抓取
"123“)。<test>?谁能告诉我
如何
<e
浏览 0
提问于2012-07-18
得票数 0
回答已采纳
1
回答
从网页中
解析
国际电话号码
、
、
、
我正在
使用
HtmlAgilityPack
来
解析
网页。加载文档后,我想从HTML中提取可能的电话号码。目前,我正在
使用
一些
正则表达式
来
实现
此
目的。有没有一个通用的
正则表达式
,最适合
抓取
网站时,它允许匹配大多数形式的国际电话号码?
浏览 0
提问于2013-03-01
得票数 1
回答已采纳
1
回答
定期爬行Feed并
使用
Bash脚本从xml中获取特定字段
、
、
我有一个应用程序,它需要定期从Feed服务器
抓取
,让一个新闻网站,然后
解析
Feeds
来
打印特定的提要。我想要提取项目/标题、项目/描述和项目/类别字段。我将在特定的时间间隔后
抓取
Url,并
解析
xml并打印这个字段,
如何
使用
Bash脚本完成
此
操作?
浏览 0
提问于2014-07-07
得票数 1
回答已采纳
1
回答
如何
从帖子中
抓取
所有附件[视频、图像]并在模板中的UL中显示
我写了一些代码
来
显示UL中的所有附件图像,以在自定义post类型上进行sidescroll。客户端现在也希望返回视频。现在,我正在
使用
正则表达式
解析
帖子中的所有图像,但它不是
抓取
视频。此外,我讨厌依赖
正则表达式
,因为它不可能也
抓取
url等与目前的实现。 有没有一种方法可以获取与帖子相关的所有附件(不包括自定义字段缩略图),然后将附件填充到页面上的元素中?
浏览 0
提问于2013-12-18
得票数 1
3
回答
如何
将其他网站的内容保存到我的
数据
库?
、
我想动态上传内容从足球现场得分网站到我的
数据
库。如果你能帮助我只与该网页的
数据
连接和检索,我将管理其余的。
浏览 0
提问于2010-06-02
得票数 0
回答已采纳
5
回答
正则表达式
:从其他网站挖掘文本
数据
、
、
、
我想爬行通过,比方说,其他公司的网站,如汽车和提取只读信息在我的本地
数据
库。然后我希望能够在我的网站上显示这些收集的信息。为了有效地做到这一点,我可能需要一个WCF作业,只是在不断的基础上挖掘
数据
,刷新
数据
库,然后提供
数据
给网站。有关于
如何
使用
解析
DOM树的库的代码示例吗? 我是否可以通过WebBrowser控件向
浏览 3
提问于2010-10-07
得票数 0
回答已采纳
2
回答
正在从非唯一表的html中检索字符串
、
、
、
、
这是我试图
解析
的html。我正在尝试
使用
正则表达式
来
解析
数据
。我听说过BeautifulSoup,但页面上大约有50个这样的项目,它们都
使用
相同的表参数,并且都没有ID号。它们最接近唯一标识符的是单元格中的
数据
,而不是我需要的
数据
。</td>", so
浏览 2
提问于2011-05-17
得票数 0
1
回答
如何
在Python中
抓取
Handlebar.js脚本?
、
、
、
到目前为止,我已经成功地导航到正确的拍卖网页,并
使用
Selenium下载了该网页。我现在有点卡住了,我想知道
如何
继续。我是网络
抓取
的新手,所以目前我只是在尝试一些东西。 谢谢!
浏览 0
提问于2020-08-05
得票数 0
1
回答
PHP
正则表达式
运行良好-现在我需要一些裁剪
我只想在结果中得到结果,而不是HTML标记的开销,这意味着我必须对
正则表达式
进行一些定制。我怎样才能改进(已经非常好的)代码!?请看这里的url:每一个想法和tipp都将得到极大的赞赏
浏览 2
提问于2010-12-10
得票数 0
3
回答
正则表达式
在C#.net应用程序中的验证
、
/记录问题:为了解决这个问题,我们创建了下面的RegEx
来
查找有问题的值\x2C(^\x22.*^\x22)\x2C
使用
上面的
正则表达式
,它可以在第一个和最后一个字段之
浏览 0
提问于2011-06-21
得票数 2
2
回答
尝试从IRC消息中隔离链接
、
、
、
、
我有一个IRC机器人我正在工作,我想要它的一个功能是接受任何人发布的链接,并
使用
BeautifulSoup
来
解析
该页面。现在,我让机器人工作了,获取人们发布的消息,等等。但是,我
如何
从IRC消息中提取链接呢?假设有人这样说:我
如何
取出链接并将其分配给一个变量以供以后
使用
,而不拉出消息的其他部分? 我认为这与
正则表达式
有关,但我不确定。
浏览 0
提问于2012-07-28
得票数 0
回答已采纳
3
回答
使用
regex
解析
带有转义字符的字符串
、
格式如下所示:":“之间的所有内容都是我想用
正则表达式
提取的
数据
。如果一个:后跟另一个:(如"::"),则
此
数据
必须为"“(空字符串)。目前我正在
使用
这个
正则表达式
来
解析
它:现在我想到":“也可能存在于
数据
中。所以它必须被转义。示例: "foo:bar:beer:\::1337&qu
浏览 0
提问于2012-04-18
得票数 6
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
数据科学入门必读:如何使用正则表达式?
如何使用正则表达式?数据科学入门必读
python中如何使用正则表达式提取数据
如何有效地使用网页操作器进行数据抓取?
企业如何使用大数据来实现BI商业智能
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券