腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
从pandas read_
html
网站
提取
数据
、
、
我正在尝试从网站中
提取
数据以下是代码 lte_band
浏览 3
提问于2021-03-01
得票数 1
2
回答
代码标记内的javascript转义
HTML
、
、
、
基本上,我需要能够在一个块中搜索标记"<“和">”,并将它们设置为文本而不是
HTML
,这样我就可以在页面上显示所有的标记和
HTML
。目前,当我使用jQuery进行字符串替换时,所有标记都作为实际的
HTML
语言出现在页面上:filter = text.replace(/</gi,"<").replace(/>/gi,">&q
浏览 0
提问于2011-03-13
得票数 1
2
回答
抓取网页并格式化它
我需要一些关于如何解决这个问题的建议:$
html
= file_get_contents("http://www.SomeWebsite.com/"); 然后,我可以使用一些RegEx
浏览 0
提问于2011-03-10
得票数 1
2
回答
使用
PHP
从网站获取设置的
标签
id、类或其他
标签
、
、
、
、
我正在尝试从一个远程网站
提取
所有的
html
标签
,它们的属性和文本
内容
都在一个预定义的
标签
中。示例:<div id="its attributes">its text content</div> 我可以通过
php
的DOMDocument类使用id或类来
提取
任何
标签
,但我就是想不通告诉
php
限制返回预定义的
标签
浏览 0
提问于2014-08-16
得票数 0
3
回答
从
html
中
提取
title
标签
、
、
、
我想从
html
字符串中
提取
title
标签
的
内容
。我已经做了一些搜索,但到目前为止,我无法在VB/C#或
PHP
中找到这样的代码。此外,这应该适用于大写和小写
标签
,例如,应该适用于<title></title>和<TITLE></TITLE>。谢谢。
浏览 1
提问于2009-04-04
得票数 2
3
回答
从其他页面
提取
后无法将数据插入数据库mysql
、
、
、
尝试在网站中插入
内容
新闻中的数据。我想要
提取
的网站页面来源示例 ...</
html
><?
php
include('simple_
html
浏览 1
提问于2014-07-08
得票数 1
回答已采纳
1
回答
根据
php
的分隔符本身拆分字符串
、
、
我正在尝试从一个长文件中
提取
php
代码。我希望扔掉不在
PHP
中的代码
标签
。示例<?
php
echo $user_name; ?> Some more text or
HTML
<?
php
echo $datetime; ?我想返回一个包含以下
内容
的数组:
浏览 0
提问于2013-04-05
得票数 3
回答已采纳
1
回答
如何在
php
中获取<a href>和</a>之间的文本
、
、
我有多个链接的
html
内容
(一个href),我需要
提取
<a>
标签
之间的文本。 preg_match_all('/<a\s+href=["\']([^"\']+)["\']/i',$response['content']['
html
'], $result);
浏览 0
提问于2016-12-02
得票数 1
5
回答
将语法突出显示添加到网页(
HTML
/
php
)
、
、
我使用来语法突出显示
HTML
。我有一个从wordpress中
提取
代码的
php
循环。我在代码中使用了pre / code
标签
,并使用下面的循环从wordpress中
提取
代码。<p><i><?
php
the_date(); echo "<br />"; ?> </p>
浏览 0
提问于2010-08-24
得票数 3
1
回答
使用
php
提取
html
内容
、
、
、
、
我有以下代码: $nodes = $xpath->query('//*[@id="price_div"]/div[2]/
浏览 4
提问于2013-08-14
得票数 0
回答已采纳
2
回答
总结网页的简短片段?
、
、
、
我应该仅仅使用一种原始的方法来获取整个
html
并解析元标记或类似的东西(很明显,不幸的是,这种方法并不适用于所有的链接),还是有一种更聪明的方法来实现这一点?有什么建议吗?
浏览 2
提问于2011-01-09
得票数 0
6
回答
正则表达式是查找一行
HTML
的合适工具吗?
、
、
我有一个
PHP
脚本,可以从服务器上
提取
一些
内容
,但问题是
内容
所在的行每天都在变化,所以我不能只
提取
特定的行。但是,
内容
包含在具有唯一id的div中。示例:<
html
><head><title>Example</title></head><div id="Alpha"> Blah blah blah
浏览 0
提问于2009-11-19
得票数 4
回答已采纳
1
回答
PHP
:从两个特定
标签
之间的字符串中
提取
文本
、
、
、
我用
PHP
编写了一个快速解压缩函数。基本上,它将读取给定URL的
内容
并
提取
必要的
HTML
代码。然后,它会将代码放入一个新页面。现在,除了一件事之外,我已经把所有的东西都弄好了。我有一个包含URL
内容
的字符串,现在我想
提取
两个标记之间的文本。假设我想从某个
标签
开始复制
内容
。这很简单,因为这些标记都有类。 因此,我让函数以"“开头,它只是在文档中搜索与此匹配的所有文本。因此,如果我告诉函数在“”处停止
提取
,那么抓取器将在随机<e
浏览 0
提问于2012-02-20
得票数 0
3
回答
在
php
中
提取
meta元素的
内容
?
我是一个全新的
PHP
开发新手,我想
提取
一个元
标签
的
内容
。include("simplehtmldom/simple_
html
_dom.
php
"); // Settings on top= file_get_
htm
浏览 0
提问于2013-11-29
得票数 0
4
回答
如何使用DOM和XPath从页面中抓取链接?
、
、
、
、
DOMDocument();$xpath = new DOMXPath($dom); $hrefs = $xpath->evaluate("/
html
我只需要弄乱"/
html
/body//a“xpath语法,还是需要添加更多的语法来捕获id元素?
浏览 0
提问于2011-03-25
得票数 2
1
回答
Googlebot和其他爬虫总是拉出最新的
内容
吗?
、
、
我的页面是简单的.
html
文件,不是动态的(例如,不是.
php
)。如果我使用上面的meta
标签
,考虑到代理可能仍然缓存页面,Googlebot和其他爬行器是否总是
提取
我站点的最新
内容
,或者它们可能不
提取
最新的
内容
,因为我没有在服务器端设置缓存标头?
浏览 0
提问于2013-08-14
得票数 0
2
回答
jquery返回null -为什么?
、
我使用的是jquery ajax $.get,它调用服务器上的
php
脚本并从另一个站点(域)检索
内容
。它返回的是完整的网页。然后我想使用.find()方法从'center‘
标签
中
提取
html
数据,但我遇到了一些问题。$("#btnGetData").click(function(){ fun
浏览 3
提问于2010-05-12
得票数 2
回答已采纳
2
回答
html
段落标记的有趣行为
、
、
、
这是包括所有
内容
,甚至其他段落。 上面的正则表达式适用于除段落标记以外的所有
内容
。我仍然在做这件事,并且相对确信没有奇怪的转义序列会导致正则表达式停止...我这么想是因为我可以
提取
出第一个和最后一个“
html
”
标签
之间的所有
内容
。“
html
”
标签
之间的文本还包含我未能
提取
的所有“p”
标签
。如果有某种转义或错误,我认为在
提取
'
html
‘
标签
时也会抛出同样的
浏览 0
提问于2012-08-19
得票数 1
回答已采纳
4
回答
大规模抓取/解析的技术是什么?
、
、
基本上,脚本需要遍历网页列表,
提取
特定标记的
内容
,并将其存储在数据库中。如果要进行大规模(数千万页?)的操作,您建议使用哪种语言?。到目前为止,我们一直在使用
PHP
、curl和,但我不认为它们可以扩展到数百万个页面,特别是在
PHP
没有适当的多线程的情况下。我们需要一些易于开发的东西,可以在Linux服务器上运行,具有强大的
HTML
/DOM解析器来轻松
提取
标签
,并且可以在合理的时间内轻松下载数百万个网页。我们并不是真的在寻找网络爬虫,因为我们不需要跟踪链接和索引
浏览 1
提问于2010-06-30
得票数 8
3
回答
在url参数中添加
php
var
php
include ("/home/domain/public_
html
/create/dogs.
php
"); ?><?
php
include ("/home/domain/public_
html
/create/<?
php
$partURL; ?>s.
php
"); ?> $partU
浏览 3
提问于2012-03-01
得票数 2
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
对象存储
云点播
实时音视频
活动推荐
运营活动
广告
关闭
领券