腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
抓取
没有
属性
的
纯
html
python
、
html
、
web-scraping
、
beautifulsoup
我想提取此
html
的
日期,但不带
属性
html
= '''<br/>2016-04-02 <br/> <span class="menu">Menu</span&g
浏览 10
提问于2020-07-21
得票数 1
回答已采纳
1
回答
如何提取此网页中
的
所有章节标题?
html
、
jsoup
sectionheadings = dom.doc.select("h2[class=section-heading collapsible-heading open-block]");
html
.client-js body.mediawiki.ltr.sitedir-ltr.stable.skin-minerva.action-view.animations选择所有这
浏览 2
提问于2015-11-12
得票数 2
回答已采纳
1
回答
将自定义标题添加到ajax支持
的
网站吗?URL?
ajax
、
wordpress
、
seo
、
hashbang
我使用
的
是ajax驱动
的
WordPress主题,它有像www.example.com/#!/page这样
的
hashbang URL。我想知道我可以为每个页面添加自定义标题和描述,因为搜索引擎优化?该网站还
没有
索引,所以我看不到谷歌如何看到带有hashbang URL
的
页面,但我假设它将具有与主页相同
的
标题?顺便说一句,这个网站是www.jsomedia.com 谢谢。
浏览 0
提问于2012-10-28
得票数 1
回答已采纳
1
回答
selenium从网站中将内容
抓取
到数组中
selenium
、
selenium-webdriver
、
web-scraping
、
selenium-ide
我对从网站上
抓取
内容并将其放入数组感兴趣。具体来说,我感兴趣
的
是通过识别
纯
文本所在
的
html
元素,将
纯
文本
抓取
到数组中。我将扫描多个
纯
文本元素,并将它们按顺序排列到一个数组中。
纯
文本将在
html
表中,我需要获取表中具有我感兴趣
的
纯
文本
的
特定部分。
浏览 0
提问于2015-05-11
得票数 0
回答已采纳
1
回答
如何在Nutch中只
抓取
HTML
?
nutch
是否可以通过Nutch仅
抓取
纯
HTML
页面(即
没有
图片、视频、flash、excel、exe、pdf或word文件)?如何通过Nutch检查页面的Content-Type并仅获取text/
html
页面?
浏览 2
提问于2012-10-06
得票数 1
回答已采纳
1
回答
Javascript
抓取
javascript
、
html
、
arrays
、
node.js
我正在处理一个只有
纯
文本
的
网页--我如何“
抓取
”数据,然后将其存储到数组变量中。
没有
标签(即
没有
“div”、“id”等)
HTML
(查看-来源:www.blablabla.com/path.txt.
HTML
浏览 4
提问于2015-03-11
得票数 0
回答已采纳
1
回答
先进
的
网页刮除
web-scraping
我想刮一个网站
的
一部分,让我们说: www.mywebsite.com/x1/x2您需要先打开x1,然后单击按钮,x2将作为弹出窗口打开。如果关闭x1,则无法访问x2。
浏览 3
提问于2015-07-20
得票数 0
2
回答
使用机械化点击图像
ruby
、
ruby-on-rails-3
、
screen-scraping
、
mechanize
用mechainze点击一个文本agent.click(page.link_with(:text => 'some_text')是小菜一碟。如何用机械化点击图片?
浏览 0
提问于2012-08-10
得票数 0
回答已采纳
2
回答
ASP.NET:如何从表格
html
源中提取特定值?
c#
、
asp.net
我想提取IMDb`s
的
Boxoffice表中每一行
的
电影名称。示例
html
表行: <b>1</b>$155M <td style
浏览 1
提问于2012-03-26
得票数 2
3
回答
DOMCrawler
纯
文本
php
、
html
、
symfony
、
xpath
我正在使用Symfony
的
DomCrawler从网站上获取信息。在其中一个页面中,有一个文本包含非
html
编码
的
属性
,如下所示:当我试图使用filterXPath方法从a标记中
抓取
文本时,我得到了Lorem ipsum <,因为正如我所设想
的
那样,它会表现为像破坏<e
浏览 1
提问于2015-08-10
得票数 2
回答已采纳
1
回答
在R中刮取<div>标记中
的
所有链接
r
、
web-scraping
我是一个网络
抓取
新手,需要帮助。我试图从一个有大约20页
的
属性
站点中
抓取
数据,在每个页面中有到不同
属性
的
18条链接。我
的
最终目标是从每个
属性
链接中
抓取
所有数据。为此,我考虑通过将页面参数增加1来运行20页
的
循环。 但在这样做之前,我需要从单个页面上
的
每个
属性
中
抓取
数据,为此我需要链接到单个页面上
的
所有
属性
,因此需要从页面中<em
浏览 1
提问于2018-09-26
得票数 0
回答已采纳
2
回答
实现生成text/
html
格式输出
的
函数
的
优雅方法是什么?
javascript
、
jquery
、
design-patterns
我
的
函数解析文本,
抓取
零件,生成
纯
文本
的
电子邮件格式。但它也需要生成
html
格式。 脑死亡
的
方法是使用如果...否则..。并在每个段落或元素周围添加附加
的
html
标签。有
没有
一种优雅
的
方法来解决这个问题?
浏览 0
提问于2012-02-17
得票数 3
回答已采纳
6
回答
抓取
一个
没有
HTML
的
纯
文本文件?
php
、
screen-scraping
我在一个
纯
文本文件中有以下数据:Location : ValueArchitect: Value 现在我需要将这些数据插入到一个MySQL数据库中。你有
没有
建议我如何遍历和
抓取
它,这样我就可以得到数字旁边
的
文本
的
值,以及"location","owner","architect“
的
值? 似乎很难处理DOM
抓取</em
浏览 0
提问于2011-12-08
得票数 2
回答已采纳
1
回答
使用Python从
HTML
5网站
抓取
文本
python
、
html
、
screen-scraping
我需要从一个使用python
的
网站上
抓取
文本。我已经安装了BeautifulSoup 4、
HTML
和NLTK,但我似乎无法找到如何
抓取
。我真的需要一个简单
的
代码片段,我可以插入任何URL并获得
纯
文本。我正试着从那里得到它
浏览 1
提问于2014-09-17
得票数 0
回答已采纳
1
回答
插入到数据库中-撇号插入方式类似于此';
php
、
character-encoding
、
escaping
我正在尝试用php
抓取
一些数据。将数据插入mysql表(xampp)时,后缀如下所示-‘ 我如何摆脱这个字符。我使用了地址斜杠,mysql_real_escape_string和我
的
stell不能摆脱它..
浏览 0
提问于2013-01-18
得票数 0
回答已采纳
1
回答
我们能用
html
元素填充
html
属性
吗?
javascript
、
html
、
css
我使用
的
是visjs库,在这个库
的
文档中,他们说您可以在title
属性
中编写
纯
文本或
HTML
元素: item.title='<div class="tooltip"
浏览 1
提问于2017-03-14
得票数 0
回答已采纳
1
回答
如何将Ruby irb / pry会话中
的
文本输出通过管道传输到linux过滤器?
ruby
、
filter
、
pipe
、
irb
、
pry
我
抓取
了一些网页,得到了
html
文本。我希望看到
纯
文本形式
的
html
。如何通过管道将变量中
的
文本传递给linux筛选器(使用语句"system“或%x{ })?
浏览 0
提问于2014-07-01
得票数 0
1
回答
如何过滤页面源以获得
纯
HTML
-
没有
内容(仅标记)
javascript
、
html
、
phantomjs
、
diff
、
webpage
有谁知道如何使用JavaScript获得特定网页
的
纯
HTML
结构(
没有
内容)?我试图在PhantomJS中做到这一点,它提供了两个
属性
(page.content和page.plainText) --第一个
属性
包含网页
的
内容(带有
HTML
元素标记),第二个
属性
包含
没有
任何
HTML
标记
的
内容不幸
的
是,
没有
这样
的
属性
浏览 2
提问于2016-04-14
得票数 0
回答已采纳
2
回答
jQuery $.get()在我尝试过
的
任何地方都不起作用。包含jsFiddle
jquery
、
ajax
、
get
我正在尝试使用$.get() jQuery函数
抓取
一个网页,到目前为止还
没有
成功。我有以下功能:document.write(response);其具有有效URL,且在该url内是json (然而,仅在
纯
html
页面上)。当我尝试编写内容时,什么也
没有</em
浏览 1
提问于2015-02-12
得票数 0
3
回答
使用脚本从pdf文档获取文本
windows
、
linux
、
bash
我用
的
是windows,偶尔也用linux。
浏览 2
提问于2012-02-25
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
HTML Video 元素在 Vue 中消失的 muted 属性
HTML 定义元素的类名称|Class 全局属性
一个HTML元素和五个CSS属性的魔力
纯 HTML+CSS+JS 编写的计算器应用
纯html写的LED万年历
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券