腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
rvest
-
从不
需要
的
文本
中
删除
段落
r
、
web-scraping
、
rvest
、
stringr
、
httr
我想从下面的
rvest
代码输出
中
删除
很多
段落
library(
rvest
) link <- 'https://www.duedil.com/company/gb/02666908/yorwaste-limitedread_html(link) %>% html_nodes("script:contains('js-financials-component')") %>
浏览 16
提问于2019-02-09
得票数 1
回答已采纳
1
回答
使用readLines和R
中
的
tm-包清洗网页
文本
r
、
url
、
nlp
、
tm
、
readlines
我正在尝试使用readLines函数
删除
网页上
的
regex代码和数字。为此,我使用了unlist函数。然而,我不知道如何
删除
数字。我正在考虑使用tm-package,但我似乎缺少了格式转换。我如何转换我
的
网页,以
删除
数字等与tm,或有一个更容易
的
方法,以消除冗余
的
文本
?我希望连接一些网页,以供阅读,所以它将是相当多
的
清洁。library(
rvest
) webpage <- readL
浏览 2
提问于2020-02-21
得票数 0
回答已采纳
1
回答
在R
中
刮取HTML
文本
的
某一部分
r
、
xml
、
rvest
我试图刮一个国家气象局
的
网页,只取一部分
文本
,并将其变成R
中
的
字符对象,这将是一个小
段落
,如NWS页面所示。(见下文)这两组代码都从页面
中
读取所有
文本<
浏览 5
提问于2017-05-24
得票数 1
回答已采纳
1
回答
抓取每个链接页面并将其存储为XML表
r
、
css-selectors
、
rvest
你好,我刚开始使用R从互联网上抓取数据,不幸
的
是,我对HTML和XML知之甚少。我试图抓取以下父页面上
的
每个故事链接:我不关心父页面上
的
任何其他链接,但
需要
创建一个表,为网址,故事
的
标题列,然后为页面的完整
文本
(可以是几个
文本
段落
)休息。我尝试使用
rvest
包,得到了urls,但真正
的
问题是遍历所有文章,提取
文本
并将所有内容存储在一个表
中
。对于谷歌新闻应用程序: library(<
浏览 2
提问于2018-06-04
得票数 0
1
回答
R: Webscraping抓取不规则
的
值块
r
、
web-crawler
、
rvest
因此,我试图在网页上刮起一个不规则数据块
的
网页,这些数据是以一种易于用眼睛识别的方式组织起来
的
。让我们想象一下我们在看维基百科。如果我从以下链接
的
文章
中
抓取
文本
,我将得到33个条目。这一结果并不令我们感到惊讶,因为我们知道,条款
的
某些部分有多个
段落
,而其他部分只有一个或没有
段落
文本
。 我
的
问题是,我如何把我
的
标题和我
的
文本
联系起来。如果每个标题有相同数量
的
浏览 2
提问于2015-07-21
得票数 2
回答已采纳
1
回答
在标题下刮除所有儿童
段落
(较好
的
租赁权)
r
、
css-selectors
、
web-scraping
、
rvest
我
的
目标是在一个相当大
的
word文档上使用library(tm)工具包。word文档有合理
的
排版,所以我们有h1作为主要部分,一些h2和h3副标题。我想对每个部分进行比较和
文本
挖掘(每个h1下面的
文本
--小标题并不重要--因此可以包括或排除它们)。
rvest
::html_text() 我可以提取所
浏览 2
提问于2015-02-14
得票数 3
回答已采纳
2
回答
R上不带格式
的
Web抓取
html
、
r
、
web-scraping
、
rvest
我正试图通过R从一个网站获得一首抒情歌曲,我
的
文本
正在汇集在一起。library(
rvest
) datatest <- read_html(url)b <- datatest %>% html_text()我希望
文本
在不同
的</
浏览 2
提问于2017-10-31
得票数 1
回答已采纳
2
回答
要在R
中
拆分多行文字
的
iHow?
r
、
split
我有一个输入文件,其中有一个
段落
。我
需要
按模式将
段落
分成两个小
段落
。 <Text>R代码:top = xmlRoot(doc)我
需要
把这段话分成两段。我发现strsplit函数非常有用,但它
从不
拆分多行
文本
浏览 0
提问于2013-03-20
得票数 1
回答已采纳
2
回答
使用python以编程方式猜测
段落
的
标记
python
、
nlp
、
nltk
我试着阅读了关于NLP
的
一般知识和nltk在python
中
的
具体使用。我不确定我正在寻找
的
东西是否存在,或者我是否
需要
开发它。我
的
问题是,我能
浏览 0
提问于2012-06-17
得票数 2
回答已采纳
1
回答
如何在Word文件
中
创建包含多个可编辑
段落
(小节)
的
下拉列表?
drop-down-menu
、
paragraph
我
需要
创建一个Word模板,我可以
从不
同
的
段落
中选择我
需要
的
文档
的
第一部分。比如下拉列表,而不是值,我
需要
段落
。它不一定是一个下拉列表,而是任何类型
的
功能,允许我
从不
同
的
图形中进行选择(类似于InfoPath
中
的
可选部分)。 谢谢,
浏览 0
提问于2009-10-13
得票数 0
回答已采纳
1
回答
有人能分享一下如何从
文本
框
中
删除
段落
吗?
textbox
、
apache-poi
、
xwpf
我目前正在做一个用Apache POI项目操作Docx文件
的
项目。我曾使用api从
文本
框内
的
运行
中
删除
文本
,但不知道如何
删除
文本
框内
的
段落
。我假设我
需要
使用类CTP来获取要
删除
的
段落
对象。
浏览 47
提问于2019-12-23
得票数 0
回答已采纳
3
回答
LaTeX :在Emacs模式下填充
段落
时关闭缩进
emacs
当我使用emacs编辑latex文档时,
段落
填充(Esc-q)不能满足我
的
需要
。fill时,我得到: % similar to 也就是说,emacs将"%“作为注释字符,并相应地填充
段落
然而,"\vn“是我
的
一个宏,它将
文本
设置为texttt模式,而这里
的
"%”只是一个常规
的
可打印字符,因此
段落
填充做得不正确
浏览 11
提问于2012-05-25
得票数 1
6
回答
解析包含 ;
的
html (不间断空格)
r
、
stringr
我正在使用
rvest
解析一个网站。我要用这些不间断
的
小空格撞墙了。如何
删除
已解析
的
html文档
中
由 元素创建
的
空格?library("
rvest
") bodytext <- minimal %&g
浏览 0
提问于2014-12-02
得票数 9
4
回答
如何用模板文件作为
段落
包
的
主题?
7
、
theming
、
paragraphs
我使用
的
是
段落
模块版本
的
7.x-1.0-beta6,我有一个包,它
的
机器名是:text_buttons paragraphs-items.tpl.php paragraphs-item.tpl.php如果我将paragraphs-items.tpl.php复制到主题下
的
模板文件夹
中
,我可以修改代码,并在有
段落
包
的
地方看到站点范围内
的
更改。我在以下线程
中
遵循了这些解决
浏览 0
提问于2015-06-04
得票数 5
2
回答
(基础) Elisp编程: Emacs
中
Cut函数
的
特殊钩子
elisp
我有一个包含相关内容/
段落
的
文本
文件。假设我从
文本
中
剪切/
删除
段落
A。我想写一个在这种情况下被调用
的
函数,因此相关
段落
-比方说B-也被
删除
了。一个很好
的
例子是其中包含引用/引用
的
文档。-即,每当您
删除
该
文本
时,引用也将被
删除
-类似于MS Office所做
的
事情。理论上我认为: 1)
浏览 2
提问于2012-07-24
得票数 2
回答已采纳
1
回答
使用Apache POI更新XWPFParagraph
的
文本
java
、
apache-poi
我已经能够遍历文档
中
的
所有
段落
,并获得
文本
和所有内容,我已经阅读并理解了如何从头开始创建文档。但是如何更新和替换
段落
中
的
文本
呢?我可以在一个
段落
中使用createRun,但这只会在其中创建一段新
的
文本
。 ...我
的
理论是,我
需要
在我想要更改
的
段落
中找到现有的"run“,或者
删除
段落
浏览 21
提问于2010-07-09
得票数 5
1
回答
OpenXML -在Word文档
中
删除
TableCaption
c#
、
ms-word
、
openxml
、
openxml-sdk
我有一个Word模板
中
的
许多表格都是用OpenXML操作
的
。根据情况,可能
需要
删除
其中一些,在这种情况下,我使用以下代码:table.Remove(); 这不会
删除
Table和所有行,但不会
删除
TableCaption并且表格本身将从文档
中
删除
,但标题仍保留。我确实尝试过将字幕添加到列表
中
,并在循环之外
删除
它们,但这不起作用。设置
文本<
浏览 25
提问于2017-08-22
得票数 0
1
回答
Contenteditable
删除
第一个<p>标记
php
、
html
、
contenteditable
所以我有一个div,里面有一个
段落
和一些可编辑
的
文本
。 当你点击enter时,它会创建一个新
的
段落
,这就是我希望它工作
的
方式。当你
删除
文本
并到达结尾时,它会
删除
段落
标签,但我
需要
它不
删除
第一个标签,这样当你再次开始键入时,它仍然包含在
段落
标签
中
。> </div>我
的
$text是:<p>So
浏览 0
提问于2015-10-27
得票数 0
2
回答
替换
段落
会导致它进入无限循环
vba
、
ms-word
我
需要
按
段落
处理
文本
。下一个示例显示获取一个
段落
并
删除
它
的
最后一个字符-
段落
字符。然后,我处理这个
文本
,并尝试用新
文本
替换旧
文本
。问题是它会进入无限循环并冻结单词。proccessing here End IfEnd Sub 我还尝试
删除
所有
段落<
浏览 6
提问于2020-12-03
得票数 0
回答已采纳
1
回答
从Wordpress帖子
中
删除
段落
标签
php
、
wordpress
我使用下面的php在我
的
single.php页面上输出内容但是,它将所有内容(包括图像/img、块引用等)都放在<p>标记
中
。我想
从不
是
段落
的
所有内容
中
删除
标签。
浏览 1
提问于2017-02-24
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
如何对 Word 中的大量文本段落重新调整顺序?
Python实例分析(一)删除文本中的空行
如何快速删除PDF文件中不需要的页面,分享实用技巧
为什么加班的总是你?兼答同学问——如何把文本和数字中的空格快速删除
应用R语言在百度学术上爬虫
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
即时通信 IM
活动推荐
运营活动
广告
关闭
领券