问从R中的*.txt文件中提取文本
EN

Stack Overflow用户

提问于 2018-12-05 00:51:38

回答 3查看 911关注 0票数 1

我已经使用Mac的表达式来确认我的Regex工作，但我找不到从文本文件中提取信息的命令。我有2,500个文本文件，我需要提取每个文档的日期，以便填充数据集。仅供参考，"date“是要提取的第一个变量，还会有其他变量。这些文件的格式各不相同，并且有多个日期。我只对每个文档的第一个日期感兴趣。一些文档有一个包含日期的新行，另一些文档则以单词" date“或”Date“开始。

每个文本文档的示例：

Bangor
dorset
LL56 43r

date:         10 july 2009
take notice:  the blah blah blah text goes here and there's lots of it.
action:

有效的正则表达式：

"\\d{1,2}\\s+(?:january|february|march|april|may|june|july|august|september|october|november|december)\\s+\\d{4}"

文本文档在R Studio环境中作为单元素字符矢量可见。我想提取文本“原样”，这样就像...

> strapply(NoFN, ("\\d{1,2}\\.?:january|february|march|april|may|june|july|august|september|october|november|december\\.\\d{4}")[[1]]
> [1] 10 july 2009

显然，这实际上并不起作用！

非常感谢！伊恩

regex

text

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/53617865

复制

相似问题

问从R中的*.txt文件中提取文本
EN

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问从R中的*.txt文件中提取文本EN

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问从R中的*.txt文件中提取文本
EN