首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >从R中的文本中提取任意格式的日期

从R中的文本中提取任意格式的日期
EN

Stack Overflow用户
提问于 2018-05-03 11:52:56
回答 3查看 2.7K关注 0票数 0

我有文本(新闻)数据,并希望从文本中提取日期。日期可以采用任何格式,如2018年4月10日、10-04-2018年、2018年10月4日/2018年、2018 /04/10号、04.10.2018年等。

一个示例字符串是:

我的朋友将于2018年7月10日或2018年10月7日来

EN

回答 3

Stack Overflow用户

发布于 2018-05-03 13:20:32

我们使用str_extract提取它,然后用anydate获取格式

代码语言:javascript
运行
复制
library(anytime)
library(stringr)
anydate(str_extract_all(str1, "[[:alnum:]]+[ /]*\\d{2}[ /]*\\d{4}")[[1]])
#[1] "2018-07-10" "2018-10-07"

数据

代码语言:javascript
运行
复制
str1 <- "My Friend is coming on july 10 2018 or 10/07/2018"
票数 9
EN

Stack Overflow用户

发布于 2020-05-07 06:40:36

对于这些事情,分析器很有效。

代码语言:javascript
运行
复制
library(parsedate)

dates = c("April 10 2018", "10-04-2018", "10/04/2018", "2018/04/10", "04.10.2018")
parsedate::parse_date(dates)

[1] "2018-04-10 UTC" "2018-10-04 UTC" "2018-10-04 UTC" "2018-04-10 UTC" "2018-10-04 UTC"
票数 1
EN

Stack Overflow用户

发布于 2020-05-07 14:44:53

parsedate是一个很好的包,但是它使用下面的字符串失败

代码语言:javascript
运行
复制
txt = "Live coverage as American payrolls data shows big rise in unemployment, after composite PMI data shows UK business activity sunk to a record low in March following the Covid-19 lockdown" 
> parsedate::parse_date(txt) [1] "2020-03-19 UTC"
[1] "2020-03-19 UTC"
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/50154466

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档