我有一个很大的文本数据库,以数据框的形式阅读,其中有一列文本,其中有几个句子,以不同的格式提到时间,如下所示:
第1行。我试着用xxx-xxx-xxxx给你打电话,但是打到了语音信箱。我计划在太平洋标准时间2018年6月13日中午12点到下午2点之间进行下一次跟进。
第二行。如果我听到他们的消息,我今天会再打电话给你,如果没有,我会在美国东部时间下午4点到6点之间打电话给你。
第三行。我们将等待您的回复,如果我们没有收到您的答复,我们将在CST时间明天中午12:00到2:00之间给您打电话
第4行。正如在电话会议上讨论的那样,我们计划在明天美国东部时间下午12 - 02之间回电。
第5行。根据您的建议,我们将在太平洋标准时间2018年6月13日中午12点到下午2点之间进行下一次跟进。
只想提取时间部分与美国东部夏令时/美国东部夏令时/太平洋标准时间。
预期输出:
美国东部时间2018年6月13日下午4:00-下午6:00
太平洋标准时间明天下午12点至2点
我已经尝试了下面的方法:
x <- text$string
sc1 <- str_match(x, " follow up on (.*?) T.")
它返回类似如下的内容:
在2018年6月13日下午1点至2018年6月13日下午1点之间进行跟进
尝试使用以下代码组合其他格式
sc2 <- str_match(x, " will call you tomorrow between (.*?) T.")
并做一个行绑定来包含两种格式(后续*,我会给你打电话*)
sc1rb <- rbind(sc1,sc2)
这不起作用
有没有办法从上面的示例字符串中只提取时间部分和时区?
提前感谢!
https://stackoverflow.com/questions/50845639
复制相似问题