我正在尝试使用python从字符串中提取日期。日期是mm-dd-yyyy格式。所以我知道正则表达式应该类似于/d{2}-/d{2}-/d{4}。但是,当我试图遍历下面的数组时,我无法从字符串中提取日期。
import re
logs = ["First entry to journal logs. (01-01-2015)", "Last entry to journal logs 07-01-2016"]
for i in logs:
m = re.match("/d{2}-/d{2}-/d{4}",i)
print m.gr
我有一个字符串s,其中包含两个日期,我试图提取这两个日期,以便将它们从彼此中减去,以计算其间的天数。最后,我打算得到这样一个字符串:s = "o4_24d_20170708_20170801"
在我工作的公司,我们不能安装额外的软件包,所以我正在寻找一个使用本机python的解决方案。下面是通过使用datetime包(只提取一个日期)到目前为止的情况:如何将两个日期从字符串中提取出来?
import re, datetime
s = "o4_20170708_20170801"
match = re.search('\d{4}\d{2}\d{2}'
我是Python的新手,我正在尝试用Python3.6从一个文件夹中提取最新的文件。
我正在努力使用re.compile来匹配文件名。如何从文件列表中识别最新的文件,以便将其导入python?我还想从文件名中提取日期。
文件名的一个例子是'VAL-FTS_Opals_20180706.xls‘
我的代码如下:
import os
# Import pandas
import pandas as pd
#Import re & datetime for date identification & handling
import re
import datetime
我在列表中有一些文件名,它们有不同的扩展。
file_name_list = ['ABDCD Pattern Raw Data 1.4.2016.xlsx',
'Jack Raw Data 1.2.2016.xlsx',
'Farmers holdings 1.1.2016.xlsx',
'Anne Raw Data 1.3.2016.csv',
'120 Brewers 5-2-2018.txt']
我只想从这些文件名中删除日期,并将它们添加到新列表中。就像这样,
['abdcd pattern
在这种情况下,我必须从通过python脚本运行的SQL查询中提取日期。 以下是查询: select * from COLL_DS2 where TRANSACTION_DATE between '2021.02.28' and '2021.04.08' order by CREATION_DATE 我想从查询字符串中提取'2021.02.28‘和'2021.04.08’。 有什么需要帮忙的吗?提前感谢
我在创建一个匹配组以使用python从字符串中提取两个值时遇到了问题
以下是我的意见:
# SomeKey: Value Is A String
我希望能够使用python / regex语句提取SomeKey和Value Is A String。到目前为止,我的情况如下
import re
line = "# SomeKey: Value Is A String"
mg = re.match(r"# <key>: <value>", line)
我试图让python从URL字符串中提取一些文本。
下面是URL 的示例
SkuName总是在第5个"/“之后,然后在第6号"/”结束。
我想提取“SkuName”
import urllib.request
images = input('please enter url list separated by ","')
names = input('please enter images names separated by ","')
images = images.split(',')
n
Python新手。下面打印昨天的日期(在本例中为08132018):
from datetime import date, timedelta
yesterday = date.today() - timedelta(1)
print yesterday.strftime(‘%m%d%Y’)
有一个每天生成的文件的目录,文件名中包含前一天的日期。
import glob2
import os
array = (glob2.glob(“C:/somewhere/*.txt”))
for line in array
print line
这将打印该目录中的所有txt文件,但我只
如何使用python从PDF文件中提取一些特定的文本,并将输出数据存储到Excel的特定列中。
这里是样例输入PDF文件(File.pdf)
链接到完整的PDF文件
我们需要从整个文件中提取发票号、到期日和总到期的值。
到目前为止我使用的脚本:
from io import StringIO
from pdfminer.converter import TextConverter
from pdfminer.layout import LAParams
from pdfminer.pdfdocument import PDFDocument
from pdfminer.pd
请考虑以下文本文件。
~~~~~~~~~~~~~~~~~~~~~~~
| |
| First Block of text |
| |
~~~~~~~~~~~~~~~~~~~~~~~
----------------------- Monday 8 August 2021 -----------------------
~~~~~~~~~~~~~~~~~~~~~~~
| |
| Second Block of text |
|
我试图完成一个相当简单的任务-从电子邮件的语料库中提取日期(所有时间标记)。我尝试过几个不同的Python包,它们似乎都不起作用。以下是
from date_extractor import extract_dates
y = "Message-ID: <18782981.1075855378110.JavaMail.evans@thyme> Date: Mon, 14 May 2001 16:39:00 -0700 (PDT)"
dates = extract_dates(y)
for i in dates:
print i
在以下方面的成果:
20
我正在上传一些CSV文件到一个大的查询表。有一个名为filename的列,其格式为:sales_2021-09-09T21-27-05_010555Z
我正在尝试将来自google云存储的数据上传到大查询中的分区表中。请帮助我创建下面的字段,这里没有日期列,我需要从文件名中提取 date 。
time_partitioning=bigquery.TimePartitioning(
type_=bigquery.TimePartitioningType.DAY,
field="date", # Name of the column
我需要从jpeg格式中提取日期,我已经以字符串的形式从jpeg中提取了文本&使用regex提取日期,
JPEG文本
续:7225811153;BillNo4896TableNoR306 07-6月-201921:18:40
所用代码
导入正则表达式和日期时间
import re as r
from datetime import datetime
用于标识上述字符串中日期的regex。
id = r.search(r'\d{2}-\w{3}-\d{4}',text)
print(id)
输出re.Match对象;span=(89,100),match='07-
我正在尝试从二进制文件中提取一些字符串。当我在linux中使用这个带有字符串的正则表达式时,它可以正常工作,但在python中不工作。
在字符串中
strings -n 3 mke2fs | grep -E '^([0-9][0-9]*(\.[0-9]+)+)'
结果:1.41.11
在python中
import re
f = open("mke2fs","rb").read()
for c in re.finditer('^([0-9][0-9]*(\.[0-9]+)+)',f):
print c.group(1)
结果是
我有一套文本文件,我必须从中提取出生日期。下面的代码能够从大多数文本文件中提取出生日期,但是如果以下面的格式给出,则会失败。我能知道我怎么才能救出道布吗?这些数据是非常不统一和破碎的。
代码:
import re
str = """ This is python to extract date
D
.O.B.
:
14
J
u
n
e
199
1
work in a team or as individual
contributor.
And Name is: Zon; DOB: 12/23/
1955 11/15/2014 11:53
我试着匹配文件夹中文件的模式,文件扩展名是pdf。
我有许多pdf文件,有相同的模式,但与不同的名称在末尾。
模式包括文件的日期+名称.
问题是,当我运行脚本时,系统将这两个文件名视为第一个模式(python_pt),而不使用elif语句。
示例:
10-11-2021 python.pdf22-09-2021 java.pdf
代码:
import re
import os
from os import path
from tqdm import tqdm
from time import sleep
python_pt= "^[0-3]?[0-9]-[0-3]?[0-9
对不起,我对python非常陌生,我想弄清楚如何从所有字符串中提取特定的字符串序列。
我试过用re,但我不太明白。
import re
userinput = input('Enter the name of the file:')
file = open(userinput)
info = file.readlines()
info = re.sub(r'\[[.+]\]','',info)
print(info)
file.close()
如果文件包括: notokayokaynotokayasokay2sjnfksdnfnslk
我想要能
基本上,我有一个文件夹,其中绝对巨大的日志文件被归档每天。每天更精确地创建3个日志文件。
我正在编写一个Python脚本,用户必须输入YYYYMMDD格式的日期才能找到在此日期创建的3个文件,然后输入一个IP地址。脚本将读取3个.gz文件的内容,并打印IP地址所在的行。
import re
import os
import glob
import gzip
from datetime import datetime, timedelta
date_entry = raw_input('Give a date in format YEAR, MONTH, DAY \n')
da
我正在尝试从字符串中提取日期和时间,建立该值与当前日期和时间之间的增量。我尝试将regex输出从一个列表转换为一个字符串,它显示为type=string,但格式如下('18:06:39','Jan 30 2020')。
import re
from datetime import datetime, timedelta, date
string = 'configuration change at 18:06:39 EET Thu Jan 30 2020 by netbrain'
chg_date = re.findall(r"(\d{
我的日期串就像
Date: April 1st, 2015
Date: March 31st, 2015
Date: March 26th, 2015
我需要提取适合模式的日期。我将以python模式执行'%B %d %Y'。
那么,如何将上面的字符串提取为datetime格式。Regex的输出应该是:
March 31 2015
August 1 2014
请帮助我建立一个很好的正则表达式。
我尝试用Python从urls中提取数字。 import re
url = '/randomtext/02@randomtext/01@randomtext/03@randomtext/01@.mp4'
for m in re.finditer(r'\d{2}', url):
print(m[0], end='') 打印函数可以做到这一点,但是我需要在变量中得到相同的结果,我该怎么做呢?