我一直在做一个工作描述解析器,我一直在尝试提取整个句子,其中包含了所需的多年经验。
我试过使用regex,它提供了我的年数,但不是整个句子。
def extract_years(self,resume_text):
resume_text = str(resume_text.split('.'))
exp=[]
rx = re.compile(r"(\d+(?:-\d+)?\+?)\s*(years?)",re.I)
for word in resume_text:
exp_temp = rx.search(resume_text)
if exp_temp:
exp.append(exp_temp[0])
exp = list(set(exp))
return exp
产出:“5-7年”
预期输出:'5-7年新闻、传播或内容创作经验优先考虑‘
发布于 2022-07-01 01:11:22
尝试:(\d+(?):-d+?+?)\s*(年份?).*
虽然我对Regex有点陌生,但我相信你可以用".*“的组合来结束你的比赛条款,如果"5-7年”在“需要5-7年的经验”这样的角色之后出现,那么你可以得到你想要的东西。
在末尾添加组".*“意味着在初始匹配结束后添加任何字符的组合,0或更多字符,以匹配整个句子。
希望这能有所帮助。
https://stackoverflow.com/questions/72822846
复制相似问题