Entity Identified
0 Ref-Name T.M.Chanika
1 Location Kandy
2 Email chanikalakmini23@gmail.com
3 Degree Certificate Level of REVIT
4 Degree Certificate Level of ADVANCED COMPUTER
5 Skill Auto Cad
6 Degree Certificate Level of ADVANCED COMPUTER
7 Skill 3D MODELLING using
8 Skill Auto Cad
9 Institute University of Moratuwa of Mechanical Engineering
10 Degree NVQ Level 05 -Technical在这里,我想找到一些模式,输出在一个新的模型中。例如(姓名,地点,电子邮件)模式&(学位,学院)模式。我们怎么能用潘达斯做这件事。如果所有模式都符合要求,我们可以使用类似模式=“参考名称”、“位置”、“电子邮件”之类的东西。
pat_i = [df[i-len(pattern):i] # Get the index
for i in range(len(pattern), len(df)) # for each 3 consequent elements
if all(df['Entity'][i-len(pattern):i] == pattern)] # if the pattern matched
pat_i
[ Entity Identified
0 Ref-Name T.M.Chanika
1 Location Kandy
2 Email chanikalakmini23@gmail.com]如果在学位与学院之间有价值,我们如何识别模式?
发布于 2022-02-24 10:27:23
我可能误解了您的上下文,但是它看起来一点也不像NER,基本上是您想要n个第一行的关键组,因为示例数据是结构化的?
如果是正确的,甚至不需要python,大多数数据库都可以很容易地做到这一点。
https://stackoverflow.com/questions/71250400
复制相似问题