首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >当raws之间有不同的值时,如何识别Pandas dataframes中行中的各种字符串模式

当raws之间有不同的值时,如何识别Pandas dataframes中行中的各种字符串模式
EN

Stack Overflow用户
提问于 2022-02-24 10:18:04
回答 1查看 169关注 0票数 0
代码语言:javascript
运行
复制
Entity  Identified
0   Ref-Name    T.M.Chanika
1   Location    Kandy
2   Email   chanikalakmini23@gmail.com
3   Degree  Certificate Level of REVIT
4   Degree  Certificate Level of ADVANCED COMPUTER
5   Skill   Auto Cad
6   Degree  Certificate Level of ADVANCED COMPUTER
7   Skill   3D MODELLING using
8   Skill   Auto Cad
9   Institute   University of Moratuwa of Mechanical Engineering
10  Degree  NVQ Level 05 -Technical

在这里,我想找到一些模式,输出在一个新的模型中。例如(姓名,地点,电子邮件)模式&(学位,学院)模式。我们怎么能用潘达斯做这件事。如果所有模式都符合要求,我们可以使用类似模式=“参考名称”、“位置”、“电子邮件”之类的东西。

代码语言:javascript
运行
复制
pat_i = [df[i-len(pattern):i] # Get the index 
 for i in range(len(pattern), len(df)) # for each 3 consequent elements 
 if all(df['Entity'][i-len(pattern):i] == pattern)] # if the pattern matched
pat_i

[     Entity                 Identified
 0  Ref-Name                T.M.Chanika 
 1  Location                      Kandy
 2     Email  chanikalakmini23@gmail.com]

如果在学位与学院之间有价值,我们如何识别模式?

EN

回答 1

Stack Overflow用户

发布于 2022-02-24 10:27:23

我可能误解了您的上下文,但是它看起来一点也不像NER,基本上是您想要n个第一行的关键组,因为示例数据是结构化的?

如果是正确的,甚至不需要python,大多数数据库都可以很容易地做到这一点。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/71250400

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档