首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >如何从原始文本中提取员工职位

如何从原始文本中提取员工职位
EN

Data Science用户
提问于 2018-10-24 13:49:16
回答 1查看 89关注 0票数 1

我的原文是“John Fullerton先生是澳大利亚铁轨有限公司的首席执行官兼总经理,并于2011年2月被任命为该职位”。

我通过使用斯坦福大学( Stanford )很容易地识别出人名(约翰·富勒顿(John)),现在我想提取这些职位(首席执行官)。斯坦福纳( Stanford )将首席执行官视为“O”,那么我在这里应该使用哪种方法?

EN

回答 1

Data Science用户

发布于 2018-10-24 19:48:53

看看,看看如何构建知识库。我想说的是,如果你有足够的数据,最好的方法就是在你的语料库基础上建立你自己的知识库。

启动的想法(简化)是通过查看一些数据来创建“名称就是位置”之类的模式。通过这个你可以找到很多的名字和位置。然后从它们中提取新的模式,并再次扫描整个数据。直到没有新的模式出现。然后你会得到很多的is --一种关系,这就是你所需要的。

为了提取位置,您可能需要句子分割。请看一看幻灯片56,以获得一个概述。

PS:如果你没有足够的数据,你可以抓取网页,获取文本,并尝试建立你的词汇数据库。目标网站更有可能有这样的背景。

希望能帮上忙。祝好运!

票数 1
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/40154

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档