我的朋友问我是否可以写一个程序,可以从招聘广告中找出相关关键词,知道三个变量:行业、职称和招聘公告文本(例如下面的例子)。
从求职者的角度来看,我们试图解决的问题是在简历中为每一份求职申请设置正确的关键词,从而增加了你获得面试入围名单的机会。这是特别重要的,当第一阶段的筛选是通过机器人扫描关键字。
最初,我正在考虑一个包含所有行业、所有职位和相关关键词的关系数据库。然而,这是一项艰巨的任务,信息和生物技术等进步领域的数据很快就会过时。
机器学习和自然语言处理似乎是不可避免的。
考虑一下招聘银行出纳员的招聘广告:
你是一个有经验的银行出纳员,寻求完美的工作生活平衡?如果你正在寻找休闲时间,并对客户服务有绝对的热情,那么这就是你的角色! 我们的客户服务昆士兰公务员(特别是昆士兰警察);目前正在寻找一个银行出纳员加入他们的布里斯班CBD团队,尽快启动。 成功的候选人将被要求工作在上午9:30至下午2:30,星期一至星期五,因此每周工作25小时。根据经验,成功的候选人将获得每小时25至27美元的退休金。 这一职位是临时的/临时的,有可能长期安置(根据工作表现/派任时间等)。 职责: 作为银行出纳员,你必须: 以一种非常专业和高效的方式照顾客户;处理基本交易,如存款和提款;完成复杂的交易,如贷款和抵押贷款;移交给销售团队(没有销售);大量的现金处理;以及确保高度关注细节是您的首要任务!技能和经验: 获选的候选人将有以下情况: 以前的出纳员经验(在过去5年内)理想;以前的客户服务经验(财务)理想;能够在快节奏和时间紧迫的环境中工作;出色的表现和态度;对细节的高度重视;能够快速掌握多个软件包;以及较强的时间管理技能和自主工作能力。如果您夸耀自己拥有出色的客户服务技能、专业的态度和更好的出纳员体验,我们将很高兴收到您的来信!
如果我是招聘经理(或机器人),我可能会在简历中寻找这些关键词:
出纳员,交易,存款,提款,贷款,抵押,客户服务,时间管理
你会怎么解决这个问题?
发布于 2017-02-01 14:00:57
如果您可以访问大量的广告,请按职位对广告进行分组,然后在每个组上运行一个主题建模算法,例如潜在Dirichlet分配(LDA)。这将产生关键字。
有关更多信息,请参见Relink,它正是您想要做的事情。它们在这里提供了流程的概要:关联组织工作岗位背后的科学
这是一篇可能有帮助的论文:职业生涯轨迹的建模。
关于LDA的技术论文,请参阅潜Dirichlet分配。
有关使用gensim库的样例Python代码的文章,请参阅英语维基百科实验。这是一篇有趣的文章,因为它涉及一个庞大的语料库,一个对整个Wikipedia数据库的转储,并讨论了如何在一个计算机集群上使用分布式LDA来提高执行时间。示例代码还说明了如何应用潜在语义分析,并将结果与LDA进行了比较。
以下文章和示例代码由约旦Barber,带有Python的潜在Dirichlet分配(LDA),使用NLTK为LDA创建一个语料库和gensim。这段代码比维基百科代码更适合其他应用程序。
https://stackoverflow.com/questions/41979278
复制相似问题