首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >将招聘广告与给定的一组类别进行比较(每组类别都由术语组成)

将招聘广告与给定的一组类别进行比较(每组类别都由术语组成)
EN

Data Science用户
提问于 2018-10-07 10:36:45
回答 1查看 23关注 0票数 0

在最近的一篇研究论文中,我计划做以下几件事,我恳请你提供建议。

我得到了几千份招聘广告。我现在想分析一下,这些招聘广告是如何以及是否包括以前在另一篇研究论文中被指定为个人“类别”的“内容”的。为了使事情更精确,大约有15个现有的类别,每个类别都包含解释2-4句话的描述。

现在,我想了解的是,哪些招聘广告以及多少招聘广告涵盖了这15个类别中的每一个方面。结果可能是,例如,作业广告1包含与类别2、5、8的描述相匹配(或接近)的内容,但遗漏了允许引用其余类别的内容。

如果您有任何参考或建议如何处理这项任务,请告诉我。我怀疑最好的方法是有监督的学习方法。

最好的

斯波兹。

EN

回答 1

Data Science用户

发布于 2018-10-07 15:26:30

就数据理解而言,我首先建议采用一种无监督的方法。比如你可以..。

  • 。。执行tf/国防军矢量并构建一个简单的标记云
  • 。。执行潜在的Dirichlet分配,以获得数据中潜在主题的概述(如聚类和解释类别)
  • 。。在你的数据上训练一个单词嵌入(例如word2vec)。然后执行维数约简(PCA)以直观地探索数据。(您可以找到语义和语法上的集群)

在非超维数据挖掘之后,您可以根据经典的方法(例如,单词模型袋)或使用神经网络(=监督)来进行文本分类。

票数 0
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/39302

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档