我有一个包含工作职业作为主要变量的数据框架,对于每个职业来说,这是一组组成一份工作的技能。我试图用余弦作为距离度量来寻找工件之间的余弦相似性。到目前为止,我设法得到了余弦矩阵/数组,但是我不能把这个数组作为包含职业之间相似性的数据框架。请参见下面的数据集示例、我迄今使用的代码以及我希望得到的预期结果。理想的结果是:3d modeling 3d modeling 1
3d modeling IC auditor
为了存储它,我们将有一个配置文件实例,4个KeyItem实例:姓名、教育程度、国家和职业,以及4个具有值的对实例:"Andrew Morton“、"University of New South Wales所有其他配置文件将引用(全部或部分)相同的KeyItem实例:姓名、教育程度、国家和职业。理想情况下,我希望这种查询能够工作:我应该创建自定义索引器和搜索器吗?