首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >问答首页 >如何找出数据之间的相关性和相关性

如何找出数据之间的相关性和相关性
EN

Stack Overflow用户
提问于 2016-09-14 13:15:18
回答 1查看 416关注 0票数 0

我正在用某些API ()收集有关当前正在发生的特定事件的数据(文本)。我正在接收的数据基于传递给API的关键字的默认列表。API还收集除默认关键字之外的文本中出现的关键字,然后将它们添加到我的默认列表中,以便API也可以使用这些关键字搜索数据。这就是问题发生的地方,因为一些新添加的关键字与事件无关。我不想只在默认列表中限制数据搜索,因为我不能涵盖文本中使用的所有关键字。

到目前为止,我的解决方案是尝试对每1000个接收到的数据进行点-双线相关系数,但我不确定这是否是正确的方法,以及如何做到。

如果有人能就如何处理这个问题给我一个建议或任何解决办法,我会非常感激。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2016-09-14 13:30:09

您可以处理关键字集合使用术语共现,应该提供一个更好的相关性,您的默认列表。是一个例子,但您可以显著改进该算法。

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/39499745

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文