我有一个关于类似词分组的问题,例如,我有下面的单词清单:
我想把这些词归类到人工智能,机器学习,数据分析中
我使用了difflib.get_close_matches(),但这并没有给我想要的结果,例如,这就是difflib组: Information‘:“信息技术”、“移动技术”、“新技术”
我也使用了fuzz.token_set_ratio(),但这也没有提供我想要的结果。两个人都没有。
如果有机器学习算法或python库,请告诉我。
谢谢
发布于 2018-08-02 00:23:00
你不能用一个算法来解决这个问题。
相反,您需要解决更多的数据,关于语言和缩写。这也被称为世界模型,背景数据等。
https://datascience.stackexchange.com/questions/36323
复制相似问题