尝试将一些AI/ML应用到我们目前手工执行的进程中。我有一份大约100000家公司的名单。这些公司的许多名称都是指同一家公司,但拼写略有不同。例如:
诸若此类。名单上大概有两万家独一无二的公司。有没有一种方法可以使用ML.NET给出类似公司名称的分组?然后,通过将每个组中的所有名称分配给公司名称的单个拼写,我们可以将输入数据规范化。
谢谢你的指导。
编辑
但是,假设集群是要使用的ml.net特性,我不确定这是否适用于未知(> 10000)数量的集群。
https://stackoverflow.com/questions/59097896
复制相似问题