我的目标是创建一个基本程序,该程序在语义上比较字符串,并决定哪一个(在语义方面)更类似于哪个字符串。现在,我不想从头开始构建一个新的(doc2vec?)NTLK、SKlearn或Gensim中的模型,但是我想测试已经存在的API,这些API可以进行语义分析。具体来说,我选择测试ParallelDots AI API,因此我用python编写了以下程序:
api_key = "*******************然而,ParallelDots AI A
我们的Oracle是UTF8。我们正在存储需要搜索的地址。有些街道名称含有非英语字符(例如,Pe a Báináa),这需要搜索为“Pe a Báiná”或具有"Pena Bainao“等英语对等字符。我们所做的是转换查询上的文本,类似于:但这里的问题是,并不是所有的字符都有英语对等物(甚至不是一些相当明显的字符,比如尼诺),所以我们最后将文本转换为:因此,如果用户试图查找输入"Pena B