使用Tensorflow通用句子编码器,我希望能够找到两个字符串之间的相似度百分比(基于含义)。tf.losses.cosineDistance(embeddings[0], embeddings[1]).print()
虽然这是一个开始,但我不确定如何从该数据中找到两个字符串之间的相似度百分比通过基于含义的相似度百分比,您可以预期以下两个字符串具有很高的相似度百分比:"what is your age“和"how ar
我需要一个通过相似度来协调的算法,因为我必须考虑打字错误,有时还需要考虑句子中的产品片段。示例: Coke zero JS MKT (JS和MKT是垃圾,但句子更类似于Coke Zero)。我一直在测试一些NLP的句子相似度,比如Bag of words,以及阅读其他一些方法,比如Cosine相似度和Levenshtein距离。然而,我不知道对我的情况来说什么是最好的选择。