我浏览了一些博客,他们说通用句子编码器用于语义相似性的弹性搜索,我们可以使用BERT而不是ULSE吗,他们还说嵌入搜索必须遍历所有文档。它能被优化吗。
https://www.elastic.co/blog/text-similarity-search-with-vectors-in-elasticsearch
发布于 2021-05-31 15:41:29
当然-你可以使用BERT。然而,它将导致更高的运行时间将数据转换为向量嵌入。顺便说一句,您应该探索其他相似性搜索替代方案,例如pinecone.io,它提供托管矢量搜索服务。
发布于 2021-06-29 22:55:10
绝对一点儿没错!您只需使用dense_vectors来搜索向量,这就是BERT所使用的。
有关密集向量的详细信息,请访问:https://www.elastic.co/guide/en/elasticsearch/reference/current/dense-vector.html
有关如何优化嵌入搜索的更多信息,请查看https://www.gsitechnology.com/sites/default/files/AppNotes/GSIT-Elasticsearch-Plugin-AppBrief.pdf
https://stackoverflow.com/questions/63224074
复制相似问题