我使用BERT将文本转换为768模糊向量,它是多语种的:
from sentence_transformers import SentenceTransformer
model = SentenceTransformer('paraphrase-multilingual-mpnet-base-v2')
现在我想把模型投入生产,但是嵌入时间太长了,我想减少和优化模型以减少嵌入时间
我应该以这种方式从文本结构中提取多语种内容:
一些意大利文本/it英语文本/en bla bla bla
其他文本其他意大利语/it其他英语文本/en bla bla bla
我将摘取所有不附在beetwen多语种方括号内的案文和附在beetwen当前语文方括号内的案文。
例如,如果当前语言为"en“,我将提取以下文本:
一些文本英语文本bla
其他英文文本
如何使用正则表达式正确提取文本?
我有一个多语种的网站,目前是5种语言。我们将增加更多-更多。
视图有一个过滤器" language : Current user's language“,根据用户选择的查看内容的语言显示内容。
目前我们没有使用该筛选器,原因是视图结果页的URL路径设置。相反,因为我们必须将URL翻译成正在查看的语言,所以我们有一个块配置了一个英文URL页面,语言过滤器设置为English。
相反,我只需要配置一个视图就可以使用筛选器" language : Current user's language“,当查看该页面时,我需要url以该用户的语言正确显示,而不管视图页面配置中
我一直在玩的Editframe按钮在一个多语种的项目,并感觉到,编辑框架按钮不正常工作在塞特罗尔多语种网站8。
你能让它使用多语言实现的编辑框架按钮吗?
它是开箱即用,还是需要特殊配置?
我的经验是,当我在本地化页面上单击EditFrame按钮时,它将打开默认语言Item,而不是本地化项目。我的印象是,当您在Edit the Related Item中单击Experience Editor时,就会发生这种情况。