如何从英语单词嵌入生成非英语(法语、西班牙语、意大利语)单词?
什么是为非英语单词生成高质量单词嵌入的最佳方法?
单词可能包括(三星-银河-S9)
发布于 2018-09-20 01:53:21
如何从英语单词嵌入生成非英语(法语、西班牙语、意大利语)单词?
你不能真的。除非你有完全相同意思的词。如果你知道国王,王后,女人和男人的法语单词,你可以给这些词嵌入完全相同的单词在英语。它们将表现出与英语单词相同的句法和语义属性。但是,您不能真正使用英语嵌入来为不同的语言进行嵌入。
为非英语单词生成高质量单词嵌入的最佳方法是什么?
英语单词和非英语单词可以用同样的方式来对待。将非英语单词表示为字符串/标记,并训练一个w2v模型。请使用gensim。你必须为你想要的语言找到一个庞大的语料库。然后你将不得不用这个庞大的语料库训练你的模型几个时代。好了。或者,在所需的语言中寻找预先存在的模型。
单词可能包括(三星-银河-S9)
除非你的语料库里有“三星星系-S9”这样的词,否则你的模型就不知道它意味着什么。使用一个可能在您希望使用嵌入的域中包含更多单词的语料库。
https://stackoverflow.com/questions/52402693
复制相似问题