首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >从英语词嵌入看非英语词的嵌入

从英语词嵌入看非英语词的嵌入
EN

Stack Overflow用户
提问于 2018-09-19 09:34:49
回答 1查看 328关注 0票数 0

如何从英语单词嵌入生成非英语(法语、西班牙语、意大利语)单词?

什么是为非英语单词生成高质量单词嵌入的最佳方法?

单词可能包括(三星-银河-S9)

EN

回答 1

Stack Overflow用户

发布于 2018-09-20 01:53:21

如何从英语单词嵌入生成非英语(法语、西班牙语、意大利语)单词?

你不能真的。除非你有完全相同意思的词。如果你知道国王,王后,女人和男人的法语单词,你可以给这些词嵌入完全相同的单词在英语。它们将表现出与英语单词相同的句法和语义属性。但是,您不能真正使用英语嵌入来为不同的语言进行嵌入。

为非英语单词生成高质量单词嵌入的最佳方法是什么?

英语单词和非英语单词可以用同样的方式来对待。将非英语单词表示为字符串/标记,并训练一个w2v模型。请使用gensim。你必须为你想要的语言找到一个庞大的语料库。然后你将不得不用这个庞大的语料库训练你的模型几个时代。好了。或者,在所需的语言中寻找预先存在的模型。

单词可能包括(三星-银河-S9)

除非你的语料库里有“三星星系-S9”这样的词,否则你的模型就不知道它意味着什么。使用一个可能在您希望使用嵌入的域中包含更多单词的语料库。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/52402693

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档