我试图在r中用手套将文本数据转换成向量,我的计划是平均一个句子的单词向量,但我似乎无法达到单词向量化的阶段。我试图将预先训练好的嵌入加载到一个模型中,这样如果我有一个句子(比如“我爱灯”),我可以迭代这个句子,并将每个单词转化为一个向量,然后我可以用一个类似于矢量法( word )的函数来平均(将未知的单词转换为零如何将经过预先训练的嵌入作为我的语料库加载到手套模
我有一个单字串的List/RDD和一个句子的List/RDD,这些句子可能包含或不包含单个单词列表中的单词。Array("this Date", "is there something", "where are something", "this is a string")
我想选择包含单曲中的一个或多个单词的句子Array(this Date, this is a String)),(i