我是机器学习方面的新手,我正在研究一个与文本相关的问题。我知道,在ML中,我们可以用特征值作为神经网络的输入,但我不知道如何使用特征作为单词。在一些论文中,我读到,我们把特征看作具有某种性质的n个词。我真的不明白这怎么可能。如果没有问题,请告诉我一些好的论文、课本或链接,说明如何做到这一点。
发布于 2018-03-04 05:05:18
你需要做一本辞典。这意味着你必须制作一本字典,你给每个单词指定一个独特的值。然后,您可以使用一个热编码来唯一地表示每个单词。如果这是你所需要的,它会做你想做的。但这有个大问题。当你想到猫和狗,你可能会发现它们之间的相似之处和不同点。这是因为你有更多的知识,而不是在你的大脑中唯一表达的文字。因此,您应该使用方法为每个单词分配一个唯一的数字,并将相近的概念作为邻居。第一部分是这里,第二部分是这里。
https://datascience.stackexchange.com/questions/28583
相似问题