我有一个二叉树,它存储所有单词及其在文本中的出现情况。单词为关键字,出现次数为值
如果我有多个文本,我要创建多个树吗?
此外,我还想计算idf (逆文档频率-该单词在所有文本中出现的次数)。
我如何才能做到这一点?
发布于 2020-07-23 20:22:59
如果我正确理解了您的问题,您将需要为每个文件创建一棵树,以便能够知道每个文件中有多少个单词出现。
然后,对于第二部分,我不能理解你是需要一个单词的总出现次数,还是需要包含该单词的文件数量。在每种情况下,您只需循环遍历所有的树并查找该单词。
https://stackoverflow.com/questions/63052234
复制相似问题