我用java实现了textrank,但它看起来相当慢。有人知道它的预期表现吗?
--如果它不被认为是慢的,那么下面的任何一个问题可能是这样的:
1)在JGraphT时间里,似乎没有办法创建一个边并为它添加一个权重,所以我计算了权重,如果它> 0,我就添加一个边。稍后,我重新计算权重,以增加它们,同时循环通过边缘。这是个糟糕的主意吗?
2)我使用的是JGraphT。那是个慢图书馆吗?
3)我还能做些什么使它更快呢?
发布于 2012-01-07 01:37:56
这取决于你所说的“相当慢”是什么意思。谷歌一下就发现了这个段落:
“我们计算了RAKE和TextRank (平均超过100次迭代)从Inspec测试集中提取关键词的总时间,在从files中读取摘要并载入内存之后。RAKE在160毫秒内从500个文摘中提取关键词。TextRank提取关键字1002毫秒,超过RAKE的6倍。”
(有关上下文,请参见http://www.scribd.com/doc/51398390/11/Evaluating-ef%EF%AC%81ciency。)
因此,我由此推断,一个像样的TextRank实现应该能够在1秒内从大约500个摘要中提取关键字。
https://stackoverflow.com/questions/8765710
复制相似问题