我正在寻找一个PHP库,它的功能与这个网页基本相同:http://textalyser.net/
我知道在python和java中有一些流行的库,但我正在寻找PHP版本。谢谢你的帮忙!
发布于 2009-12-14 04:15:13
简短的回答
据我所知,没有一个,或者至少不是一个广为人知的/分布式的。
长长的答案
我遇到的关闭实际代码是php-text-statistics by Dave Child (因为PEAR version已经多年未维护),但它只关心可读性和句子、单词和音节计数。任何其他数据,你必须自己用count_chars,str_word_count,substr_count,preg_match_all等来获取。当然还有一些数学技巧来计算所有的百分比。
也就是说,我不确定你到底想让这个库做什么,或者http://textalyser.net/做什么……
(我的意思是什么是非索引字表?或一个详尽的多词短语,就这一点而言...?)
发布于 2011-07-27 01:48:35
一个很老的问题。
无论如何,如果你想找出两个给定字符串之间的相似性,PHP有一个内置的函数similar_text。
语法: similar_text ($first, $second, &$percent = null);
//*Find the similarity/difference between two strings in percentage
$pc = 0;
similar_text('You rock!', 'I Rock too!!',$pc);
print $pc;输出: 57.142857142857
如上所述,这个值是两个字符串相似的百分比。
注意:此函数区分大小写
$pc = 0;
similar_text('you', 'YOU',$pc);
print $pc; 将会给0!
我遇到的另外两个这样的函数是:
Levenshtein距离和Soundex
欲了解更多信息,请访问official documentation
发布于 2010-05-05 00:24:09
我目前正在寻找一个类似的东西,到目前为止,我找到的选择是利用Zend Lucene搜索功能。
http://www.opendocs.net/php/zend/ZendFramework-0.1.5/documentation/end-user/pl/zend.search.extending.html
或者查看Open Calais API。http://www.opencalais.com/ (来自汤森路透)
我还没有深入探讨这两种选择,但我认为它们在构建动态链接或超文本网页方面可能会有一些进展。
https://stackoverflow.com/questions/1894688
复制相似问题