首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >有没有开放源码的PHP文本分析库?

有没有开放源码的PHP文本分析库?
EN

Stack Overflow用户
提问于 2009-12-13 04:59:34
回答 3查看 7.5K关注 0票数 7

我正在寻找一个PHP库,它的功能与这个网页基本相同:http://textalyser.net/

我知道在python和java中有一些流行的库,但我正在寻找PHP版本。谢谢你的帮忙!

EN

回答 3

Stack Overflow用户

回答已采纳

发布于 2009-12-14 04:15:13

简短的回答

据我所知,没有一个,或者至少不是一个广为人知的/分布式的。

长长的答案

我遇到的关闭实际代码是php-text-statistics by Dave Child (因为PEAR version已经多年未维护),但它只关心可读性和句子、单词和音节计数。任何其他数据,你必须自己用count_charsstr_word_countsubstr_countpreg_match_all等来获取。当然还有一些数学技巧来计算所有的百分比。

也就是说,我不确定你到底想让这个库做什么,或者http://textalyser.net/做什么……

(我的意思是什么是非索引字表?或一个详尽的多词短语,就这一点而言...?)

票数 3
EN

Stack Overflow用户

发布于 2011-07-27 01:48:35

一个很老的问题。

无论如何,如果你想找出两个给定字符串之间的相似性,PHP有一个内置的函数similar_text

语法: similar_text ($first, $second, &$percent = null);

代码语言:javascript
运行
复制
//*Find the similarity/difference between two strings in percentage
$pc = 0;
similar_text('You rock!', 'I Rock too!!',$pc);
print $pc;

输出: 57.142857142857

如上所述,这个值是两个字符串相似的百分比。

注意:此函数区分大小写

代码语言:javascript
运行
复制
$pc = 0;
similar_text('you', 'YOU',$pc);
print $pc;  

将会给0!

我遇到的另外两个这样的函数是:

Levenshtein距离和Soundex

欲了解更多信息,请访问official documentation

票数 3
EN

Stack Overflow用户

发布于 2010-05-05 00:24:09

我目前正在寻找一个类似的东西,到目前为止,我找到的选择是利用Zend Lucene搜索功能。

http://www.opendocs.net/php/zend/ZendFramework-0.1.5/documentation/end-user/pl/zend.search.extending.html

或者查看Open Calais API。http://www.opencalais.com/ (来自汤森路透)

我还没有深入探讨这两种选择,但我认为它们在构建动态链接或超文本网页方面可能会有一些进展。

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/1894688

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档