首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >PHP Word爬虫程序

PHP Word爬虫程序
EN

Stack Overflow用户
提问于 2010-10-19 00:49:23
回答 2查看 689关注 0票数 0

如何从一个数组中的网页中获取所有唯一的单词?(没有所有属性和javascript等)?

有人能帮我这个忙吗?

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2010-10-19 08:14:49

看一看http://simplehtmldom.sourceforge.net/

然后做一些类似的事情:

代码语言:javascript
运行
复制
<?php

include_once('simplehtmldom/simple_html_dom.php');

$string = file_get_html('http://www.google.com')->plaintext;
$words = preg_split('/[\s,.]+/', $string, null, PREG_SPLIT_NO_EMPTY);

var_dump(array_unique($words));

?>
票数 1
EN

Stack Overflow用户

发布于 2010-10-19 01:47:09

试试这个get_text这个会帮到你的:http://mel.melaxis.com/devblog/2005/08/06/localizing-php-web-sites-using-gettext/

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/3961335

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档