首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >从维基百科获得文章的第一段

从维基百科获得文章的第一段
EN

Stack Overflow用户
提问于 2013-01-08 09:05:29
回答 2查看 1.8K关注 0票数 0

从维基百科获得好莱坞这个词的文章的第一段的正确方法是什么?结果,$result变量包含本页第一段

好莱坞是美国加利福尼亚州洛杉矶的一个地区,位于洛杉矶市中心西北偏西。2由于好莱坞作为电影制片厂和电影明星的历史中心而享有盛名和文化身份,好莱坞一词常被用作美国电影的转喻。尽管大部分电影业已经分散到了周边地区,如西洛杉矶、圣费尔南多和圣克拉丽塔山谷,但重要的辅助产业,如编辑、特效、道具、后期制作和照明公司仍然留在好莱坞,派拉蒙影业的后起之秀也是如此。

如果它包含HTML标记(甚至比纯文本更好),就可以了。

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2013-01-08 13:04:56

我不知道Kohana是什么,但是要获得某个维基百科页面的HTML文本,可以使用API

例如,要获取好莱坞文章第一部分的HTML,可以使用如下查询:

http://en.wikipedia.org/w/api.php?format=xml&action=query&prop=revisions&titles=Hollywood&rvprop=content&rvsection=0&rvparse

这是XML格式的,但是JSON也是一个选项。

此外,这将返回整个第一部分(包括信息框),而不仅仅是第一段。

票数 3
EN

Stack Overflow用户

发布于 2013-01-08 10:08:32

您可以使用简单HTML DOM库轻松地从网页解析HTML:

代码语言:javascript
运行
复制
include('inc/simple_html_dom.php'); // this line should be replaced with the Kohana way of including the library

// Create DOM from URL
$html = file_get_html('http://en.wikipedia.org/wiki/Hollywood');

// Get the first paragraph
$p = $html->find('p', 0);

echo $p->innertext; // Prints <b>Hollywood</b> is a district in (...)

我从未使用过Kohana,但是似乎有用于简单HTML DOM的至少2个Kohana模块,所以在您的项目中使用库应该很容易。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/14211456

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档