开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

MediaWiki接口:获取维基百科列表子列表的所有页面？

MediaWiki是一种开源的维基百科软件，它提供了一系列的API接口，可以用于获取维基百科的各种信息。要获取维基百科列表子列表的所有页面，可以使用MediaWiki的API接口中的"categorymembers"模块。

"categorymembers"模块允许我们获取指定分类下的所有页面。在这个问题中，我们需要获取维基百科列表子列表的所有页面，可以通过以下步骤来实现：

构造API请求URL：使用MediaWiki的API接口，构造一个GET请求的URL，指定"action"参数为"query"，"list"参数为"categorymembers"，"cmtitle"参数为要获取的列表子列表的页面名称，"cmlimit"参数为每次请求返回的页面数量。
发送API请求：使用HTTP客户端发送构造好的API请求URL，向MediaWiki的API接口发送请求。
解析API响应：获取到API的响应后，解析响应数据，提取出所有页面的相关信息。
处理分页：由于API一次返回的页面数量是有限的，如果列表子列表的页面数量较多，可能需要处理分页。可以使用"cmcontinue"参数来指定下一次请求的起始位置，直到获取到所有页面为止。
获取页面内容：对于每个页面，可以使用MediaWiki的API接口中的"parse"模块来获取页面的内容。

推荐的腾讯云相关产品：腾讯云提供了云服务器、云数据库、云存储等一系列云计算产品，可以满足各种应用场景的需求。具体可以参考腾讯云的产品介绍页面：腾讯云产品介绍

注意：本回答中没有提及亚马逊AWS、Azure、阿里云、华为云、天翼云、GoDaddy、Namecheap、Google等流行的云计算品牌商，以遵守问题要求。

相关搜索:Firebase获取子列表的子列表 php树获取子节点所有父节点的列表什么是最好的方法-获取所有可能的子列表从列表内的列表中获取所有元素使用api获取每种语言的所有维基百科类别列表？在Python中将项追加到列表的所有子列表如何从mediawiki API获取某个特定人员的所有报价列表？如何从r中的列表中提取所有子列表？如何获取PCDN的API接口所有支持的地区列表如何获取列表中所有子元素的文本

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

开源维基百科文档系统mediawiki

MediaWiki 是使用 PHP 编写的免费开源 Wiki 系统。MediaWiki 已使用超过350种语言进行了本地化，其可靠性和强大的功能集为其赢得了庞大而充满活力的第三方用户和开发者社区。

03

维基百科 MediaWiki API 解析

使用开放的 API 做一个自己的小项目，是一个很好的学习方法。但好像开放的 API 选择并不多。这里给大家多一个选择，简单介绍一下维基百科使用的 MediaWiki API。

01

维基百科中的数据科学：手把手教你用Python读懂全球最大百科全书

几年前谁能想到，匿名贡献者们的义务工作竟创造出前所未有的巨大在线知识库？维基百科不仅是你写大学论文时最好的信息渠道，也是一个极其丰富的数据源。

03

从互联网爬虫、自动驾驶到对话机器人，什么是Semantic（语义）？

Semantics (from Ancient Greek: σημαντικός sēmantikós, "significant")[1][a] is the linguistic and philosophical study of meaning in language, programming languages, formal logics, and semiotics. It is concerned with the relationship between signifiers—like words, phrases, signs, and symbols—and what they stand for in reality, their denotation.

01

如何部署 MediaWiki

MediaWiki是一个流行的免费wiki软件包。它与维基百科使用的软件相同，是完全动态的，可以在LAMP堆栈上运行，利用PHP语言和MySQL数据库后端。通过简单的安装和配置，当您需要用到一个熟悉的、功能齐全的动态wiki引擎时，MediaWiki是一个很好的选择。

【玩转腾讯云】七.基于CVM快速搭建部署属于自己的维基百科

②选择自定义配置——计费模式为“按量付费”——地域选择“北京”——可用区选择“随机可用区”——网络选择“默认”即可

在Ubuntu 16.04上安装MediaWiki

MediaWiki是一个流行的免费wiki软件包。它与维基百科使用的软件相同，是完全动态的，可以在LAMP堆栈上运行，利用PHP语言和MySQL数据库后端。通过简单的安装和配置，当您需要用到一个熟悉的、功能齐全的动态wiki引擎时，MediaWiki是一个很好的选择。

05

钱塘干货 | 数据收集和处理工具一览

进入大数据时代，调查报道愈加成为信息战。从哪里收集有效数据？如何抽取、筛选、整合、分类大量琐碎的信息？如何分享、存储数据，并实现随取随用？钱塘君整理了一张数据收集和处理工具清单，分为八大类，方便实用，各有所长，供大家选择。 ---- 1.全文本搜索和挖掘的搜索引擎：包括：搜索方法、技术：全文本搜索，信息检索，桌面搜索，企业搜索和分面搜索开源搜索工具： Open Semantic Search：专门用于搜索自己文件的搜索引擎，同样的还有Open Semantic Desktop Search:可用于搜索单

07

搭建属于你自己的维基站点：MediaWiki

MediaWiki 是一个全球著名的开源的，运行于 PHP+MySQL 环境下的 wiki 程序。例如，全球最大的 wiki 项目维基百科，就是使用 MediaWiki 运营的成功范例。更多关于 MediaWiki 的介绍，我们可以在这里找到。服务器配置搭建 LAMP 环境后，我们还需要安装一些额外的 PHP 5 模块。以下 4 个模块的安装，都是可自主选择是否安装的。但在这里，我建议大家能把前两个模块（Intl 和 GD）安装下。第一个我们将要安装的扩展模块是 Intl ，它能为

06

关于SourceForge不能使用的问题

sourceforge SourceForge.net，又称SF.net，是开源软件开发者进行开发管理的集中式场所，也是全球最大开源软件开发平台和仓库。 SourceForge.net由VA Software提供主机，并运行SourceForge软件。大量开源项目在此落户(截至2009年2月，超过23万的软件项目已经登记使用超过200 万注册用户的服务，使SourceForge.net开放源码的工具和网络应用的最大集合),包括维基百科使用的MediaWiki，但也包含很多停止开发和一人开发的项目。最近不

06

Python在Finance上的应用5 ：自动获取是S&P 500的成分股

欢迎来到Python for Finance教程系列的第5讲。在本教程和接下来的几篇文章中，我们将着手研究如何为更多公司提供大量的定价信息，以及我们如何一次处理所有这些数据。

01

手把手：一张图看清编程语言发展史，你也能用Python画出来！

大数据文摘作品作者：Peter Gleeson 编译：周佳玉、丁慧、叶一、小鱼、钱天培今天文摘菌要教大家制作一张编程语言的关系网络图。如果不知道什么是关系网络图，可以点击下方链接先来看一下最终成果： http://programming-languages.herokuapp.com/#，我们可以在这里看到从过去到现在的250多种编程语言之间的“设计影响”的关系，下面是该演示的截图：接下来，就让我们一起来学做这个关系网络图吧！在当今的超连接世界，网络在现代生活中无处不在。举个栗子，文摘菌的周末这

03

「Python爬虫系列讲解」九、用 Selenium 爬取在线百科知识

前文回顾：「Python爬虫系列讲解」一、网络数据爬取概述「Python爬虫系列讲解」二、Python知识初学「Python爬虫系列讲解」三、正则表达式爬虫之牛刀小试「Python爬虫系列讲解」四、BeautifulSoup 技术「Python爬虫系列讲解」五、用 BeautifulSoup 爬取电影信息「Python爬虫系列讲解」六、Python 数据库知识「Python爬虫系列讲解」七、基于数据库存储的 BeautifulSoup 招聘爬取「Python爬虫系列讲解」八、Selenium 技术

02

LDAP 集成之 Dokuwiki 篇

说到百科，国际上最出名的莫过于 WikiPedia，而国内最出名的莫过于百度百科。当然，这两者也有一些差别。WikiPedia 支持多种语言，可以自由编辑，不过一般会要求提供必要的参考资料及链接来佐证。百度百科则只支持中文，对于编辑条目也有比较高的要求，一般来说是由专门的人员编写、审核。除了这两家之外，也有一些其他的大众百科，比如中国大百科、360 百科、搜狗百科等。大众百科的显著特点是范围非常广，适合大众科普，而想要查找一些太过详细的知识可能无法满足。

01

关于维基百科你不知道的十件事：

关于维基百科你不知道的十件事是专门让那些缺乏维基百科经验的人，如记者、新编辑者或新读者，能够对维基百科有一些较深入的认知。这些内容并不会带给那些已经很有经验的维基百科编辑者什么耳目一新的地方，但是我们希望它可以帮助世界上其他人对我们的工作能有更清楚的了解。

04

node.js写爬虫程序抓取维基百科（wikiSpider）

思路一（origin:master）：从维基百科的某个分类（比如：航空母舰（key））页面开始，找出链接的title属性中包含key（航空母舰）的所有目标，加入到待抓取队列中。这样，抓一个页面的代码及其图片的同时，也获取这个网页上所有与key相关的其它网页的地址，采取一个类广度优先遍历的算法来完成此任务。思路二（origin:cat）：按分类进行抓取。注意到，维基百科上，分类都以Category:开头，由于维基百科有很好的文档结构，很容易从任一个分类，开始，一直把其下的所有分类全都抓取下来。这个算法对分类页面，提取子分类，且并行抓取其下所有页面，速度快，可以把分类结构保存下来，但其实有很多的重复页面，不过这个可以后期写个脚本就能很容易的处理。

02

使用 Docker 搭建你的Wiki（MediaWiki）

本文使用「署名 4.0 国际 (CC BY 4.0)」许可协议，欢迎转载、或重新修改使用，但需要注明来源。署名 4.0 国际 (CC BY 4.0)

01

笨办法学 Python · 续练习 16：冒泡、快速和归并排序

你现在将尝试为你的DoubleLinkedList数据结构实现排序算法。对于这些描述，我将使用“数字列表”来表示随机的事物列表。这可能是一堆扑克牌，一张纸上的数字，名称列表或其他任何可以排序的东西。当你尝试排序数字列表时，通常有三个备选方案：

01

数据结构思维第六章树的遍历

本章将介绍一个 Web 搜索引擎，我们将在本书其余部分开发它。我描述了搜索引擎的元素，并介绍了第一个应用程序，一个从维基百科下载和解析页面的 Web 爬行器。本章还介绍了深度优先搜索的递归实现，以及迭代实现，它使用 JavaDeque实现“后入先出”的栈。

02

唱衰这么多年，PHP 仍然还是你大爷！

本文详细探讨了 PHP 在互联网中的广泛应用和重要性。文章通过大量的数据和事实来证明 PHP 仍然是最受欢迎的编程语言之一，占据了 77.2% 的市场份额，远超其他编程语言。

04

关于抓取维基百科,百度百科,Google News的记录

最近由于项目中需要抓取维基百科,百度百科,Google News的数据，做了些研究。维基百科开放性做的好，用强大的API支持查询，不过中文的API貌似是基于繁体的，而且中文的维基信息太少了，有些关键词没有对应的词条。于是目标转向百度百科。百度百科的词条确实很丰富，一般的关键词基本都有对应的词条。不过百度百科的词条对应的html页面的连接是这样的 baike.baidu.com/view/0000.html 。0000对应的是某个词条了。要想根据URL来获取就首先需要把关键词转换成对应的数字。通过httpwa

04

AI学者也用维基百科「打广告」？这个词条有点可疑

「遇事不决先谷歌」已经是现在很多人查找信息的标准起手了。如果搜索一个词条，百科网站的结果通常会被显示在最显眼的位置。这种人人皆可编辑的网站存储着海量信息，虽然可能不够严谨，但也被很多人作为重要的信息、知识来源。

01

如何用AI打造全能网页抓取工具？我的实战经验分享！

最近，我一直在研究网页抓取技术。鉴于人工智能领域的快速发展，我尝试构建一个 “通用” 的网页抓取工具，它可以在网页上迭代遍历，直到找到需要抓取的信息。这个项目目前还在开发中，这篇文章我将分享一下该项目目前的进展。

01

Wolfram 分析 | 根据维基百科数据，《鱿鱼游戏》在全球电视界占据主导地位

韩国新剧《鱿鱼游戏》风靡全球，成为全球爆款。其发行商 Netflix 宣布，“鱿鱼游戏正式拥有 1.11 亿粉丝——这是我们有史以来最大的系列发行！” 它在包括美国在内的 90 个不同国家/地区的排行榜上名列前茅，并被称为“口碑全球轰动”，在新闻和社交媒体中随处可见。

02

如何自己搞一个维基百科？

大家平时查询资料都喜欢用什么搜索工具呢？也许很多人都是百度吧，但是也有一部分小伙伴习惯使用维基百科~ 维基百科（Wikipedia），又称人民的百科全书，是来自世界各地的人民用不同的语言共同创建的百科全书。它基于wiki技术，强调自由、免费、内容开放，任何人都可以编辑百科全书中的任何条目。其宗旨是为全人类提供一个动态的、可自由访问和编辑的全球知识体。你可以把它看作是一个纯文科类的百度百科的升级国际版，毕竟人们常说：北冥有鱼，其名为鲲。鲲之大，不知其几千里也，错了错了，拿错台词了，应该是这句，维基百科，

02

全球访问量第5的网站，创始人身家才100万美元

本文介绍了维基百科创始人吉米·威尔斯的访谈记录和他的贡献，包括创立维基百科、Nupedia等，以及其作为全球访问量排名第5的网站的现状和运营方式。维基百科以“人类所有知识的集大成者”为目标，致力于提供高质量的、免费的知识查询服务。

资源 | Facebook开源DrQA的PyTorch实现：基于维基百科的问答系统

选自GitHub 机器之心编译参与：Panda 今年 4 月，斯坦福大学和 Facebook 人工智能研究所在 arXiv 发布了一个基于维基百科的开放域问题问答系统 DrQA。近日，Facebook 在 GitHub 上开源了这个系统的代码，FAIR 主管 Yann LeCun 在社交网络也为这次开源做了宣传。据悉，该研究也将出现在 7 月 30 日举行的 ACL 2017 大会上。论文地址：https://arxiv.org/abs/1704.00051 开源地址：https://github.co

05

Mediawiki 生成google sitemap

首先，看扩展： Extension:Google Sitemap 在扩展页面看到下面的说明： Note: Since MediaWiki 1.6, the MediaWiki core has a Google site map generator which may be more appropriate than this extension. It is a command-line utility, and it is located at maintenance/generateSitemap.p

08

2017前端开发手册四-前端开发人员应该掌握的Web技术

碰见过真正难相处的人，才知道身边的伙伴们多么值得珍惜。前端开发人员应掌握以下核心网络技术（考虑按此顺序学习）：统一资源定位器（又名URL）超文本传输协议（又称HTTP）超文本标记语言（又名HT

08

论文修改100遍也别慌！Meta发布全新写作语言模型PEER：参考文献都会加

---- 新智元报道编辑：LRS 【新智元导读】Meta最近放出全新写作语言模型PEER，完全模拟人类写作过程，从打草稿到重复编辑修改都帮你干了，还能解释修改原因！ 2020年5月至今，GPT-3发布近两年半的时间里，在其神奇的文本生成能力加持下，已经能够很好地辅助人类进行写作了。但GPT-3说到底也就是个文本生成模型，与人类的写作过程可以说是完全不同了。比如要写一篇论文或者作文，我们需要先在脑海里构造一个框架，查相关资料，打草稿，再找导师不断地修改、润色文字，期间可能还会修改思路，最终才可

02

维基百科背后，有场旷日持久的机器人编辑之战，开发者都不曾料到

王新民 | 编译自Gizmodo 维基百科上的人类编辑，经常由于修改意见的不同而产生冲突。一份英国的新研究表明，维基百科上的软件机器人之间，也有类似的在线冲突。 PLOS ONE上发表的一项新研究提到，维基百科的机器人经常修改和撤消对方的编辑。这些在线算法有着独特的指令和目标，多年来在内容修改上进行着毫无结果的 “战斗”。这项研究表明，即使在“愚蠢”的机器人之间，也能够产生复杂的交互行为，开发人员需要时刻关注着机器人的一举一动。这一发现不仅影响着维基百科页面的质量，也对人工智能的发展有深远影响，特别是在

业界 | OpenAI提出新型神经网络：自动计算词对象，实现实体消岐

选自OpenAI 作者：Jonathan Raiman 机器之心编译参与：许迪、黄小天本文通过让神经网络决策一个词是否属于 100 个自动发现的「类别」（非专属范畴）之一，从而建立了一个可以自动计算单词指称对象的神经网络。该方法在若干个实体消岐（entity disambiguation）数据集上实现了当前最优的提升。通过让神经网络决策一个词是否属于 100 个自动发现的「类别」（非专属范畴）之一，我们已建立一个神经网络，可以自动计算一个词所指称的对象。比如对于语句「猎物看到美洲虎（Jaguar）穿过

07

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭