Mediawiki API:获取每个页面类别的最新更改，或者仅获取某个类别中的最新更改条目 - 腾讯云开发者社区

、、

我不明白为什么在尝试访问时间戳时会出现错误。XML格式(省略了一些属性)：编辑:这是xml文件的实际类型。 <mediawiki xmlns="http://www.mediawiki.org/xml/export-0.10/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.mediawiki.org/xml/export-0.10/ http://www.mediawiki.org/xml/export-0.10.xsd&

浏览 0提问于2016-03-31得票数 2

3回答

如果参数为某些值，则从XML文件中提取数据。

、、

我想以XML格式循环遍历Wikipedia转储，对于每个版本，如果修订是由某个用户名进行的，我希望保存时间戳和注释。这个是可能的吗？我正试着熟悉lxml。 <mediawiki xmlns="http://www.mediawiki.org/xml/export-0.10/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.mediawiki.org/xml/export-0.10/ http://www.mediawiki.o

浏览 5提问于2016-03-31得票数 2

回答已采纳

5回答

如何使用Python解析Wikipedia XML转储？

、、

我有： import xml.etree.ElementTree as ET def strip_tag_name(t): t = elem.tag idx = k = t.rfind("}") if idx != -1: t = t[idx + 1:] return t events = ("start", "end") title = None for event, elem in ET.iterparse('data/enwiki-20190620-pages-articl

浏览 60提问于2019-07-04得票数 6

回答已采纳

2回答

MediaWiki:如何解析接口取回的descriptionmsg值？

、

通过http://en.wikipedia.org/w/api.php?action=query&meta=siteinfo&formatversion=2&format=json&siprop=extensions，您可以检索有关已安装的MediaWiki扩展的信息。https://www.mediawiki.org/wiki/API:Siteinfo中记录了结果格式，并指出对于每个扩展，descriptionmsg都包含一个系统消息名称。这不是描述本身，而是描述字符串的关键字。我的问题是:我有来自descriptionmsg的密钥，现在如何获取描述字符串

浏览 26提问于2020-03-21得票数 0

回答已采纳

3回答

从MediaWiki XML中提取页面标题和贡献者

、、、、

我有一个非常大的(7 7GB) Wiki转储文件，其中包含对MediaWiki的每个页面所做的每个更改的记录。我正在尝试记录哪些用户对每个页面做出了贡献，因此我想从XML中提取出来。 XML看起来像这样： <mediawiki xmlns="http://www.mediawiki.org/xml/export-0.3/"> <page> <title>Unique Page title</title> <id>11</id> <restrictions>sysop</res

浏览 0提问于2013-01-01得票数 3

回答已采纳

2回答

如何使用Python在类别维基百科页面的类别中刮取子类别和页面

、、、

因此，我试图在分类页的分类标题“类别:基于类的编程语言”下刮除所有的子类别和页面：我已经想出了一种使用urls和mediawiki实现这一目标的方法: do。这样做的方法是：碱基：en.wikipedia.org/w/api.php?action=query&list=categorymembers&cmtitle=Category:Class-based%20programming%20languages&format=json&cmlimit=500 碱基：en.wikipedia.org/w/api.php?action=query&

浏览 8提问于2017-02-27得票数 3

回答已采纳

3回答

如何使用Python解析大型xml文件(正在进行)

、、、

我有一个巨大的xml文件(当前的)。这个xml的大小约为45 GB，代表了当前wikipedia的全部数据。文件的前几行是(更多的输出)： <mediawiki xmlns="http://www.mediawiki.org/xml/export-0.8/" xmlns:xsi="http://ww w.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.mediawiki.org/x ml/export-0.8/ http://www.mediawi

浏览 6提问于2013-04-08得票数 0

回答已采纳

2回答

如何查看GitHub存储库并知道要下载哪个版本的代码？

、

我是GitHub新手，也是开源世界的新手(来自.NET)。我有一个媒体wiki站点，希望安装Google分析扩展：http://www.mediawiki.org/wiki/Extension:Google_分析_集成。扩展的文档说要从GitHub下载代码。在GitHub回购中，有一些“评论”说的是主人，有些说的是分支。我想我想要的是主人而不是树枝。但是我如何选择下载哪一位大师呢？此外，文档还说，某些提交将被标记，但情况似乎并非如此。没有标记/文档，有什么简单的方法可以知道哪些提交是稳定的，哪些提交不是稳定的？我喜欢一些关于如何在这样的项目中进行回购的一般智慧。

浏览 0提问于2013-07-30得票数 5

2回答

如何使用curl发布文件的内容

、、、、

我希望能够将文件的内容发布到MediaWiki站点。到目前为止，我可以这样做： curl --cookie wikiCookies.txt --negotiate -k -X POST -u:<username> -g 'https://<someWikiSite>/api.php?action=edit&title=TestPage&text=HelloWorld&token=<someToken>&format=json' 这很好，但由于url的长度，它有其局限性。假设我有一个文件foo.txt，我如何才

浏览 1提问于2013-11-16得票数 2

回答已采纳

1回答

如何使用mediawiki的page prop API获取维基数据相关内容

、、

我看到了一些从维基百科页面获取维基数据条目的解决方案。通常，他们使用这个pageprop查询API： https://en.wikipedia.org/w/api.php?action=query&prop=pageprops&redirects=1&titles=LONDON 但是在我的小版本的媒体wiki中，当我执行相同的查询时，结果不包含任何wikidata id，即使页面是站点链接到wikidata项。是否有需要运行的数据/脚本？可能的原因是什么？其他信息：我还发现，当我列出道具名称时，wikibase_item并不在那里。下面是来自维基百科的相同示例，它

浏览 0提问于2019-04-15得票数 4

1回答

从字符串中删除BBcode

、、、

所以看起来这个问题在C++中的sun......except下的几乎每种语言中都被问到了。我有一个XML文档，它在text节点中存储了一些bbcode。我正在寻找最好的方法来删除它，我想我应该在这里检查一下，看看是否有人知道一些预建的库或一些有效的方法来完成这一点。我在考虑删除介于'‘和'’字符之间的任何内容，但是，使用提供给我的XML文档会让人抓狂，因为BB的许多实例都是'[[blahblahblah]]'和一些'[blahblahblah].'的形式这是XML文档。<text>标签之间的所有数据都被添加到一个字符串中，有什么建议

浏览 0提问于2012-11-24得票数 0

回答已采纳

1回答

试图搜索WikiNews

、

我试图搜索WikiNews，寻找特定的新闻报道和最新的头条新闻。我一直在阅读关于MediaWiki API ()的文章，但是它似乎并没有映射到我想要做的事情。举两个例子，我需要能够得到最新的头条新闻(最好是针对特定的地区(美国、法国、英国等)和一个特定的话题(金融、体育、媒体等)，但现在我会满足于仅仅得到最新的报道。我试过几件事： https://en.wikinews.org/w/api.php?action=query&prop=categories&clprop=timestamp&format=json只返回batchcomplete http://e

浏览 3提问于2016-08-19得票数 2

回答已采纳

1回答

MediaWiki API - API调用url中的“opensearch”和“query”与“生成器”和“list”有什么区别？

、、、、

我正在尝试为FreeCodeCamp上的一个项目使用mediawiki。我已经阅读了API文档上的这些页面：目前还不清楚真正的区别是什么，以及何时以及为什么我需要使用每一种方法。下面是我所做的三个API调用，每个调用产生的结果略有不同： en.wikipedia.org/w/api.php?action=opensearch&search=Albert 在这里，我得到了一个包含4个条目的数组，第一个是搜索项，第二个是结果页面标题列表，第三个是每个页面的一个小片段，第四个是每个页面的URL。 en.wikipedia.org/w/api.

浏览 1提问于2018-01-24得票数 3

回答已采纳

1回答

获取wikidata最旧和最新版本的时间戳

、

昨天，我问了一个关于如何获取"Kevin Kratz (Q939047)“的维基数据最早和最新的时间戳的问题，有人建议使用API沙箱来创建如下查询：最早的时间戳：https://www.wikidata.org/w/api.php?action=query&format=json&list=allrevisions&titles=Kevin%20Kratz&arvprop=ids|timestamp|flags|comment|user&arvlimit=1&arvdir=newer 最新时间戳：https://www.wikidata

浏览 3提问于2020-03-07得票数 0

1回答

双向数据同步

、、、、

我有一个关于双向数据同步的查询。方案是，我们在PowerBuilder开发的本地网络上运行ERP软件，数据库是 software 16，还有我们的云软件是用net6开发的，数据库是Azure SQL。此外，我们还开发了一个基于.net的中间件，它与我们的API和本地数据库交互。在进行了像发票生成这样的操作之后，我们需要保证产品数量与本地DB和云DB一样准确。操作是否发生在云或本地网络中。请分享你的想法。

浏览 3提问于2022-08-13得票数 -1

回答已采纳

1回答

从XML数据转储中提取Wikipedia数据

、、、、

我一直在尝试从维基百科的一些转储中提取文本。我需要从id，标题，ns，时间戳，用户名，ip和文本标签中获得文本，在完整的历史英语维基百科转储。我阅读并修改了中的代码。我能够编写以下代码： import xml.etree.ElementTree as etree import codecs import csv import time import os PATH_WIKI_XML = '/home/wikipedia' FILENAME_WIKI = 'enwiki-latest-pages-meta-history1.xml-p24706p25444'

浏览 16提问于2021-12-09得票数 2

回答已采纳

1回答

在Python中实现Wiki：“API:获取页面的内容”

、、

我正在学习如何使用Wiki来获取用户的公共信息。我在MediaWiki中找到了一个脚本，它可以帮助我们获得一般信息，比如编辑计数或电子邮件地址。但是，用户页面上的个人描述不能以这种方式获取。 (下面是一个例子。我想得到这样的文本信息：“我在英语维基百科上通常不活跃，请参考.”) 我发现提供了一个实现这一目标的选择。因为我对PHP一无所知，我可以问一下，我们是否可以使用Python中的API获取这些文本内容？谢谢你提前给我时间！更新：我试图搜索用户列表的用户信息，如下所示：如果我想搜索他们的个人陈述，我们有什么办法可以立即执行，而不是一个一个地循环，然后输入到脚本中？(它来自

浏览 1提问于2020-06-05得票数 0

回答已采纳

1回答

为单独的项目/产品内容页使用名称空间

我有很多应用程序，我想用MediaWiki编写产品手册材料。我可以在myorganization.com中为每个应用程序安装一个wiki作为子域，例如myorganization.com和/或创建一个WikiFarm，每个站点都有自己的LocalSettings.php，但这似乎变得非常混乱，需要为每个产品手册维护多个配置和数据库。名称空间似乎是一条道路，似乎在细粒度的安全性方面带来了好处，例如，为App1贡献内容的用户很可能无法为App2贡献内容。这意味着在wiki.myorganization.com/wiki/中只安装一个以应用程序名称和页面标题为前缀的手动页面，例如wiki.my

浏览 2提问于2020-12-18得票数 0

2回答

为Wordpress安装谷歌AppEngine插件后网站空白

、、

昨天我花了大半个时间在Google AppEngine上安装我的第一个wordpress网站。该网站已成功部署，并通过我的自定义域生活到网络上。一切都很好，除了我不能搜索或上传插件。我启用了计费，还设置了云存储和云sql。我在本地环境中使用appengine、memcache和batcache插件进行了更新。我能够在实时站点的plugins文件夹中看到它们。然后，我尝试启用appengine插件，但我的网站显示为空白。我在顶部栏中看到了url，但页面本身是完全空白的。

浏览 3提问于2013-11-18得票数 0

2回答

理解GCP，re:发送的“所需操作”电子邮件

、、、

我使用Firebase作为我的网络应用程序，而不是Google平台--尽管我知道在幕后，每个Firebase项目也是一个GCP项目。我刚收到GCP的一封电子邮件说(节选)：需要的操作:在2020年4月20日前为您的项目启用Cloud，以确保构建和正确部署云功能.您必须为您的项目启用Cloud，以确保您的云功能被正确构建和部署。一旦启用了API，如果云构建、容器注册表或云存储使用率超过了这些产品的免费级别限制，则可能会产生费用。是否会影响Firebase的部署或开发过程？(例如，我现在使用firebase deploy ) 据我所知，答案是否定的--它只允许每天最大的构建时间。但是这封电

浏览 1提问于2020-02-24得票数 9