腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
视频
沙龙
2
回答
元素树xml
、
、
我不明白为什么在尝试访问时间戳时会出现错误。XML格式(省略了一些属性): 编辑:这是xml文件的实际类型。 <mediawiki xmlns="http://www.mediawiki.org/xml/export-0.10/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.mediawiki.org/xml/export-0.10/ http://www.mediawiki.org/xml/export-0.10.xsd&
浏览 0
提问于2016-03-31
得票数 2
3
回答
如果参数为某些值,则从XML文件中提取数据。
、
、
我想以XML格式循环遍历Wikipedia转储,对于每个版本,如果修订是由某个用户名进行的,我希望保存时间戳和注释。这个是可能的吗?我正试着熟悉lxml。 <mediawiki xmlns="http://www.mediawiki.org/xml/export-0.10/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.mediawiki.org/xml/export-0.10/ http://www.mediawiki.o
浏览 5
提问于2016-03-31
得票数 2
回答已采纳
5
回答
如何使用Python解析Wikipedia XML转储?
、
、
我有: import xml.etree.ElementTree as ET def strip_tag_name(t): t = elem.tag idx = k = t.rfind("}") if idx != -1: t = t[idx + 1:] return t events = ("start", "end") title = None for event, elem in ET.iterparse('data/enwiki-20190620-pages-articl
浏览 60
提问于2019-07-04
得票数 6
回答已采纳
2
回答
MediaWiki:如何解析接口取回的descriptionmsg值?
、
通过http://en.wikipedia.org/w/api.php?action=query&meta=siteinfo&formatversion=2&format=json&siprop=extensions,您可以检索有关已安装的MediaWiki扩展的信息。https://www.mediawiki.org/wiki/API:Siteinfo中记录了结果格式,并指出对于每个扩展,descriptionmsg都包含一个系统消息名称。这不是描述本身,而是描述字符串的关键字。 我的问题是:我有来自descriptionmsg的密钥,现在如何获取描述字符串
浏览 26
提问于2020-03-21
得票数 0
回答已采纳
3
回答
从MediaWiki XML中提取页面标题和贡献者
、
、
、
、
我有一个非常大的(7 7GB) Wiki转储文件,其中包含对MediaWiki的每个页面所做的每个更改的记录。我正在尝试记录哪些用户对每个页面做出了贡献,因此我想从XML中提取出来。 XML看起来像这样: <mediawiki xmlns="http://www.mediawiki.org/xml/export-0.3/"> <page> <title>Unique Page title</title> <id>11</id> <restrictions>sysop</res
浏览 0
提问于2013-01-01
得票数 3
回答已采纳
2
回答
如何使用Python在类别维基百科页面的类别中刮取子类别和页面
、
、
、
因此,我试图在分类页的分类标题“类别:基于类的编程语言”下刮除所有的子类别和页面: 我已经想出了一种使用urls和mediawiki实现这一目标的方法: do。这样做的方法是: 碱基:en.wikipedia.org/w/api.php?action=query&list=categorymembers&cmtitle=Category:Class-based%20programming%20languages&format=json&cmlimit=500 碱基:en.wikipedia.org/w/api.php?action=query&
浏览 8
提问于2017-02-27
得票数 3
回答已采纳
3
回答
如何使用Python解析大型xml文件(正在进行)
、
、
、
我有一个巨大的xml文件(当前的)。这个xml的大小约为45 GB,代表了当前wikipedia的全部数据。文件的前几行是(更多的输出): <mediawiki xmlns="http://www.mediawiki.org/xml/export-0.8/" xmlns:xsi="http://ww w.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.mediawiki.org/x ml/export-0.8/ http://www.mediawi
浏览 6
提问于2013-04-08
得票数 0
回答已采纳
2
回答
如何查看GitHub存储库并知道要下载哪个版本的代码?
、
我是GitHub新手,也是开源世界的新手(来自.NET)。我有一个媒体wiki站点,希望安装Google分析扩展:http://www.mediawiki.org/wiki/Extension:Google_分析_集成。 扩展的文档说要从GitHub下载代码。 在GitHub回购中,有一些“评论”说的是主人,有些说的是分支。我想我想要的是主人而不是树枝。但是我如何选择下载哪一位大师呢?此外,文档还说,某些提交将被标记,但情况似乎并非如此。没有标记/文档,有什么简单的方法可以知道哪些提交是稳定的,哪些提交不是稳定的? 我喜欢一些关于如何在这样的项目中进行回购的一般智慧。
浏览 0
提问于2013-07-30
得票数 5
2
回答
如何使用curl发布文件的内容
、
、
、
、
我希望能够将文件的内容发布到MediaWiki站点。到目前为止,我可以这样做: curl --cookie wikiCookies.txt --negotiate -k -X POST -u:<username> -g 'https://<someWikiSite>/api.php?action=edit&title=TestPage&text=HelloWorld&token=<someToken>&format=json' 这很好,但由于url的长度,它有其局限性。 假设我有一个文件foo.txt,我如何才
浏览 1
提问于2013-11-16
得票数 2
回答已采纳
1
回答
如何使用mediawiki的page prop API获取维基数据相关内容
、
、
我看到了一些从维基百科页面获取维基数据条目的解决方案。通常,他们使用这个pageprop查询API: https://en.wikipedia.org/w/api.php?action=query&prop=pageprops&redirects=1&titles=LONDON 但是在我的小版本的媒体wiki中,当我执行相同的查询时,结果不包含任何wikidata id,即使页面是站点链接到wikidata项。 是否有需要运行的数据/脚本?可能的原因是什么? 其他信息: 我还发现,当我列出道具名称时,wikibase_item并不在那里。下面是来自维基百科的相同示例,它
浏览 0
提问于2019-04-15
得票数 4
1
回答
从字符串中删除BBcode
、
、
、
所以看起来这个问题在C++中的sun......except下的几乎每种语言中都被问到了。我有一个XML文档,它在text节点中存储了一些bbcode。我正在寻找最好的方法来删除它,我想我应该在这里检查一下,看看是否有人知道一些预建的库或一些有效的方法来完成这一点。我在考虑删除介于'‘和'’字符之间的任何内容,但是,使用提供给我的XML文档会让人抓狂,因为BB的许多实例都是'[[blahblahblah]]'和一些'[blahblahblah].'的形式 这是XML文档。<text>标签之间的所有数据都被添加到一个字符串中,有什么建议
浏览 0
提问于2012-11-24
得票数 0
回答已采纳
1
回答
试图搜索WikiNews
、
我试图搜索WikiNews,寻找特定的新闻报道和最新的头条新闻。我一直在阅读关于MediaWiki API ()的文章,但是它似乎并没有映射到我想要做的事情。 举两个例子,我需要能够得到最新的头条新闻(最好是针对特定的地区(美国、法国、英国等)和一个特定的话题(金融、体育、媒体等),但现在我会满足于仅仅得到最新的报道。我试过几件事: https://en.wikinews.org/w/api.php?action=query&prop=categories&clprop=timestamp&format=json只返回batchcomplete http://e
浏览 3
提问于2016-08-19
得票数 2
回答已采纳
1
回答
MediaWiki API - API调用url中的“opensearch”和“query”与“生成器”和“list”有什么区别?
、
、
、
、
我正在尝试为FreeCodeCamp上的一个项目使用mediawiki。我已经阅读了API文档上的这些页面: 目前还不清楚真正的区别是什么,以及何时以及为什么我需要使用每一种方法。下面是我所做的三个API调用,每个调用产生的结果略有不同: en.wikipedia.org/w/api.php?action=opensearch&search=Albert 在这里,我得到了一个包含4个条目的数组,第一个是搜索项,第二个是结果页面标题列表,第三个是每个页面的一个小片段,第四个是每个页面的URL。 en.wikipedia.org/w/api.
浏览 1
提问于2018-01-24
得票数 3
回答已采纳
1
回答
获取wikidata最旧和最新版本的时间戳
、
昨天,我问了一个关于如何获取"Kevin Kratz (Q939047)“的维基数据最早和最新的时间戳的问题,有人建议使用API沙箱来创建如下查询: 最早的时间戳:https://www.wikidata.org/w/api.php?action=query&format=json&list=allrevisions&titles=Kevin%20Kratz&arvprop=ids|timestamp|flags|comment|user&arvlimit=1&arvdir=newer 最新时间戳:https://www.wikidata
浏览 3
提问于2020-03-07
得票数 0
1
回答
双向数据同步
、
、
、
、
我有一个关于双向数据同步的查询。方案是,我们在PowerBuilder开发的本地网络上运行ERP软件,数据库是 software 16,还有我们的云软件是用net6开发的,数据库是Azure SQL。此外,我们还开发了一个基于.net的中间件,它与我们的API和本地数据库交互。在进行了像发票生成这样的操作之后,我们需要保证产品数量与本地DB和云DB一样准确。操作是否发生在云或本地网络中。请分享你的想法。
浏览 3
提问于2022-08-13
得票数 -1
回答已采纳
1
回答
从XML数据转储中提取Wikipedia数据
、
、
、
、
我一直在尝试从维基百科的一些转储中提取文本。我需要从id,标题,ns,时间戳,用户名,ip和文本标签中获得文本,在完整的历史英语维基百科转储。 我阅读并修改了中的代码。 我能够编写以下代码: import xml.etree.ElementTree as etree import codecs import csv import time import os PATH_WIKI_XML = '/home/wikipedia' FILENAME_WIKI = 'enwiki-latest-pages-meta-history1.xml-p24706p25444'
浏览 16
提问于2021-12-09
得票数 2
回答已采纳
1
回答
在Python中实现Wiki:“API:获取页面的内容”
、
、
我正在学习如何使用Wiki来获取用户的公共信息。我在MediaWiki中找到了一个脚本,它可以帮助我们获得一般信息,比如编辑计数或电子邮件地址。但是,用户页面上的个人描述不能以这种方式获取。 (下面是一个例子。我想得到这样的文本信息:“我在英语维基百科上通常不活跃,请参考.”) 我发现提供了一个实现这一目标的选择。因为我对PHP一无所知,我可以问一下,我们是否可以使用Python中的API获取这些文本内容? 谢谢你提前给我时间! 更新: 我试图搜索用户列表的用户信息,如下所示: 如果我想搜索他们的个人陈述,我们有什么办法可以立即执行,而不是一个一个地循环,然后输入到脚本中?(它来自
浏览 1
提问于2020-06-05
得票数 0
回答已采纳
1
回答
为单独的项目/产品内容页使用名称空间
我有很多应用程序,我想用MediaWiki编写产品手册材料。 我可以在myorganization.com中为每个应用程序安装一个wiki作为子域,例如myorganization.com和/或创建一个WikiFarm,每个站点都有自己的LocalSettings.php,但这似乎变得非常混乱,需要为每个产品手册维护多个配置和数据库。 名称空间似乎是一条道路,似乎在细粒度的安全性方面带来了好处,例如,为App1贡献内容的用户很可能无法为App2贡献内容。 这意味着在wiki.myorganization.com/wiki/中只安装一个以应用程序名称和页面标题为前缀的手动页面,例如wiki.my
浏览 2
提问于2020-12-18
得票数 0
2
回答
为Wordpress安装谷歌AppEngine插件后网站空白
、
、
昨天我花了大半个时间在Google AppEngine上安装我的第一个wordpress网站。该网站已成功部署,并通过我的自定义域生活到网络上。一切都很好,除了我不能搜索或上传插件。我启用了计费,还设置了云存储和云sql。 我在本地环境中使用appengine、memcache和batcache插件进行了更新。我能够在实时站点的plugins文件夹中看到它们。然后,我尝试启用appengine插件,但我的网站显示为空白。 我在顶部栏中看到了url,但页面本身是完全空白的。
浏览 3
提问于2013-11-18
得票数 0
2
回答
理解GCP,re:发送的“所需操作”电子邮件
、
、
、
我使用Firebase作为我的网络应用程序,而不是Google平台--尽管我知道在幕后,每个Firebase项目也是一个GCP项目。 我刚收到GCP的一封电子邮件说(节选): 需要的操作:在2020年4月20日前为您的项目启用Cloud,以确保构建和正确部署云功能.您必须为您的项目启用Cloud,以确保您的云功能被正确构建和部署。一旦启用了API,如果云构建、容器注册表或云存储使用率超过了这些产品的免费级别限制,则可能会产生费用。 是否会影响Firebase的部署或开发过程?(例如,我现在使用firebase deploy ) 据我所知,答案是否定的--它只允许每天最大的构建时间。但是这封电
浏览 1
提问于2020-02-24
得票数 9
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Netflix发布DBLog:一款通用的变化数据捕获框架
Slack的Service Worker实践:更快的启动速度与离线支持
2022#Power BI 12月产品功能更新
Slack的Service Worker实践:更快的启动速度与离线支持
Java并发编程之原子变量
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券