腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(1603)
视频
沙龙
1
回答
HTTPError
:
服务
暂时
不可用
(
维基百科
数据
转
储
的
多线程
下载
)
、
当我尝试
下载
维基百科
数据
转
储
时,我经常收到这个错误。是不是因为我
下载
文件
的
请求太多了?我使用
的
线程数是100。File "D:\Users\Jonathan\Anaconda3\lib\urllib\request.py", line 650, in http_error_default
HTTP
浏览 24
提问于2019-03-16
得票数 1
回答已采纳
3
回答
来自
维基百科
的
页面列表
、
、
我建立了一个应用程序,让你选择你喜欢
的
主题,这些主题应该在
数据
库中。 有数百万个“赞”!(披萨,PHP,曼彻斯特联队,任何电影..我不知道),所以我决定将这些“赞”插入到我
的
维基百科
数据
库中。
浏览 3
提问于2010-12-09
得票数 1
回答已采纳
1
回答
如何将
维基百科
的
所有用户导出到本地主机?
、
、
、
、
我想出口 使用导入xml
浏览 6
提问于2015-06-01
得票数 0
2
回答
我是否需要使用JWPL
的
数据
库配置?
、
、
、
要实例化
维基百科
对象,我需要一个DatabaseConfiguration。请看下面的代码。我需要做
的
是用API获取一个单词
的
类别,这不是一种使用它
的
方式吗:没有
数据
库连接?
浏览 2
提问于2014-12-19
得票数 0
回答已采纳
2
回答
如何获取所有
维基百科
文章
的
标题列表
、
、
、
我想要一份所有
维基百科
文章标题
的
清单。我知道从维基媒体上获取内容有两种可能
的
方法。一个是API,另一个是
数据
库
转
储
。 我不想
下载
维基
转
储
。首先,它是巨大
的
,第二,我没有真正
的
经验查询
数据
库。另一方面,API
的
问题是,我无法找到一种方法只检索文章标题
的
列表,即使它需要>4 mio请求,这可能会使我被任何进一步
的
请求阻止。所以
浏览 2
提问于2014-06-29
得票数 35
回答已采纳
3
回答
如何
下载
维基百科
图片
转
储
、
、
、
、
我正在尝试制作离线版本
的
维基百科
。但问题是我无法
下载
维基百科
的
图片
转
储
。他们所提供
的
都是只有元图像信息
的
SQL,任何地方都没有动作图像。 另外,我正在使用
维基百科
在本地
服务
器上运行
维基百科
。任何帮助如何
下载
图像或是否有其他方法
下载
图像/内容在本地。
浏览 16
提问于2018-04-09
得票数 1
2
回答
Wikipedia
转
储
文件上
的
函数
我们可以使用Wikipedia API中
的
functions从Wikipedia中获取一些结果。.** 我
的
问题是,如何将Wikipedia API函数用于特定版本
的
维基百科
(例如,仅
维基百科
2017)?!!
浏览 0
提问于2020-04-11
得票数 0
1
回答
在给定距离
的
位置用SOLR索引wikipedia文章
、
、
、
、
在Solr
服务
器中索引Wikipedia文章(其中包含Geo locations lon/lat)
的
最佳方法是什么?例如,我有一个给定
的
lon/lat位置,并希望在60公里
的
距离内索引所有
维基百科
的
文章。 我可以
下载
整个Wikipedia
转
储
并编写一个应用程序,该应用程序试图在给定
的
距离内获取xml中
的
所有
数据
。但
转
储
容量约为
浏览 1
提问于2015-02-16
得票数 0
回答已采纳
1
回答
访问
维基百科
中
的
传记标题
、
我已经
下载
了
维基百科
的
最新
转
储
,并将其解析为MySQL
数据
库。现在我有了
数据
库表,其中只包含标题和content.My
的
要求是从这个table.So提取所有传记内容,我想要一个
转
储
文件,其中有所有传记标题。提前感谢
浏览 3
提问于2012-04-03
得票数 0
回答已采纳
1
回答
使用维基
数据
工具包提取不同语言
的
相关文章
、
、
、
、
我正在尝试从维基
数据
转
储
中提取与中介语相关
的
文章。在互联网上搜索后,我发现有一个名为
的
工具可以帮助处理这些类型
的
数据
。但是没有关于如何找到不同语言
的
相关文章
的
信息。例如,英语中
的
文章:与意大利语中
的
文章:相关。我
的
意思是第二个是第一个
的
翻译版本。我试着使用这个工具包,但我找不到任何解决方案。请写一些关于如何找到这篇相关文章
的
例子。
浏览 12
提问于2018-01-23
得票数 1
2
回答
如何在
维基百科
转
储
中查找信息
、
我将道歉,因为我是SQL
的
新手。 我想避免爬取
维基百科
,所以我开始寻找其他
的
方法。DBPedia似乎是一个可行
的
解决方案,但在寻找了一个小时后,我又回到了
维基百科
的
转
储
上。我
的
问题是如何在
转
储
中找到我想要
的
东西?我需要哪些
转
储
来查找特定
的
信息?那里有很多
转
储
,它们对结构
的
不同
浏览 1
提问于2012-08-24
得票数 0
回答已采纳
3
回答
[SPARQL/DBPedia]我可以从结果中获取德语wikipedia-URL吗?
、
、
有人能帮我找到德语
维基百科
文章
的
链接吗?SELECT ?film有没有像dbpedia:wikipage-de这样
的
选项可以显示
维基百科
的
德语站点所有结果都只有一个前缀,如foaf:page和名为: http
的
内容
浏览 2
提问于2010-12-23
得票数 2
回答已采纳
1
回答
导出
维基百科
翻译
的
标题
的
简单方法
是否有一种简单
的
方法可以导出
维基百科
的
翻译标题,以获得这样
的
设置:我试着从上得到一个,但是只有不到25000个翻译。例如,人们可以看到到英语wiki
的
链接,但
转
储
中没有链接[[en:Yandex]]。 也许我应该尝试解析英语
维基百科
,但我相信有一个更好
的
解决方案。UPD:链接到@svick
的
解决方案
数据
:语言代码wiki
浏览 2
提问于2014-01-08
得票数 4
回答已采纳
3
回答
维基百科
:跨多种语言
的
页面
、
、
、
我想在我
的
项目中使用
维基百科
转
储
。以下是我
的
项目所需
的
信息。 谢谢Bala
浏览 3
提问于2010-09-13
得票数 2
回答已采纳
1
回答
SpaCy模型训练
数据
: WikiNER
、
、
、
对于2.0版本
的
xx_ent_wiki_sm模型,提到了"WikiNER“
数据
集,这导致了一篇文章”从
维基百科
学习多语言命名实体识别“。 是否有任何资源可以
下载
这些
数据
集以重新培训该模型?还是
维基百科
转
储
处理
的
脚本?
浏览 5
提问于2017-10-02
得票数 4
回答已采纳
2
回答
多
数据
流
维基百科
转
储
、
、
、
、
我
下载
了德语
维基百科
转
储
dewiki-20151102-pages-articles-multistream.xml.我
的
简短问题是:在这种情况下,“多
数据
流”是什么意思?
浏览 6
提问于2015-11-11
得票数 18
1
回答
如何使用谷歌
的
BigQuery查询
维基百科
全文
转
储
、
、
、
我正在测试谷歌应用程序接口中
的
BigQuery,想在
维基百科
上运行一些查询全文
转
储
。谷歌样本
数据
不包括全文
转
储
(只包括修订历史)。
维基百科
转
储
的
来源很少,比如亚马逊上
的
这个: 我
的
问题是:有没有一种方法可以查询这些
数据
集而不将它们传输到谷歌BigQuery项目?等同地,BigQuery有一种方法可以直接与这些
数据
集之一通信吗?如
浏览 4
提问于2013-01-15
得票数 1
回答已采纳
7
回答
维基百科
文本
下载
、
、
、
我希望为我
的
大学项目
下载
完整
的
维基百科
文本。我是否必须编写自己
的
爬行器才能
下载
它,或者
维基百科
的
公共
数据
集可以在线获得? 为了给你一些我
的
项目的概述,我想找出我感兴趣
的
几篇文章中
的
有趣
的
单词。但是为了找到这些有趣
的
单词,我计划使用tf/idf来计算每个单词
的
词频,并挑选频率较高
的
单词。但要计算tf,我
浏览 8
提问于2010-04-21
得票数 27
回答已采纳
1
回答
如何弥合
维基百科
数据
库
转
储
和GATE之间
的
鸿沟?
、
、
总体任务是在
维基百科
页面上做NLP。有没有一些库来解决这个问题呢?
浏览 2
提问于2012-10-10
得票数 1
2
回答
扩展完整
维基百科
转
储
的
wikitexts
的
最好方法是什么?
、
、
然而,文章
的
内容是用wikitext编写
的
,它有一个模板系统。要从这些
转
储
中提取干净
的
全文,有必要展开这些模板。
维基百科
这样做,但它不适合扩展整个
转
储
。解决这个问题
的
另一种方法是在计算机上运行Wikimedia,并使用API:Expandtemplates,但这似乎是一个相当麻烦
的
解决方案。最后,HTML
转
储
也存在,但我更喜欢使用扩展
的
wikitexts,因为它可
浏览 37
提问于2021-03-11
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
维基百科中的数据科学:亲自教你阅读世界上最大的Python百科全书
为XBox开发者提供的ASan早期发布版本
微软 Win11 Dev 预览版 25276 发布,应用兼容对话框 UI 改进
如何使用Photon高效率提取网站数据
看IPFS+Filecoin是如何构建未来的星际互联网?
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
即时通信 IM
活动推荐
运营活动
广告
关闭
领券