寻求帮助以便做出明确的决定。几个月以来,我一直在寻找一个Java,它可以帮助我访问Wikipedia并获取文章的内容。我的项目是构建给定域概念的分类。详细信息:
我的问题是,对于第二步,我不能作出明确的决定。
如果你已经在这个意义上做了什么,请给我你的观点。我进行了认真的调查,发现了以下链接:
如有任何建议,我将不胜感激。
发布于 2011-12-05 21:17:55
我在做硕士论文的时候也做了类似的事情。我没有方便的代码,但我想我编写了一个独立的python库(使用python请求)来获取维基百科页面。
我记得偶尔也会有例外。我的解决方案是派生一个线程来执行获取,如果该线程不活动,则使用当前术语重新启动提取进程。连接速度不重要,维基百科页面并不大。我觉得维基百科的API没有多大帮助。编写一个python或ruby脚本来抓取维基百科是很简单的事情。
https://stackoverflow.com/questions/8350155
复制相似问题