腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
无法
使用
BeautifulSoup4
抓取
正确
的
维
基
(
初学者
)
、
、
、
、
一个完整
的
初学者
在这里…我试图从这个Wikipedia page刮成分表,但是刮下来
的
表是年度回报(第一个表),而不是我需要
的
成分表(第二个表)。有没有人可以帮我看看有没有什么方法可以
使用
BeautifulSoup4
来定位我想要
的
特定表?
浏览 8
提问于2020-04-12
得票数 1
回答已采纳
1
回答
在Wiki
的
网球桌上
使用
Rvest进行Web
抓取
、
、
我在这里,完全是一个R
的
初学者
,我正在努力学习更多关于rvest
的
知识和如何从网络上
抓取
。这是
维
基
页面(),下面是我想转移到R
的
表格。library(rvest) tennis <- read_html("https:
浏览 2
提问于2016-08-19
得票数 2
回答已采纳
1
回答
如何从Wiki中导出转储
、
、
我一直在研究如何
抓取
一些
维
基
(即和)来为自然语言处理创建纯文本语料库。1)为这些wikis配置MediawikiAPI,并将脚本与选项-search一起
使用
问题:我一次将10,000页
的</em
浏览 119
提问于2018-06-07
得票数 1
回答已采纳
2
回答
Python BeautifulSoup到csv
的
抓取
、
、
、
我正在尝试从一个html页面中
抓取
一些简单
的
字典信息。到目前为止,我能够在IDE上打印出我需要
的
所有单词。我
的
下一步是将单词转换为数组。我
的
最后一步是将数组另存为csv文件...当我运行我
的
代码时,它似乎在1309或1311字之后停止获取信息,尽管我相信网页上有100多万个。我被困住了,如果有任何帮助,我将非常感激。
浏览 0
提问于2016-04-17
得票数 4
1
回答
网络
抓取
只会对那些有网站的人造成伤害吗?
、
、
、
、
今天,我
使用
beautifulsoup4
抓取
了一个网站,并试图在该站点上获取大约16.000个数据。就在那之后
的
几分钟,那个网站就瘫痪了,几个小时都
无法
访问。所以..。我
的
问题是: 网络
抓取
只会对那些有网站的人造成伤害吗?
浏览 0
提问于2018-12-27
得票数 0
回答已采纳
2
回答
尝试将数据从网站加载到json文件中。
、
、
m=1" print(r.text)print(r.json)继续::import json“,s,err.value)到None json.decoder.JSONDecodeError: err.value:第1列(char 0)”程序完成“★★ 我只想在json文件中加载数据,然后在我<em
浏览 2
提问于2020-05-10
得票数 0
1
回答
Facebook分享错误
的
图片
、
我们在有新闻文章
的
网站上
使用
Facebook分享选项。该网站是建立与PHP和
使用
Smarty。我们生成一个唯一
的
URL (去掉了/news/headline-of- the -the-文章)并定义了meta属性。 当所有者与之前上传
的
图像共享链接时,一切都很好。当他上传一张新闻图片,将其插入到文章中并分享时,Facebook会拍摄另一张照片,这是它在源代码中最先找到
的
照片。尽管如此,在发布之前
的
预览框中,它会显示
正确
的</e
浏览 0
提问于2017-08-08
得票数 2
1
回答
U盘上
的
Ext2文件系统
、
、
我正在
使用
osdev wiki作为编写操作系统
的
资源。到目前为止,我已经有了一个两阶段
的
引导加载程序,带有一个非常小
的
32位保护模式内核。但是,对于bootloader,我一直在写入特定
的
扇区,并从特定
的
扇区读取数据,我决定以“
正确
的
方式”这样做,并
使用
文件系统,所以我选择了ext2文件系统,因为
维
基
上有关于它
的
文档。所以我用ext2格式化了我
的
闪存盘,在Ubun
浏览 3
提问于2012-03-31
得票数 1
回答已采纳
1
回答
FindAll("a")在漂亮
的
蟒蛇汤中
、
、
Python
的
新手,有人能解释一下findAll("a")在下面代码中
的
含义吗?我可以用其他字母代替它吗?像g,h,m?"a“
的
意思是在文章中找到”a“吗?:).)*$"))
的
意思是找到那些名字中有
维
基
的
链接?:).)*$")): print(link.attrs['href']) 谁能推荐一些好
的<
浏览 10
提问于2017-08-08
得票数 0
回答已采纳
2
回答
如何
抓取
和虚拟组合
维
基
文章?
、
、
、
、
因此,我们公司为不同部门提供了大量
的
内部
维
基站点,我正在寻找一种方法来统一它们。我们一直试图让每个人都
使用
相同
的
维
基
,但从来没有成功过,他们一直想要创建新
的
维
基
。作为另一种选择,我想做
的
是
抓取
每个wiki,并创建一个新
的
wiki,其中包含来自每个来源
的
综合信息
的
文章。 在实现方面,我研究了Nutch ()和()来进行网络爬行,并
使用</e
浏览 1
提问于2012-12-13
得票数 2
1
回答
Wikimedia Commons查询以获取类别中
的
子类别和照片
的
计数
、
、
我想查询一个
维
基
媒体共用类别,并在一个类别中获取子类别和照片
的
计数。例如,当您查看
维
基
共享中
的
网页"“时,您将得到子类别列表。其中一个子类别 如何查询
维
基
媒体公域以获取此类别和子类别的图像计数信息?在不
使用
html
抓取
的
情况下,我可以
使用</em
浏览 3
提问于2014-03-23
得票数 4
1
回答
使用
BeautifulSoup和请求打印xml文件中
的
数据
、
、
我试图
使用
BeautifulSoup4
和请求来
抓取
xml页面中
的
数据,但是我似乎
无法
打印结果。我没有收到错误,但没有打印数据。
浏览 0
提问于2018-05-12
得票数 1
回答已采纳
3
回答
如何从YouTube搜索中
抓取
视频?
、
我想搜索一个特定
的
关键字,然后
抓取
所有的视频网址。for link in links:如何
抓取
链接并将其保存到文件中
浏览 0
提问于2017-07-28
得票数 3
1
回答
如何在PC上运行Kivy Python程序?
、
、
我需要开发一个
使用
python在android上运行
的
程序。为此,我听说kivy是最好
的
模块。所以我试着在我
的
电脑上安装和运行kivy。我
的
是一台windows 7电脑。为了实现这一点,我做了以下工作: 然后
使用
win rar打开包,并将内容粘贴到python27 27/lib文件夹中。] [Python ] v2.7.4 (default, Apr 6 2013, 19:54:46) [MSC v.1500 32 bit (Intel)]
浏览 4
提问于2016-04-17
得票数 0
回答已采纳
3
回答
如何从bs4导入BeautifulSoup?
、
这段代码:不起作用,并给出以下错误: ^我该怎么做?
浏览 7
提问于2013-09-16
得票数 8
回答已采纳
3
回答
如何获取任何
维
基
页面的第一张图片
、
、
我需要获取任何给定wiki页面中
的
第一个图像/主图像。我可以
使用
抓取
工具来做这件事。但是我正在
使用
curl来删除页面。但可能是由于互联网连接速度慢,只删除一个
维
基
页面需要很长时间。除此之外,我需要显示至少7-8不同
的
维
基
图像在同一时间取决于用户
的
查询。 所以没有必要
使用
curl来完成这项工作。通常,此api返回
的
第一个图像不是您在页面顶部看到
的
主图像。有
浏览 0
提问于2012-04-20
得票数 2
回答已采纳
1
回答
Wiki引用API“批处理完成”
、
、
、
我正在研究freeCodeCamp
的
API挑战,第一个让我感到困惑,也就是因为我是个
初学者
。我
使用
wiki引号,我
的
终点是。function(data) { }} );输出到控制台,我相信我是在
正确
的
轨道上获得我想要
的
信息,但我想我
的
问题是,我如何选择引号?我怎么知道去哪里才能知道真正
的
浏览 2
提问于2017-11-21
得票数 0
回答已采纳
2
回答
用于跟踪样式格式设置
的
php
维
基
解析器
、
、
、
我正在为我
的
网站创建一个非常简单
的
内容管理系统,而不是
使用
超文本标记语言,我想插入
使用
的
相同类型
的
维
基
格式
的
内容。 你知道有什么开源
的
php脚本/类可以
抓取
和
使用
吗?注意:我并不是要创建一个
维
基站点。只是格式化方面-就像这个堆栈交换站点如何接受wiki标记并很好地呈现它。
浏览 0
提问于2011-09-23
得票数 2
回答已采纳
1
回答
从维基百科
的
API中获取一个表
、
、
、
我需要
使用
这个
维
基
页面中
的
表在python中创建一个数据库(尽管后面的部分是无关
的
自动柜员机)。我必须
使用
API (
无法
抓取
)来访问它。现在,我正在尝试这个页面中
的
API文档示例#2,这正是我想要做
的
,但它返回了一个错误,甚至运行我笔记本中
的
原始代码也返回了一个错误。有没有人能告诉我如何修改代码使其运行,或者指导我
使用
另一种方法来做同样
的
事情?谢谢。
浏览 2
提问于2019-12-08
得票数 0
1
回答
在MediaWiki
维
基
文本中-{ }-是什么意思?
在我
的
MediaWiki
维
基
中,任何包含-{ }-
的
wikitext都
无法
正确
解析。我需要一些分机吗?-{Computer}-
浏览 0
提问于2011-05-23
得票数 2
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券