腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
如何
创建
从
维基百科
表格
的
列
中
抓取
数据
的
循环
?
、
、
在Python2.7上使用BeautifulSoup从一个
维基百科
中
抓取
数据
时,我现在陷入了一个
循环
。以下是我
的
代码正在进行
的
工作:from bs4 import BeautifulSoup import requestshelp in creating a loop that will append the 'tickers' variable with
浏览 1
提问于2017-07-24
得票数 0
回答已采纳
1
回答
ImportXML解析错误-使用excel工作表
抓取
维基百科
、
、
、
、
我正在尝试使用ImportXML公式
从
维基百科
网站收集一些
数据
到excel
表格
中
。这是
维基百科
的
页面。 这是我
从
浏览器XPath选择器
中
获得
的
代码。在我做错
的
地方能帮我吗?
浏览 12
提问于2019-11-10
得票数 1
回答已采纳
1
回答
如何
将最优惠产出转化为表
、
、
、
全新
的
R,所以我会尽我最大
的
努力来解释这一点。我一直在玩
数据
抓取
使用"rvest“包。在这个例子
中
,我
从
维基百科
上
的
一个
表格
中
抓取
了美国
的
州人口。我使用
的
代码是:statepop = read_html("https://en.wikipedia.org/wiki/List
浏览 6
提问于2017-02-17
得票数 0
2
回答
在Python
中
Web
抓取
时
从
表
中
删除图像
、
我正试着
从
维基百科
的
一个
表格
中
抓取
数据
。虽然我已经知道
如何
从
表上
的
大多数列
中
抓取
数据
,但有一
列
我在
抓取
时遇到了困难,因为
列
中有"span“标记和"a”标记。具体来说,如果您引用本页"Active Code“部分下
的
表:,您将看到第五
列
包含一个国家
浏览 1
提问于2017-10-13
得票数 0
回答已采纳
1
回答
从
R
中
的
维基百科
抓取
表格
、
、
我想知道是否有人有有用
的
想法或代码来
从
维基百科
上
抓取
表格
。 具体来说,我对
维基百科
上“各县选举结果”部分
的
总统选举结果表很感兴趣。可以使用以下链接找到示例表,并向下滚动到“按县列出
的
结果”部分:https://en.wikipedia.org/wiki/1948_United_States_presidential_election_in_Texas
表格
如下所示: ? 我尝试了以下StackO
浏览 51
提问于2021-06-29
得票数 0
回答已采纳
1
回答
使用Htmlagilitypack
从
维基百科
中
抓取
数据
、
、
、
我试图
从
维基百科
网站上
的
一个
表格
中
抓取
数据
,到目前为止,我已经找到了我需要参考
的
节点。
维基百科
上
的
表格
中有很多条目,然而,当我运行这个应用程序时,我只得到了12个结果,它们都是相同
的
。返回
的
所有结果都是表
中
第一个条目的副本。 对
如何
修复有什么想法吗?
浏览 5
提问于2015-02-05
得票数 0
回答已采纳
3
回答
有没有过滤
维基百科
表格
的
方法?
、
、
我正在寻找一种方法来过滤经常出现在
维基百科
文章
中
的
表格
,所以我只能比较我感兴趣
的
行(和
列
)。
维基百科
引擎中一个我不知道
的
内置特性按
列
值过滤多级排序
浏览 0
提问于2014-08-07
得票数 19
2
回答
如果表
中
的
日期不是存在于表
中
的
零值,我们可以在SQL中生成自动日期吗?
、
我有一个名为final_registration
的
表,我在其中存储注册
数据
,以下是我
的
表:| 1 | 2018-12-03 |但我不想这样,我想从查询
中
获得以下输出| 2018-12-03 |*----------
浏览 1
提问于2018-12-04
得票数 0
1
回答
我在
数据
清理方面有一些问题
、
、
、
我已经
从
维基百科
页面上
抓取
了一个
表格
,接下来我将清理
数据
。我已经将
数据
转换为Pandas格式,现在我在清理
数据
时遇到一些问题import requestswebsite_url("Not assigned",axis=0) 但它显示:“‘未赋值’在轴
中
找不到
浏览 2
提问于2019-04-08
得票数 0
1
回答
频率分析
、
我已经开始研究冷冻术,最明显
的
出发点是频率分析。作为我自己
的
一项任务,我认为最好是编写一个脚本,用于执行频率分析
的
过程。我开始研究
的
一件事是,根据一本字典得到
数据
--后来我发现这是不正确
的
,而且可以
从
文学
中
得到更好
的
数字。所以我
的
问题是..。是否有任何可用于此目的
的
开放源码文献
的
建议?MHibbin
浏览 0
提问于2014-02-18
得票数 0
回答已采纳
1
回答
在R
中
这个For
循环
有问题吗?
我尝试在R中使用这个For
循环
创建
一个
从
电子
表格
中
的
7
列
接收
数据
的
DB,但它不起作用。data.frame(a=a, b=b)} 'a‘表示
创建
从
电子
表格
的
第一
列
接收
数据</e
浏览 0
提问于2019-02-19
得票数 0
1
回答
是否
从
Word文档
中
获取列表编号?
、
、
我
从
每个页面上每个
表格
的
第一
列
的
每个单元格
中
抓取
所有文本。然而,我遇到
的
问题是,当我获得文本时,它不包括列表编号。例如,我
的
表格
中
的
文本如下所示: 我
的
程序遍历文档并从第一
列
中
的
每个单元格获取文本。然而,我得到
的
不是"1.介绍“,而是”介绍“。下面是我得到
的
<
浏览 0
提问于2013-07-23
得票数 3
回答已采纳
1
回答
将大量
维基百科
表刮到MySQL
数据
库
的
最佳方法
、
、
、
什么是
抓取
维基百科
主要文章页面中所有HTML
表格
的
最佳编程方法,其中页面标题与某些关键字匹配?然后,我想把列名和表
数据
放到
数据
库
中
。 还会获取URL和页面名称以进行属性设置。我不需要细节,只需要一些推荐
的
方法或者一些教程
的
链接。
浏览 8
提问于2013-07-31
得票数 0
2
回答
抓取
器刮不出页面。
、
、
我正在使用Rcrawler提取
维基百科
页面的信息框。我有一个音乐家
的
名单,我想提取他们
的
名字,道布,死亡日期,乐器,标签等。然后我想
创建
一个所有艺术家
的
数据
作为行和
数据
存储为
列
/向量。当我单独使用rvest时,代码中使用
的
xpath是有效
的
。 我
的
密码怎么了?
浏览 2
提问于2018-07-31
得票数 1
回答已采纳
1
回答
谷歌电子
表格
-
如何
从
维基百科
导入特定
的
表格
?
、
、
、
Wikipedia导入一个表:这是
维基百科
页面的第六张
表格
,它是英超联赛(足球)
的
“结果表”。它很好地将
数据
导入到21行x21
列
矩阵
中
。 但有时,人们会在
维基百科
的
页面
中
添加新
浏览 0
提问于2020-12-22
得票数 0
回答已采纳
1
回答
从
openRefine上
的
单词列表
中
获取网址
我在第1
列
中有一个组织列表(带空格
的
字符串,例如联合国),并希望使用第1
列
的
值作为搜索字符串,使用相关
的
URL(例如www.un.org/)填充第二
列
。这将是一种碰碰撞撞
的
方法,但它胜过手动编辑。谢谢!
浏览 2
提问于2017-03-01
得票数 1
3
回答
如何
在python
中
迭代跳过TypeError,AttributeError和IndexError?
、
、
我试图使用BeautifulSoup
从
维基百科
的
表格
中
抓取
信息。现在我被堆叠了,因为我不能
循环
通过一个对象。
浏览 0
提问于2014-10-18
得票数 2
1
回答
使用python
从
维基百科
中
刮表?
、
、
、
我试着
从
维基百科
的
页面上
抓取
表格
数据
:,我试过使用pd.read_html语法,但它不适用于我试图刮
的
表(尼泊尔按地区分列
的
新冠肺炎确诊病例)。我试着用“美丽汤”和“熊猫”来收集
数据
,但是它不起作用 url = 'https://en.wikipedia.org/wiki/2020_coronavirus_pandemic_in_Nepal'
浏览 0
提问于2020-04-06
得票数 1
回答已采纳
1
回答
如何
根据
数据
库
中
的
行数
创建
jCheckBox?
、
、
我想在java
中
创建
一个具有可变复选框数量
的
框架,这将取决于我
的
数据
库
中
存在
的
行数。我面临
的
问题是:- 1.
如何
计算
数据
库
中
的
行数? 2.
如何
以及在哪里存储
数据
库
列
中
的
数据
?3.
如何
使用
数据
库
列
中
浏览 0
提问于2013-02-02
得票数 0
回答已采纳
3
回答
如何
在Pandas中将列表转换为
数据
帧?
、
、
、
我
从
维基百科
上
抓取
了一个
表格
,使用Pandas和BeautifulSoup,我得到了一个列表。我想把它转换成一个
数据
帧,但是当我使用pd.DataFrame()函数时,结果并不是预期
的
那样。print(df[0].to_json(orient='records'))neigh = pd.DataFrame(df) 它只返回一行和一
列
输出
浏览 2
提问于2019-11-27
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券