腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
3
回答
从
维基百科
表
中
抓取
数据
python
、
pandas
、
beautifulsoup
、
wikipedia
我只是想把
维基百科
表格
中
的
数据
整理成一个熊猫
数据
框。 我需要复制三列:“邮政编码,自治市,邻里”。
浏览 26
提问于2019-02-27
得票数 0
回答已采纳
1
回答
通过R实现
维基百科
上的Sumbit查询
r
我正在尝试开发一个R脚本,它接受一个字符串,并将其提交到
维基百科
搜索框
中
。在到达该字符串所在的页面之后,R程序应该
从
该页面提取所有的
表
。例如,如果字符串是曼彻斯特联队,R脚本应该在
维基百科
上提交一个查询,该查询将它带到曼彻斯特联队页面,并提取所有
表
并将其转换为
数据
帧。附言:我刚刚开始在R
中
尝试web
抓取
,所以如果有任何帮助,我将不胜感激。
浏览 1
提问于2014-09-04
得票数 0
2
回答
从
维基百科
页面
中
抓取
表
数据
python
、
html
我正在学习如何将BeautifulSoup库与Python一起使用,并且为了实践,我试图
从
维基百科
的页面:
中
删除体裁标题。在我的代码
中
,我已经做到了这一点:soup"html.parser") td = table.f
浏览 3
提问于2020-10-13
得票数 1
回答已采纳
1
回答
从
R
中
的
维基百科
抓取
表格
r
、
web-scraping
、
wikipedia
我想知道是否有人有有用的想法或代码来
从
维基百科
上
抓取
表格。 具体来说,我对
维基百科
上“各县选举结果”部分的总统选举结果
表
很感兴趣。可以使用以下链接找到示例
表
,并向下滚动到“按县列出的结果”部分:https://en.wikipedia.org/wiki/1948_United_States_presidential_election_in_Texas我尝试了以下StackOverflow帖子
中
的一些解决方案:Importing w
浏览 51
提问于2021-06-29
得票数 0
回答已采纳
4
回答
从
多个
表
维基百科
中
抓取
表
python
、
html
、
web-scraping
、
beautifulsoup
我正试着从这个url
中
抓取
表
。那里有五张不同的桌子。但我的目标是第一张
表
。它没有太多的标识,那个
表
只包含这个标识。class="wikitable sortable jquery-tablesorter"My_table = soup.find('table',{'class':'wik
浏览 0
提问于2020-09-11
得票数 2
回答已采纳
6
回答
如何
抓取
整个
维基百科
?
java
、
web-crawler
、
wikipedia
、
websphinx
那么,如何
抓取
整个
维基百科
呢?有人能给我一些指导吗?我是否需要专门找到这些URL并放置多个起始URL? 关于使用WebSphinx的API的教程,谁有好的网站的建议?
浏览 1
提问于2010-02-23
得票数 8
回答已采纳
1
回答
从
维基百科
提取个人日期
数据
wikipedia
、
dbpedia
、
wikidata
、
date
我试图
从
维基百科
中提取出生和死亡
数据
。我使用过DBpedia和维基
数据
,但在这个特殊的例子
中
,日期与
维基百科
不匹配。为什么会有这种差异?这个日期信息可以通过编程方式
从<
浏览 2
提问于2019-10-21
得票数 2
回答已采纳
1
回答
ImportXML解析错误-使用excel工作
表
抓取
维基百科
xpath
、
web-scraping
、
google-sheets
、
google-sheets-formula
、
google-sheets-importxml
我正在尝试使用ImportXML公式
从
维基百科
网站收集一些
数据
到excel表格
中
。这是
维基百科
的页面。 这是我
从
浏览器XPath选择器
中
获得的代码。
浏览 12
提问于2019-11-10
得票数 1
回答已采纳
1
回答
如何
从
维基百科
打印表格
python
我正在尝试
抓取
维基百科
网站作为一个小任务,以了解网络
抓取
。我要
抓取
的链接是:https://en.wikipedia.org/wiki/List_of_countries_by_population_in_2000 我想根据他们的人口在
维基百科
链接
中
列出这些国家的名单我已经签出了HTML标记,该
表
在class = wikitable
中
可用。但是当我运行我的代码时,它正在打印其他
表
的结果,这些<e
浏览 33
提问于2019-09-26
得票数 0
回答已采纳
2
回答
重用Google工作
表
中导入公式
中
的
数据
数组(通过查询语句)
google-sheets
、
google-sheets-formula
我试图从不同但相同的模式
表
中
检索值列表。然而,我正在努力减少ImportHTML调用次数,因为sheets必须使性能达到最佳。我遇到了一些问题:在新的工作
表
中
,其中A1 = =ImportHtml("https://en.wikipedia.org/wiki/List_of_countries_by_population_(Unit
浏览 4
提问于2020-10-07
得票数 0
回答已采纳
1
回答
将大量
维基百科
表
刮到MySQL
数据
库的最佳方法
mysql
、
sql
、
screen-scraping
、
wikipedia
什么是
抓取
维基百科
主要文章页面中所有HTML表格的最佳编程方法,其中页面标题与某些关键字匹配?然后,我想把列名和
表
数据
放到
数据
库
中
。 还会获取URL和页面名称以进行属性设置。
浏览 8
提问于2013-07-31
得票数 0
3
回答
从
维基百科
抓取
数据
web-scraping
、
wikipedia
、
wikipedia-api
我研究了一些框架,比如Scrapy,然后我发现有一些网站是专门为
维基百科
服务的,比如。这两种方法
中
的任何一种都有什么特定的优势,或者哪一种更适合将信息加载到在线
数据
库
中
?
浏览 0
提问于2012-09-14
得票数 6
回答已采纳
1
回答
从
各个
维基百科
页面
中
抓取
特定的
表
。
r
、
xpath
、
css-selectors
、
rvest
我试图
从
维基百科
(如)
中
为过去两届奥运会中的每一个国家“竞争对手”,并把它变成一个
数据
格式。我可以找到每个国家的URL列表,但是当我开始
抓取
时,我会面临这样的问题:每一页都有一个不同顺序的“竞争对手”
表
(有时是第一个,有时是第二个),再加上我可以找到一个唯一的标题来标识该
表
()。
浏览 2
提问于2022-04-20
得票数 1
1
回答
使用python
从
维基百科
中
刮
表
?
python
、
pandas
、
web-scraping
、
beautifulsoup
我试着
从
维基百科
的页面上
抓取
表格
数据
:,我试过使用pd.read_html语法,但它不适用于我试图刮的
表
(尼泊尔按地区分列的新冠肺炎确诊病例)。我试着用“美丽汤”和“熊猫”来收集
数据
,但是它不起作用 url = 'https://en.wikipedia.org/wiki/2020_coronavirus_pandemic_in_Nepal'
浏览 0
提问于2020-04-06
得票数 1
回答已采纳
1
回答
我在
数据
清理方面有一些问题
python
、
pandas
、
dataframe
、
data-cleaning
我已经
从
维基百科
页面上
抓取
了一个表格,接下来我将清理
数据
。我已经将
数据
转换为Pandas格式,现在我在清理
数据
时遇到一些问题import requestswebsite_url
中
删除"Not assigned“值: canada=canada.Borough.drop("Not assigned",a
浏览 2
提问于2019-04-08
得票数 0
1
回答
如何使用BeautifulSoup只获取
维基百科
页面上所有
表
的第一行
数据
?
python
、
web-scraping
、
beautifulsoup
、
wikipedia
我正在尝试
从
维基百科
页面
中
抓取
数据
。 albumdatasaved = albumdatasaved + "\n" + albumdata[1:] 我只需要每个
表
的第一行
数据
浏览 2
提问于2019-04-08
得票数 0
回答已采纳
3
回答
从
维基百科
检索音乐艺术家
数据
?
wikipedia
当涉及到音乐的流派分类时,我发现
维基百科
比大多数其他
数据
源拥有更多有趣的流派信息。 我似乎记得有一个
数据
库
从
维基百科
上收集了这类信息,并使其更容易访问,但我今天无法谷歌任何东西。如果我尝试检索此
数据
,我有哪些选择?有没有像我描述的那样的东西,或者我需要去一个屏幕
抓取
?
浏览 5
提问于2009-01-19
得票数 8
回答已采纳
1
回答
用php和mysql
从
维基百科
中提取描述和关键词
php
、
mysql
、
web-crawler
、
wikipedia
、
wikidata
我有一个
从
维基百科
特色文章的所有链接的网页,我提取所有它们的标题,描述和关键字。但我有一个问题,当网络爬虫开始提取文章的内容时,我的
数据
库
中
的字段描述仍然是空的,关键字显示“数组数组”。如何提取
维基百科
文章的描述和关键词?<?
浏览 1
提问于2012-11-27
得票数 0
4
回答
使用XML包将html
表
抓取
到R个
数据
框
中
html
、
r
、
xml
、
parsing
、
web-scraping
如何使用XML包
抓取
html
表
? 以上的这个
维基百科
页面为例。我想在R
中
读一读,并获得“巴西对国际足联认可球队的所有比赛清单”
表
作为data.frame。我该怎么做呢?
浏览 9
提问于2009-09-08
得票数 159
回答已采纳
2
回答
抓取
器刮不出页面。
r
、
web-scraping
、
rcrawler
我正在使用Rcrawler提取
维基百科
页面的信息框。我有一个音乐家的名单,我想提取他们的名字,道布,死亡日期,乐器,标签等。然后我想创建一个所有艺术家的
数据
作为行和
数据
存储为列/向量。
浏览 2
提问于2018-07-31
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
从安装到数据抓取、存储原来这么简单
如何按照 Excel 中的目录,从多个工作表中查找出完整数据?
解决access多表删除查询中 无法从指定的数据表中删除 的错误提示
python中的哈希表数据结构
使用zabbix监控oracle中的表数据
热门
标签
更多标签
活动推荐
运营活动
广告
关闭
领券