腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
如何
通过
网络
抓取
从
维基百科
表格
中
提取
数字
(
或
字符串
)
数据
?
、
、
、
、
我想使用BeautifulSoup
从
维基百科
文章
中
抓取
数据
,以便创建人力资源图表。对于下面的示例,我选择了名为Arcturus的星星,尽管代码的目的是为了足够通用,以便工作(几乎?)任何一颗星。每颗星的
维基百科
页面最右边的
表格
包含了构建图表所需的所有信息。import requests# import numpy as
浏览 22
提问于2019-08-07
得票数 0
回答已采纳
2
回答
我多长时间可以用PHP
抓取
一个网站?
、
、
我想构建一个Android应用程序,它可以用php
抓取
一个网站,并从我
抓取
的网站
中
的一个很小的span标签
中
获取信息。 我想知道这是不是合法的(我想这是因为Google一直在
抓取
网站)。
浏览 4
提问于2012-01-03
得票数 0
1
回答
从
wiki表中
提取
数据
以及
从
该表链接到JSON的最佳方法是什么?
、
、
、
我在web dev是个新手,对于
从
维基百科
上获取
数据
有个问题。我正在制作一个个人
网络
应用程序,将保持跟踪过去的UFC事件。我找不到有事件细节和结果的开源api。然而,
维基百科
上的以下
表格
有很多我需要的信息:和我已经看过几个教程,介绍
如何
从
维基
表格
中
获取信息,并使用谷歌电子
表格
或
其他软件(如openrefine )将其格式化为.csv格式。但是,我也想要每个事件的wikipage的信
浏览 3
提问于2015-01-14
得票数 0
1
回答
通过
R实现
维基百科
上的Sumbit查询
我正在尝试开发一个R脚本,它接受一个
字符串
,并将其提交到
维基百科
搜索框
中
。在到达该
字符串
所在的页面之后,R程序应该
从
该页面
提取
所有的表。例如,如果
字符串
是曼彻斯特联队,R脚本应该在
维基百科
上提交一个查询,该查询将它带到曼彻斯特联队页面,并
提取
所有表并将其转换为
数据
帧。附言:我刚刚开始在R
中
尝试web
抓取
,所以如果有任何帮助,我将不胜感激。
浏览 1
提问于2014-09-04
得票数 0
4
回答
废弃
维基百科
,使用集群管理此
数据
[已关闭]
、
、
、
、
通过
编辑这篇文章来更新问题,使其只关注一个问题。 5年前就关门了。 改进这个问题 我是一个Python开发人员,目前正在进行一个与NLP和NLTK相关的项目。在这个项目中,将需要大量的
数据
来进行事件分析。因此,我给出了两个问题 我在哪里寻找如此大量的
数据
。我的首选是
维基百科
,但我不知道
如何
访问它的
数据
?我需要
抓取
维基百科
吗?我应该
如何
组织所有这些
数据
,以便获得更好的搜索结果?K-means聚类会有用吗?
浏览 74
提问于2015-11-04
得票数 -1
1
回答
寻找一个
网络
刮板工具,以
提取
整个
表格
的网页,并把他们在不同的工作表
中
的excel
、
Mode=StudySummary&SortBy=Analysis&AscDesc=asc&ResultsPerPage=2000
通过
每个链接,我必须像这样下载整个表:https://www.metabolomicsworkbench.orgSTUDY_ID=ST000886&SORTFIELD=moverz_quant 并在excel中将每个链接
中
的每个表放入单独的工作表
中
。 如果有人能告诉我
如何
自动化整个过程,我将不胜感激。
浏览 17
提问于2020-10-03
得票数 0
3
回答
如何
从
网站拉取信息到我的项目中?
、
、
我有一个问题,那就是
从
网站获取信息到我的python项目中(当项目正在运行时)。我还没有写过任何代码,因为我是这种编程的初学者。我想问你,我需要哪些模块以及
如何
使用它们,如果你们
中
的一些人可以,我将感谢一些代码的例子。
浏览 1
提问于2020-09-18
得票数 0
1
回答
在PHP
中
,
如何
抓取
某个文本模式的DOMDocument,然后获取匹配文本的文本节点的父元素?
、
、
、
、
我已经用PHP和cURL构建了一个简单的web
抓取
工具,并且一直在使用这样的代码来
通过
ID
抓取
抓取
页面的某些元素,或者在所需元素上没有ID的情况下
通过
标记名
抓取
:$response = $dom->saveXML($table); 现在我遇到了一个两难境地,我需要更进一步,找到文本的某个
字符串
或
正
浏览 1
提问于2011-03-09
得票数 0
回答已采纳
1
回答
如何
从
Google列中
提取
数据
作为
字符串
?
、
我试图
从
电子
表格
中
的列中
提取
数据
,但它将其
提取
为列表列表。例如,如果列表在电子
表格
的A列
中
包含以下名称。Anna作为变量
中
的
字符串
,而不是['Anna']?如果要使用代码将其粘贴回不同位置的工作表
中
,是否需要采用['Anna']格式?比如,如果我想移动
或
复制Anna到D4单元格。长期的目标是从一列
中
获取
数据
浏览 5
提问于2022-05-04
得票数 1
1
回答
从
维基百科
提取
个人日期
数据
、
、
、
我试图
从
维基百科
中
提取
出生和死亡
数据
。我使用过DBpedia和维基
数据
,但在这个特殊的例子
中
,日期与
维基百科
不匹配。为什么会有这种差异?这个日期信息可以<em
浏览 2
提问于2019-10-21
得票数 2
回答已采纳
1
回答
Python,
从
网站
提取
XHR响应
数据
、
、
、
、
我正在尝试从中
提取
一些
数据
。谢谢!
浏览 10
提问于2018-09-08
得票数 1
回答已采纳
2
回答
使用Python & NLP,
如何
从
具有大量自由文本的Excel列中
提取
特定的文本
字符串
和
字符串
前的相应
数字
?
、
、
不幸的是,我一直使用的稀疏代码是在另一个
网络
上,但我包含了一个示例电子
表格
。我想得到建议的步骤在简单的英语(比我下面有更详细的),所以我可以首先尝试自己在Python 3脚本。问题:一个健壮的电子
表格
中有几列非常没有结构,只有500-5000个英文字符来讲述一个故事。我需要从本质上
通过
提取
可量化的
数据
来使其更具结构化。我需要: 1)在用户提供的非结构化自由文本列
中
搜索
字符串
(用户输入列标题)(我认为我这样做是对的) 2)在Excel中将该
字符串
浏览 26
提问于2019-01-11
得票数 0
1
回答
使用import.io在多个不同结构的网站
中
搜索单词
、
、
我有一个超过10.000个网站的列表,我想在所有这些网站
中
搜索一个关键字。 如果网站包含关键字,则预期的结果应该类似于链接和值为1的列,如果不包含关键字,则值为0。
浏览 1
提问于2015-12-22
得票数 0
2
回答
如何
使用python
从
网站的搜索栏中
提取
数据
?
、
我想从一个包含许多医生和医院名称的网站中
提取
数据
,我想做一些评估,所以我决定使用搜索栏,但不幸的是,似乎无法得到我想要的结果! 我怎么能这么做?
浏览 3
提问于2018-06-11
得票数 2
回答已采纳
2
回答
保护iPhone应用程序的
数据
馈送
、
、
、
我正在创建一个
从
我的服务器上的文件中
提取
数据
的应用程序。该文件根据
通过
URL传递的Get值
从
我的
数据
库
中
获取
数据
。我正在寻找任何可能对我有帮助的想法<
浏览 0
提问于2010-03-26
得票数 1
回答已采纳
1
回答
如何
在UIPath
中
实现文本和
数据
的
抓取
和插入到excel
中
、
有没有人知道
如何
使用get文本和
数据
,把它们拼凑起来并插入到Excel
中
? 我想在我的Excel
中
显示的是那些在蓝色高亮显示,我能够得到
数据
表使用
数据
抓取
,但我不能得到“104445”在一起。
浏览 5
提问于2020-09-01
得票数 2
1
回答
如何
修复在R中进行when
抓取
时的HTTP 403错误?
、
、
、
我正在收集3600多个
维基百科
网页上的统计
数据
以供工作。我试图用R
中
的
网络
抓取
来实现自动化。# ID webpage link first setwd("C:\\Users\\judit\\ScrapingPS:请原谅我的法语在代码
中
。这是我的第一语言。
浏览 2
提问于2019-12-01
得票数 2
回答已采纳
1
回答
从
openRefine上的单词列表
中
获取网址
我在第1列中有一个组织列表(带空格的
字符串
,例如联合国),并希望使用第1列的值作为搜索
字符串
,使用相关的URL(例如www.un.org/)填充第二列。地理编码过程相当简单(),所以我想知道是否有一种方法可以使用谷歌搜索
或
其他web服务来执行此任务。这将是一种碰碰撞撞的方法,但它胜过手动编辑。谢谢!
浏览 2
提问于2017-03-01
得票数 1
3
回答
Web
抓取
、
数据
挖掘、
数据
提取
、
、
、
我的任务是创建一个
网络
抓取
软件,我甚至不知道
从
哪里开始。任何帮助都将不胜感激,即使只是告诉我这些
数据
是
如何
组织的,或者网站使用的是什么“类型”的
数据
布局也会有所帮助,因为我可以用谷歌搜索那个词。基本上,我需要从这个网站
提取
“谐波值”。具体地说,我需要在第二个链接上显示9个
数字
。这些
数字
不会传递给HTML,它们似乎每隔几秒钟就会自动更新一次。我需要能够实时
提取
这些值,因为它们更新。即使这是不可能的,我仍然需要证明做这样
浏览 0
提问于2013-10-26
得票数 1
1
回答
从
维基百科
文章中
提取
数据
我正在尝试
从
维基百科
的一篇文章中
提取
一个有组织的类别及其子类别列表。这篇文章是:它不需要被动态编码到我的站点中。我也愿意在电子
表格
(importxml、importhtml等语句)的帮助下手动
提取
数据
。然而,我仍然没有找到一种优雅的方法来完成上面的文章(电子
表格
提取
或
通过
API)。(
通过
查看源代码,您可以看到将表作为查询的importhtml在单个单元格
中
输入所有列表项,而将列表作
浏览 4
提问于2014-12-03
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券