腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
3
回答
使用
Python
抓取
URL
链接
、
、
下面是我的代码: from selenium import webdriver
url
= 'https://www.coteur.com/cotes-foot.php' links = driver.find_elements_by_xpath('//a[contains(@href, "match/cote
浏览 41
提问于2020-06-16
得票数 0
回答已采纳
1
回答
数千个指向json标记的
URL
、
我做了一个
Python
程序,它可以
抓取
网站的所有
URL
,它以纯
链接
的形式下载数据。像这样:quora.com/example '
url
':'google.com', { '
url
':'quora.c
浏览 0
提问于2020-05-14
得票数 0
1
回答
如何
使用
python
打开web浏览器并返回重定向页面的
url
、
、
、
我想
使用
facebook api,我将需要oauth令牌,所以当程序启动时,
python
程序将通过webbrowser.open()方法打开身份验证
url
,之后用户将给予权限,然后facebook将生成访问令牌并重定向到不同的
链接
我需要
抓取
这个重定向的
链接
并检索访问令牌。如何
抓取
这个重定向的
url
。
浏览 7
提问于2013-10-31
得票数 2
1
回答
Web通过
python
抓取
问题,不能读取html文件吗?
、
、
web
抓取
Python
已经有一段时间了,最近我遇到了这个问题。BeautifulSoup似乎无法读取html文件。例如,我正试着从这个网站上
抓取
from bs4 import BeautifulSoup
url
_episode = 'https://www.thetvdb.com/series/initial-d/episodes/4889010' print(
url
_episo
浏览 1
提问于2020-04-06
得票数 0
1
回答
使用
python
抓取
URL
不变的多个表的最佳资源
、
、
我想在有下一步
链接
的网页上
抓取
表格,但是当你点击这些下一步按钮时,
URL
不会改变。
使用
python
(BeautifulSoup,请求)学习
抓取
这类表的最好/最简单的资源是什么?例如,我如何
抓取
上的表。
浏览 1
提问于2017-11-15
得票数 0
3
回答
抓取
urls的
抓取
顺序
、
我有个关于scrapy和
python
的问题。我有几个
链接
。我
使用
循环在一个脚本中
抓取
每个脚本中的数据。但
抓取
数据的顺序是随机的,或者至少与
链接
不匹配。所以我不能将每个子页面的
url
与输出的数据进行匹配。 喜欢:
抓取
的网址,data1,data2,data3。Data 1,data2,data3 =>这是可以的,因为它来自一个循环,但是我如何添加到循环的当前
url
,或者我可以设置
链接
列表的顺序?就像列表中的第一个
浏览 0
提问于2018-04-18
得票数 0
1
回答
web爬虫如何构建
URL
目录以
抓取
所需内容
、
、
、
有三个问题: 哪里是学习更多关于网络爬虫的最好的地方?
浏览 2
提问于2018-10-11
得票数 1
3
回答
使用
Python
中的导出按钮下载/导出站点搜索结果
因此,我试图
使用
Python
从以下网站
抓取
数据(
使用
示例查询): 如果我在同一个浏览器中遵循该
链接
,则保存提示符将用csv打开以保存当我想要
使用</em
浏览 2
提问于2020-02-19
得票数 1
2
回答
将数据从Tripadvisor导入Google电子表格或Excel
、
、
、
是否可以获取此数据的列表:阿姆斯特丹所有餐馆的名单。如果可能的话,还有详细的地址等等。非常感谢!
浏览 1
提问于2020-09-17
得票数 0
3
回答
抓取
多个
URL
的
抓取
方法
、
我一直在关注Scrapy,到目前为止,它给我留下了深刻的印象,但我正在寻找最好的方法来做以下事情: 1)我想要
抓取
多个
URL
,并为每个要
抓取
的
URL
传递相同的变量,例如,假设我想返回来自Bing、Google和Yahoo的关键字"
python
“的顶部结果。我想要
抓取
http://www.google.co.uk/q=
python
、http://www.yahoo.com?q=
python
和ht
浏览 8
提问于2012-08-28
得票数 1
1
回答
生成EDGAR文件路径列表
、
我对编程非常陌生(虽然我愿意学习),所以先为我的基本问题道歉。 我很难理解如何解决这个问题,因为文档相当简
浏览 7
提问于2016-05-22
得票数 0
1
回答
使用
curl
抓取
大页面
、
、
我正在尝试从一个流行的新闻网站上收集评论,以便
使用
curl进行学术研究。对于评论少于300条的文章,它可以很好地工作,但在此之后,它就会陷入困境。$handle = curl_init($
url
);$html = curl_exec($handle
浏览 2
提问于2012-08-23
得票数 0
2
回答
Webscraping HTML-包括所有
链接
内的标记
、
、
、
我正在
使用
Python
3.5的BeautifulSoup,并且我试图
抓取
所有h-tags的网站(所以所有的h1、h2..等等)。我的问题是让程序在网站上打开其他
链接
来
抓取
它们的标签。因此,假设我有一个网站,它有一个导航菜单,其中包含一些
链接
,这些
链接
贯穿整个网站,并且都包含某种类型的h标记。我该如何
抓取
我所选网站上的所有内容呢?这是我到目前为止用来
抓取
特定
url
中的h1-tag的代码: import requests
浏览 0
提问于2016-04-19
得票数 2
1
回答
抓取
oddsportal信息
、
、
、
、
我
使用
的是
Python
3.5,实际上我关注的是
使用
BeautifulSoup/lxml/Selenium/PhantomJS进行3.5
抓取
我只是想用
Python
代码
抓取
我需要的所有数据。我可以很容易地用BeautifulSoup从静态HTML中
抓取
信息。我最近也发现了如何从动态
url
中获取信息,
使用
Chrome的网络选项卡,并在XHR选项下查看出现的HTTPrequest。它通常会给我从JS生成的htm
浏览 2
提问于2016-01-14
得票数 1
3
回答
什么是好工具,自动
抓取
网站,检查某些
链接
,并提取数据?
、
我想自动
抓取
大约100万个
URL
(在一个CSV文件上),并检查这些站点是否提供了Facebook登录按钮(即用户可以通过将他们的Facebook帐户连接到站点来创建帐户)。我也想检查网站是否
使用
HTTPS和
使用
cookie。 什么是好工具?
浏览 0
提问于2015-05-18
得票数 3
回答已采纳
1
回答
如何确保在我的Scrapy爬行器中解析每个
URL
、
、
、
我尝试在美食博客上
抓取
食谱列表的每一页,
抓取
每一页上的食谱
URL
,然后将它们全部写入一个.txt文件。我已经添加了一个.log()来检查urls是否确实包含了我试图从其中
抓取
的所有正确的
URL
,当我在命令提示符中执行Scrapy时,我得到了以下确认: 2019-01-31 22:16:17 [recipesfwp_paged=%s" % i urls.append(curr_
url</
浏览 21
提问于2019-02-01
得票数 1
3
回答
如何从IG帖子中获取图片或视频
url
?
、
、
我需要从instagram后
链接
抓取
图像和视频(例如:)。当
使用
python
的正常请求时,我在html响应中没有接收到图像
url
。请帮我拿一下。
浏览 0
提问于2017-09-27
得票数 4
2
回答
如何
抓取
没有页数的
url
、
、
我正在
抓取
一个网页,其中有一个没有页面,我如何才能
抓取
这些页面,以获得我想要的信息。假设我正在
抓取
一个
URL
,这个页面有两个页面,我如何
抓取
这些总页面并得到总的产品列表。到目前为止我所做的是:我从他们那里
抓取
一个
url
,我通过正则表达式
抓取
一个特定的
url
,并试图从那个
url
中找到他们的
链接
,其他页面中没有包含
链接
产品名称的信息。我想要从所有页面中获取产品名称。我
使用</
浏览 1
提问于2016-02-28
得票数 0
2
回答
如何让文章的作者
使用
python
-goose?
、
、
我正试着从新闻机构
抓取
文章,但我想不出如何用
python
找到一篇文章的作者。我已经阅读了文档,源代码,并搜索了谷歌。from goose import Goose g = Goose() printarticle.title # print article.writer 那么,是否有一个内置的方式来提取文章的作者
浏览 1
提问于2014-01-12
得票数 1
回答已采纳
2
回答
Python
-如何在
URL
中不分页地刮分页
、
如何
使用
URL
访问下一页,内容如下:我知道如何
使用
刮取库(BS4、Selenium),但我不知道如何
抓取
这样的站点。我一直在玩谷歌Chrome开发工具,但没有成功。像
Python
这样的
抓取
站点通常的工作流程是什么?
浏览 0
提问于2019-07-05
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python数据抓取(3)—抓取标题、时间及链接
Python网络爬虫抓取网页的含义和URL基本构成
Python网络爬虫:抓取网页的含义和URL基本构成
恶意软件分析&URL链接扫描
使用Python进行网页抓取的介绍
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券