腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
0
回答
在
Python
中
进行
更
高效
的
Web
抓取
?
python
、
performance
、
web-scraping
、
python-requests
我有下面的代码,它成功地从nba.com
中
抓取
了播放数据,然后将数据写入excel文件。它在少数几场比赛
中
效果很好,但当试图收集整个赛季
的
数据时,它会变得令人难以置信地慢。有没有什么我可以实现
的
,可以更有效地
抓取
数据?我知道这是整个赛季
的
500K+行数据,所以我不期望闪电般
的
速度,但如果有任何方法来改进我
的
代码,我肯定想学习如何改进。 提前感谢大家
的
帮助!
浏览 9
提问于2017-12-11
得票数 1
1
回答
Python
高效
的
Web
抓取
?
python
、
web-scraping
、
urllib
、
finance
、
google-finance
我对
Python
相当陌生,我正试图为一个股票应用程序制作一个
web
解析器。实际上,我使用urllib为参数列表
中
的
每个股票打开所需
的
网页,并读取该页面的html代码
的
全部内容。然后我把它切成薄片,以便找到我要找
的
报价。我已经实现了这个方法,但是我怀疑这是否是实现这个结果
的
最有效
的
方法。我花了一些时间研究其他更快地读取文件
的
潜在方法,但似乎没有一种方法与网络
抓取
有关。这是我
的
密码:
浏览 1
提问于2017-09-12
得票数 1
回答已采纳
1
回答
高效
的
web
抓取
Python
python
、
html
、
pandas
、
web-scraping
、
beautifulsoup
你好,我是一个新
的
网络刮擦,并想刮一个网站与美丽肥皂。现在,我想知道如何编写
高效
的
代码。这是一个自行车网站,他们有几辆自行车,每个自行车
的
特点,价格,状态,距离和持续时间。他们都有同样
的
阶级“产品-壮举”。什么是最有效
的
方法,把所有这些功能
的
熊猫数据?我特别问,因为所有的特性都有相同
的
类,循环对我来说是低效
的
。</p><sp
浏览 11
提问于2021-04-11
得票数 0
回答已采纳
1
回答
最有效
的
语言来创建一个非常快
的
网络爬虫?
web-crawler
我正在创建一个新
的
网站,建议一个类别的链接。我需要快速扫描不同
的
网页。我应该使用哪种语言来创建一个
高效
的
网络爬虫?
浏览 1
提问于2014-02-19
得票数 0
2
回答
最适合用于图像爬行
的
开源、可扩展爬虫
language-agnostic
、
web-crawler
我们正处于一个项目的开始阶段,我们目前想知道哪个爬虫是我们最好
的
选择。基本上,我们要建立Hadoop和
抓取
网络上
的
图像。然后,我们将根据Hadoop
中
的
Map/Reduce工具,
在
HDFS
中
存储
的
图像上运行我们自己
的
索引软件。除了我们自己
的
索引之外,我们不会使用其他索引。哪种爬虫最适合
抓取
图像?哪种爬虫最适合分布式爬行系统,在这种系统<e
浏览 5
提问于2009-07-28
得票数 3
2
回答
使用Bash脚本
在
python
库上
进行
web
抓取
?
python
、
bash
、
curl
、
sed
、
web-scraping
我正在尝试从有经验的人那里获取更多
的
信息,一般来说,我正在使用
Python
库
进行
web
抓取
。与此同时,我注意到一些人正在使用simple Bash,并使用wget, curl, sed, grep, awk等命令
进行
web
抓取
。与使用
Python
库
进行
web
抓取
相比,这些命令
在
脚本编写方面似乎要干净得多。 你对此有什么看法?您认为使用
python
浏览 1
提问于2017-03-03
得票数 0
1
回答
Python
中
的
Web
抓取
python
、
web-development
、
scraping
我需要学习高级
python
编程技能才能使用
python
进行
web
抓取
吗?或者,我应该看一些关于网络
抓取
的
教程,同时学习使用
python
。我对
python
没有任何经验,因为我是Laravel开发人员,这是我第一次
在
web
抓取
中
做这样
的
工作。
浏览 0
提问于2019-11-04
得票数 -1
1
回答
从网页中提取主题/关键字
python
、
web-scraping
、
keyword
我正在寻找一个系统,以提取主题或简单
的
关键字从一个网页,只有从指定
的
网页,没有跟随所包含
的
链接。要分析
的
页面属于不同
的
站点,特别是我想分析一个人在Facebook上共享
的
链接,并从这些页面中提取主题或简单
的
关键字。非常感谢。
浏览 5
提问于2014-04-11
得票数 0
2
回答
在
使用
Python
进行
web
抓取
时,如何使用相同
的
连接?
python
、
webkit
、
screen-scraping
很可能会让我
的
IP被禁止。有人建议我使用WebKit (如Ghost.py )来
抓取
数据,但在浏览器
中
模拟打开
的
选项卡使连接保持打开状态。我对WebKit知之甚少,是否有人能为我确认Ghost.py能够重用相同
的
连接,或者是否有其他更好
的
建议。
浏览 1
提问于2015-08-12
得票数 1
回答已采纳
1
回答
Python
到PHP异步数据传输
php
、
python
、
asynchronous
我有一个建立一个网络刮擦工具
的
要求。
抓取
部分将在
python
中
编码,结果将在PHP
中
显示。结果应该在PHP
中
异步显示,而
python
正在
抓取
页面。 客户认为
python
是快速和更好
的
web
抓取
的
选择。您认为混合
python
和php仍然会带来快速
的
结果吗?还是坚持使用php
进行
web
抓取
浏览 3
提问于2017-05-04
得票数 1
回答已采纳
5
回答
如何从其他网站获取数据?
python
、
database
、
parsing
、
web-scraping
我想创建一个网站,从其他网站提取信息,并将它们打印到我
的
网站上,我正在
进行
研究,所以我想听取一些意见,这个项目的最佳解决方案是什么?我听说
Python
使用解析器可以做到这一点,我只是想知道我应该走哪条路,应该使用哪种语言?
浏览 1
提问于2013-06-14
得票数 4
2
回答
动态获取urls
的
python
抓取
python
、
web-crawler
、
web-scraping
我是数据
抓取
领域
的
新手,之前使用
python
进行
web
和桌面应用程序开发。我只是在想,如果有任何方法可以从页面
中
获取urls,然后查看它
的
具体信息,如电话号码,地址等。目前我使用
的
是BeautifulSoup和built方法,其中我将urls作为方法
的
一个参数。有什么建议可以让它变得更快、
更
自驱动吗?
浏览 1
提问于2011-04-22
得票数 2
回答已采纳
2
回答
在
Python
上
进行
Web
抓取
python
、
web-scraping
我需要在网站上下载POST请求
的
响应作为JSON文件。但是我对站点
的
请求返回了一个错误400。我
的
代码是:paramsemailAddresses':['xxx@x.ru']} headers = {'Vaar-Ve
浏览 1
提问于2021-02-12
得票数 0
1
回答
托管
在
GAE上
的
应用程序能否到达我pc上
的
本地tomcat
rest
、
google-app-engine
、
tomcat
我
在
Google App Engine上部署了一个应用程序,
在
我
的
本地机器上托管了另一个tomcat应用程序。所以我
的
问题是,我们能否从托管
在
Google App Engine上
的
应用程序访问tomcat上
的
应用程序( App URL )。
浏览 0
提问于2016-02-12
得票数 0
1
回答
用Laravel和Selenium
进行
Web
抓取
php
、
laravel
、
selenium
、
web-scraping
我目前正在使用
Python
进行
web
抓取
。我使用了Selenium和Beautifulsoup库来
抓取
。我最近知道Selenium适用于php/Laravel。我
的
问题是,我可以使用Laravel + Selenium
web
驱动程序
抓取
web
吗?如果是,你能给我提供一些链接或存储库,以便我学习吗?我被迫在我
的
抓取
工作中使用php/Laravel,因为他们说php很容易
在
浏览 19
提问于2019-11-19
得票数 0
5
回答
R
的
OAuth访问
r
、
oauth
我正在尝试使用R来获取一些需要OAuth身份验证
的
web
数据。
在
CRAN和RSeek.org上搜索有关OAuth +R
的
信息没有提供任何信息。我正在考虑使用一些
Python
/Perl/Ruby来
抓取
数据,将其保存到文本文件
中
,然后使用R
进行
处理。我
更
喜欢完全使用R,但似乎OAuth是一个障碍。
浏览 1
提问于2010-08-03
得票数 19
回答已采纳
1
回答
解析
python
中
的
html值
python
、
html
、
beautifulsoup
<=value=")(\d*)',str(y)) 但我认为应该有更直接
的
方法来通过解析器来做这件事,有人能帮上忙吗?
浏览 20
提问于2020-12-15
得票数 4
回答已采纳
3
回答
基于
Python
的
不规则字符串解析
python
、
django
、
string
、
parsing
、
web
我是
python
/django
的
新手,我正试着从我
的
抓取
器
中
找出更有效
的
信息。目前,
抓取
器获取漫画书名列表,并将它们正确地划分为CSV列表,分为三个部分(发布日期、原始日期和标题)。然后我将当前日期和标题传递到数据库
的
不同部分,这是我
在
Loader脚本中所做
的
(将mm/dd/yy转换为yyyy-mm-dd,保存到"pub_date“列,标题转到" title”列)。<
浏览 0
提问于2011-10-09
得票数 2
1
回答
Azure数据工厂查询
azure
、
azure-data-factory
、
azure-data-factory-2
案例:-有一个URL,我需要从下拉菜单中选择一个输入,从下拉列表中选择另一个输入来转换一些数据,再输入一个CSV格式
的
数据,然后单击提交按钮,输出是以CSV格式生成
的
,所以我需要通过ADF自动执行此过程我做了什么:-我正在使用
web
活动和复制活动,以加载URL数据使用POST方法到blob
中
。但我得到
的
输出是页面的完整HTTP响应。然而,我已经创建了用于映射
的
参数,但是work.what不是只获得这些参数来选择URL
中
的
数据并仅获得所选值输出
的
浏览 21
提问于2020-03-21
得票数 0
1
回答
在
Python
web
抓取
中
不会对某些类
进行
抓取
python
、
web-scraping
、
web-crawler
**这是一个韩国金融门户网站,显示名为"Kona i“
的
韩国公司
的
股票信息。 我是个初学者,刚开始用
Python
学习
web
抓取
。我试图用BS来计算这只股票
的
价格。在网页
中
,股票价格
的
标签和类别分别是em,"curPrice up“。所以我
在
选择器部分加上了"em.curPrice up“。当我把它打印出来
的
时候,结果却是一张空
的
清单。它有什么问题?
浏览 2
提问于2018-09-12
得票数 0
点击加载更多
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
腾讯会议
活动推荐
运营活动
广告
关闭
领券