腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
2
回答
Python
Web
Scraper
没有
收集
我
所
指出
的
所有
文本
、
、
、
我
正在开发一个
python
网络抓取器,试图为
我
正在做
的
一个项目获取信息。
我
在twitter自动取款机上使用它,因为
我
发现twitter api不会捕获超过一周
的
信息。
我
正在查看
的
使用'findAll‘
的
HTML语言
的
具体部分是: <p class="TweetTextSize js-tweet-text tweet-text" lang="en&quo
浏览 5
提问于2017-08-04
得票数 0
2
回答
无法从cron作业中找到dotenv环境变量
、
、
、
、
我
正在运行
python
库中
的
python
脚本,该脚本使用dotenv从库根目录
的
.env文件中加载一些环境变量。这是从命令行运行
的
,但当我尝试使用以下命令作为cronjob运行时: * * * * * source ./path_to_venv/activate;
python
./path_to_script.py
我
得到一个键错误,因为它找不到环境变量。 你知道为什么这不管用吗? 非常感谢您
的
帮助!
浏览 74
提问于2020-07-03
得票数 3
1
回答
Microsoft
Web
矩阵
我
希望这是一个非常简单
的
问题:有
没有
人知道可以有效地抓取使用Microsoft Matrix构建
的
站点
的
工具?
我
可以用
python
编写代码,但这会花费
我
很长
的
时间来完成这项任务,这是因为Matrix生成
的
HTML非常糟糕和丑陋。
我
试过
Web
Harvey、Helium
Scraper
,也试过Chrome
的
Web
Scra
浏览 0
提问于2015-07-20
得票数 2
1
回答
没有
找到导入模块?
、
、
我
正在构建一个网络刮刀,
我
试图导入‘请求’包,但我得到了一个错误。
我
被告知如下:(venv) USERs-MacBook-Pro:
Scraper
user$ /usr/local/opt/
python
@3.9/bin/
python
3.9 /Users/user/git/ML
浏览 1
提问于2020-12-23
得票数 0
回答已采纳
1
回答
我
如何在Mac上解决这个Selenium异常,它显示"chrome不可达“?
、
、
、
、
我
正在尝试学习如何使用Selenium自动化
web
流程,并希望能够构建健壮
的
web
抓取器和其他东西。所以,
我
刚刚安装完Pycharm和Selenium,
我
只是想运行一段简单
的
代码,在chrome中打开一个网页,并不是太花哨。
我
的
代码如下(当然是用
Python
编写
的
) PATH = "/Users/Kudz
浏览 31
提问于2021-05-18
得票数 0
回答已采纳
3
回答
在rails中返回数组并存储它
、
、
我
知道这听起来可能是一个“简单
的
问题”,但我是rails
的
新手,
我
不知道
我
的
应用程序结构是否正确。 class JPG < ActiveRecord::Base acts_a
浏览 1
提问于2013-08-30
得票数 1
1
回答
当使用来自导入另一个自定义模块
的
自定义模块
的
函数时为ModuleNotFoundError
、
、
、
、
我
有一个类似于此
的
文件夹结构(
我
的
示例包含
所有
必需
的
部分):
scraper
.py __init__.pyimport config # Do some
web
浏览 2
提问于2021-01-09
得票数 0
1
回答
在bash脚本中执行
Python
命令时
的
ModuleNotFoundError
、
、
我
已经设置了
我
的
PYTHONPATH变量,并将它作为%PYTHONPATH%添加到path中,但
没有
成功。
我
检查了bashrc,
没有
看到环境变量被覆盖。也许
我
的
结构不正确?lib -scripts - monroes_events.py (venv) C:\Users\James\repos\
web
_
scraper
\src>bash
浏览 0
提问于2019-12-02
得票数 0
2
回答
使用
python
从Instagram
收集
用户信息
、
、
、
我
目前正在使用
python
从instagram上
的
用户那里
收集
信息,使用
的
是一个包含instagram用户链接
的
文本
文件。虽然
我
可以
收集
关注者
的
数量、关注
的
数量和帖子
的
数量,但我希望能够
收集
用户
的
个人信息。
收集
简历信息将允许
我
最终解析这些信息并
收集
电子邮件。
我
能做到这一点<e
浏览 32
提问于2019-06-10
得票数 2
1
回答
我
正试图用BS4循环和刮一个链接
的
文本
文件。在循环
的
第四次迭代时,我会得到一个错误。
、
、
、
我
试图循环从一个
文本
文件
的
链接列表,并将信息写入一个
文本
文件。
我
得到
的
“索引超出范围”
的
错误,
我
不知道为什么。details(a): with open('C:/Users/Main/Desktop/
Python
Web
浏览 2
提问于2018-03-11
得票数 0
回答已采纳
2
回答
git忽略了“git加法”命令
我
要去:当我获得git状态时,
没有
添加任何内容:On branch
python
modified: __pycache__/
web
_
scraper
.cpython-38.pyc modified: aws_s3_list_buckets.pymodified:
web
_
scraper</em
浏览 3
提问于2019-12-18
得票数 2
回答已采纳
1
回答
JSoup在Android活动中工作,但不作为活动中
的
对象。
、
我
使用了JSoup,并成功地
收集
了
所有
的超
文本
标记语言,并将它们放入控制台项目的适当数据结构中,只有一个类名为
Scraper
.java。
我
的
下一步是将这个
Scraper
.java移植到我
的
安卓应用程序中。要做到这一点,
我
只想在
我
的
活动中创建一个需要html信息
的
Scraper
对象。放弃了,
我
把
所有
来自
S
浏览 0
提问于2012-11-08
得票数 0
回答已采纳
1
回答
如何处理tkinter主循环中
的
错误?
、
、
、
我
有一个
python
程序,它为客户端抓取
web
数据。接口使用tkinter。大纲是: if self.__del__ of <tkinter.IntVar object at 0x03245510>> 多次,直到
所有</em
浏览 4
提问于2016-02-14
得票数 1
回答已采纳
2
回答
Crontab在raspberry pi上启动
python
脚本会导致导入错误
、
、
、
、
我
在
我
的
Raspberry PI上运行Ubuntu Mate。
我
用
Python
编写了一个
web
刮板,
我
想每天运行一次。
我
认为使用sudo crontab -e是一种很好
的
方法。
我
遇到
的
问题是,当cronjob启动
我
的
python
脚本时,
python
脚本抛出一个导入错误而不运行。但是,当我从命令行直接执行
python</
浏览 1
提问于2017-03-18
得票数 0
回答已采纳
5
回答
当脚本位于根目录之外时,获取scrapy项目设置
、
、
、
我
已经制作了一个Scrapy爬行器,可以从位于项目根目录
的
脚本中成功运行。由于我需要从同一脚本运行来自不同项目的多个爬虫(这将是一个django应用程序根据用户
的
请求调用脚本),因此
我
将脚本从其中一个项目的根目录移动到父目录。下面是
我
用来从脚本运行爬行器
的
scrapy文档中
的
代码: settings = get_project_settings() settings.set(下面
我
还有运行蜘蛛
的
浏览 2
提问于2015-07-28
得票数 15
4
回答
Linux匹配字符串并将一行向上移动。
、
、
、
我
在linux上
的
文本
文件中有以下
文本
。and usage of various
python
scripts that work with embedded devices.### REB00T Spear Phishing#### W
浏览 4
提问于2015-12-30
得票数 0
回答已采纳
3
回答
由于URL差异很小,
我
的
Web
刮板偶尔出现故障
、
、
、
、
我
正面临着这个令人沮丧
的
问题,这个问题严重影响了
我
的
数据
收集
速度。-/其中/12345/其中/12345/某某/其中/12345,
没有
问题。在这里,
我
修改了URLlin
浏览 5
提问于2016-12-09
得票数 0
2
回答
Docker + Django,docker-compose似乎不运行迁移命令
、
、
、
它
的
要求是它必须在Docker上运行,这给我带来了以下问题:当使用docker-复合映像时,正在正确构建映像,db服务运行,但是
我
得到一个错误,它说
我
的
DB中
的
关系不存在。
我
在
我
的
docker-compose.yml中使用了docker-compose.yml,但由于某种原因,它似乎
没有
运行。ready()中访问DB并不是最好
的
做法,但当Django应用程序启动时,
我
不知道如何让这段代码运行,而不把
浏览 0
提问于2018-10-12
得票数 0
回答已采纳
2
回答
Perl机械化查找Div中
所有
链接
、
、
有
没有
一种方法可以找到特定div中
的
所有
链接?
我
试图使用find_all_links,但是找不到一种方法来解决这个问题。
浏览 0
提问于2011-06-23
得票数 4
回答已采纳
1
回答
会话转移
、
、
、
在会议上有个问题,这是
我
所
面临
的
情况, 用户点击站点
scraper
.com并发出请求,这将触发
scraper
.com
的
web
服务器在" parent.com“上启动会话,
web
服务器发出多个帖子并到达parent.com现在,
scraper
.com
的
web
服务器希望用户
的
浏览器加载"parent.com“
的
签出页面,这与
scraper<
浏览 1
提问于2011-12-21
得票数 1
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券