使用Python Web Scraper时遇到问题

文章/答案/技术大牛

发布

2回答

我最近试过使用scrapy，但根本不能让它工作。我想做的是获得标题，剧集和html 5视频播放器链接的+不同的质量(480p，720p等)。从这个。我不确定如何从iframe元素中获取视频src。

浏览 14提问于2017-01-09得票数 0

回答已采纳

1回答

为什么这个html模板不呈现web浏览器中被刮过的网站数据(Python，Flask，HTML，Web-Scraping)？

、、、

每当我在终端中打印被刮过的数据时，它都会显示被刮过的数据，但是每当我尝试使用Python提供数据时，我使用的HTML模板就不会在web浏览器中呈现数据。如果你能帮我修复这段代码。Python (水瓶)文件：from bs4 import BeautifulSoup as BS import requestssrc = requests.get('https:/

浏览 16提问于2022-02-09得票数 -1

2回答

无法从cron作业中找到dotenv环境变量

、、、、

我正在运行python库中的python脚本，该脚本使用dotenv从库根目录的.env文件中加载一些环境变量。这是从命令行运行的，但当我尝试使用以下命令作为cronjob运行时： * * * * * source ./path_to_venv/activate; python .

浏览 74提问于2020-07-03得票数 3

1回答

我如何在Mac上解决这个Selenium异常，它显示"chrome不可达“？

、、、、

我正在尝试学习如何使用Selenium自动化web流程，并希望能够构建健壮的web抓取器和其他东西。= webdriver.Chrome(PATH)所以，当我运行这段代码时，我得到了这个异常，我不知道如何解决这个问题__init__( File "/Users/Kudzie/PycharmProjects/Web Sc

浏览 31提问于2021-05-18得票数 0

回答已采纳

1回答

Python - Flask:从特定文件夹导入.json文件，并在GET/POST请求时返回

、、

我从文件夹导入JSON文件时遇到故障，我尝试了以下约定： from web_scraper import data 而且还 from web_scraper.data import * 但两种方法都不起作用

浏览 11提问于2019-03-16得票数 2

1回答

Docker -将python输出写入当前工作目录中的csv文件

、、

我想学习如何使用Docker部署应用程序，我正在使用这个简单的python程序，它将一些数据写入当前工作目录中的csv文件。我可以在本地计算机上的当前工作目录中看到output.csv文件，但在运行docker镜像时遇到问题。docker container run -v "/Users/Desktop/output_docker" docker_image_name Python代码(scraper.py) impor

浏览 17提问于2019-05-24得票数 6

回答已采纳

2回答

git忽略了“git加法”命令

我要去：当我获得git状态时，没有添加任何内容：On branch python modified: __pycache__/web_scraper.cpython-38.pyc Unt

浏览 3提问于2019-12-18得票数 2

回答已采纳

2回答

Crontab在raspberry pi上启动python脚本会导致导入错误

、、、、

我用Python编写了一个web 刮板，我想每天运行一次。我认为使用sudo crontab -e是一种很好的方法。我遇到的问题是，当cronjob启动我的python脚本时，python脚本抛出一个导入错误而不运行。但是，当我从命令行直接执行python脚本时，它将运行而不会出现问题。我读到一些人使用shell脚本来启动python脚本，所以我也尝试了。同样，当我直接从命令行执行shell脚本时，

浏览 1提问于2017-03-18得票数 0

回答已采纳

1回答

没有找到导入模块？

、、

我被告知如下：(venv) USERs-MacBook-Pro:Scraper user$ /usr/local/opt/python@3.9/bin/python3.9 /Users/user/git/ML/Python/Practice/Scraper/Scraper</em

浏览 1提问于2020-12-23得票数 0

回答已采纳

2回答

如何使用cron自动化Raspberry Pi上的Python编程？

、、、、

我正在用Python构建一个基本的推特爬行器，我想在我的RaspPi 4b上每小时运行一次。脚本已经编写好了，当使用以下命令从终端调用它时，它可以完美地工作 python scraper.py 现在，我想让它自动运行，而不需要我自己的物理提示。我用脚本执行了chmod，然后打开crontab，并使用编辑器添加了这一行(我知道这是为了每一分钟，我只想看到它工作)： * * * * * /usr/bin/python home/pi&

浏览 19提问于2020-01-04得票数 1

回答已采纳

1回答

当使用来自导入另一个自定义模块的自定义模块的函数时为ModuleNotFoundError

、、、、

我有一个类似于此的文件夹结构(我的示例包含所有必需的部分)： scraper.py __init__.pyimport config # Do some web stuff...但是，当我运行scraper.py时，我得到

浏览 2提问于2021-01-09得票数 0

1回答

Python请求[Errno 111]在服务器上运行时拒绝连接，但在本地PC上拒绝

、、

_dns_host, self.port), self.timeout, **extra_kw) File "/home/jken/virtualenv/web-scraper/3.6/lib/python

浏览 3提问于2019-03-31得票数 8

3回答

Python Web Scraper + Cleanup

、、、、

所以我现在正在尝试导出一个twitter的.html页面，并且我使用BeautifulSoup创建了这个网页爬行器。

浏览 3提问于2017-12-06得票数 0

2回答

Docker + Django，docker-compose似乎不运行迁移命令

、、、

它的要求是它必须在Docker上运行，这给我带来了以下问题:当使用docker-复合映像时，正在正确构建映像，db服务运行，但是我得到一个错误，它说我的DB中的关系不存在。article_link" FROM "scraper_article" web_1 | /usr/local/lib/python3.7/site-packages/psycopg2/__init_article_link"

浏览 0提问于2018-10-12得票数 0

回答已采纳

3回答

/usr/bin/env python3

、

它要求我安装python 3和anaconda。在故障排除和安装之后，我已经获得了运行脚本所需的所有先决条件。 % #!/usr/bin/env python3 import hockey_scraper 现在我得到了"zsh: event not : /u

浏览 1提问于2019-08-02得票数 0

回答已采纳

2回答

读取csv；替换数值并保存在csv上

、、

Page_Clean_test.csv', 'w+', delimiter=';', skiprows=0, low_memory=False) clean_order.

浏览 1提问于2020-08-17得票数 0

1回答

cx_freeze可执行文件在Geckodriver上运行不会很好

、、、

我正在开发一款GUI桌面应用程序，让用户可以控制web抓取器。我有两个可执行文件，一个运行Selenium scraper (Py27)，另一个运行图形用户界面，它使用subprocess.Popen (Python38)启动和停止scraper。不幸的是，在两个应用程序中使用相同的Python版本现在对我来说是不可能的。尽管我们似乎没有因为Python版本差异而遇到环境问题。我可以毫无问题地手动运行这两个exe，但当我尝试通过GUI运行scr

浏览 40提问于2020-06-12得票数 0

1回答

使用pdftotext导入错误-在平面命名空间中找不到符号

、、、、

我在运行python脚本时遇到问题。我正在使用python2.7运行最新版本的MacOS。 from common.coned.bill_scraper import RE_TOTAL_CHARGES_TYPE File/scraper.py"

浏览 24提问于2022-08-27得票数 1

1回答

使用Python3进行with抓取-忽略重复的属性错误

、、、、

我想使用Python 3创建一个web抓取应用程序。我正在努力刮的网站包含无效的xhtml，因为它有带有重复属性名的标记。 scraper.list() dom = parseString(response.text) File"C:\Python34\lib\xml\dom\mi

浏览 4提问于2015-08-09得票数 2

回答已采纳

1回答

使用Web::Scraper从.onion站点中刮取

、、、、

问题:使用网站：：刮刀从tor .onion站点上刮走现行守则：my $piratelink=$PIRATEBAYSERVER.'/search/' .'/0/7/0'; my $ns = scraper

浏览 1提问于2016-04-17得票数 1

回答已采纳

点击加载更多