首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >使用curl通过终端下载站点图片

使用curl通过终端下载站点图片
EN

Stack Overflow用户
提问于 2012-10-18 21:45:03
回答 1查看 7.3K关注 0票数 0

我正试图从一个网站下载一大批图片到我的Mac上。我可以用DownloadThemAll,SiteSucker等下载较小的图片,但它们还不够深入。所以我不得不跳进终端,这有点超出了我的舒适区,我的技能有点生疏。

我已经尝试了一下下面的脚本:

代码语言:javascript
复制
curl -O http://www.domain.co.uk/system/images/[1-1000]/original/*.jpg

这个脚本可以工作,我可以看到终端正在下载图像文件,但是我遇到的问题是文件被*.jpg覆盖了,并且没有按顺序生成它们,例如1.jpg、2.jpg、3.jpg等,甚至没有使用它们的原始名称。最初的jpg名称使用随机数字/字母(例如LIC0145_websource.jpg),这就是为什么我尝试用*.jpg来补充它。我想知道我遗漏了哪段代码来告诉终端下载这些图像。

我也试着调用下面的shell脚本,但遇到了‘意外的文件结尾’

代码语言:javascript
复制
#!/bin/bash
for i in `seq 1 1000`;
do
input=http://www.domain.co.uk/system/images/$i/original/*.jpg
output=$i.jpg
#   echo $input, $output
curl --output $output --remote-name $input
done

我认为curl选项可能仍然是更好的选择,但如果有人有任何修复或其他解决方案,请让我知道。

EN

回答 1

Stack Overflow用户

发布于 2012-10-18 21:58:25

你可以用wget (我知道那不是curl)做这样的事情:

代码语言:javascript
复制
wget --no-parent --accept=jpg,jpeg,htm,html --mirror  http://somedomain/ 

然后CD到目录,并发出一个

代码语言:javascript
复制
find ./ \( -iname '*.htm' -o -iname '*.html' \) -exec rm {} \;
票数 -1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/12956165

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档