我只想下载tumblr上一页的图片。
例如,http://landscapes.tumblr.com/page/7
当我在浏览器上加载这个页面(我尝试过firefox和chrome)时,只有15张图片,但是当我尝试用wget下载它们时,我得到了60张图片(对应于第7-11页)。用于下载的命令是
wget -H -k -p -R "*avatar*" -A '.jpeg,.jpg,.bmp,.gif,.png' -np -nd -N -erobots=off -i http://landscapes.tumblr.com/page/7
有人能解释一下为什么wget下载的页面比作为参数的页面多,以及如何让它只下载一个页面?提前谢谢你。
发布于 2016-08-17 20:52:53
来自wget手册:
-i file
--input-file=file
从本地或外部文件读取URL。
...
-p
--page-requisites
此选项导致Wget下载正确显示给定页面所需的所有文件。这包括内联的图像、声音和引用的样式表。
由于您的命令包含这两种内容,所以您将检索原始页面、从中链接的所有内容(包括后面的所有页面),以及每个页面的所有必要条件。
删除-i
后,它只获取原始页面的必要条件。
https://unix.stackexchange.com/questions/303985
复制相似问题