【开源】采集1024的图片到WordPress,图床只支持chevereto

要本地打包的在90行前加这个把

  1. def package_pic(name):
  2.     cmd1 = ‘zip -q -r ‘ + name + ‘.zip temp/*.jpg’
  3.     os.system(cmd1)

再在112行后加新建一行加

  1. package_pic(tittle)

打包后就存在当前目录里

============2.23更新(上面)===============

不知道有没有大佬需要用

把eqblog的两个脚本综合了一下

本脚本只支持python3,需要将系统语言设置成utf8

因为实在不会改多进程,所以还是用的他原来的多线程

没啥技术含量,大佬们看看就好

限制了采集速度,采集一篇和后停止一分钟,不需要可以删除代码121行

没有做记录,停止程序后,会从第一页重新开始,遇到一样的,会报图床错误,然后跳过继续采集。。有点小麻烦就是了,但是这样在1024有人发新帖后,又可以直接采集到新的图片

开源地址

https://github.com/ishkong/1024_img_spider_wordpress

更多的介绍 readme.md里有,存在的bug可能和他原来的bug差不多,但是不影响使用

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏前端之路

web安全之XSS攻击

1483
来自专栏静晴轩

生成lua的静态库.动态库.lua.exe和luac.exe

前些日子准备学习下关于lua coroutine更为强大的功能,然而发现根据lua 5.1.4版本来运行一段代码的话也会导致 “lua: attempt to ...

84111
来自专栏猛牛哥的博客

debian使用LVM扩展第二块硬盘

1624
来自专栏WindCoder

Windows 7下硬盘安装Ubuntu 13.10图文教程

之前一直在虚拟机里玩Linux了,昨天忽然兴起想往真机里装一个,昨天找到的方法,今天折腾了半天终于装好啦。

1601
来自专栏沈唁志

LNMP 下 memcached 常用指令收集整理笔记

1783
来自专栏互联网杂技

AngularJS数据源的多种获取方式汇总

诸位看完转发一下,促进感兴趣的同学,共同交流。 在AngularJS中获取数据源的方式有很多种,本文给大家整理几种获取数据源的方式,对angularjs获取数据...

3239
来自专栏我有一个梦想

Python 项目实践三(Web应用程序)第五篇

 接着上节继续学习,在这一节,我们将建立一个用户注册和身份验证系统,让用户能够注册账户,进而登录和注销。我们将创建一个新的应用程序,其中包含与处理用户账户相关的...

2138
来自专栏杂七杂八

pip安装提示PermissionError: [WinError 5]错误问题解决

今天想要更新gensim包,结果发现pip install --upgrade gensim,命令最后报错,提示PermissionError,我就想是不是权限...

3517
来自专栏木可大大

XSS攻击与防范

XSS攻击,又称为CSS(Cross Site Scripting),由于CSS已经被用作层叠样式表,为了避免这个冲突,我们将Cross缩写成X。XSS攻击的中...

741
来自专栏蓝天

thrift使用小记

    Thrift是一个跨语言的服务部署框架,最初由Facebook于2007年开发,2008年进入Apache开源项目。Thrift通过一个中间语言(IDL...

1301

扫码关注云+社区