前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >yunfile文件下载脚本

yunfile文件下载脚本

作者头像
老高的技术博客
发布2022-12-28 09:31:52
6140
发布2022-12-28 09:31:52
举报
文章被收录于专栏:老高的技术博客

脚本的诞生源自这里python 爬虫求助

脚本内存和CPU占用很低!

回答问题时我的脚本已经完成了60%,昨天凌晨加班完成了,使用到了ORC解析验证码,指定只分析数字!

使用前需要安装很多库,如果需要orc识别,还需要需要你的系统安装Tesseract-OCR,系统是linux的话在这里应该能找到编译好的包,老高用mac一句话就装好了brew install tesseract

requirements.txt

代码语言:javascript
复制
progressbar == 2.3
pyquery == 1.2.9
requests == 2.4.3
Pillow == 2.8.2

可选:

代码语言:javascript
复制
pytesseract = 0.1.6

PIP一键安装依赖

代码语言:javascript
复制
pip install requests progressbar pyquery Pillow pytesseract

可能需要安装的包,用来解决lxml的安装问题!

代码语言:javascript
复制
yum install libxslt-devel libxml2-devel -y

# or

apt-get install libxml2-dev libxslt1-dev -y

测试平台

OSX centos

python 2.6 2.7

使用方法

代码语言:javascript
复制
yunfile_downloader -u xxx -p /tmp/download -adb

-u 下载地址
-a 自动上传(需要bypy配合)
-b 后台下载
-d debug
-p 下载路径 (默认当前文件夹)

# 后台下载查看进度

tail -f /tmp/yunfile.log

获取代码

gist地址

代码语言:javascript
复制
git clone https://gist.github.com/3aa1338b9f4a27b73270.git

获取bypy

记一次bypy的使用

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2015-06-29,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
验证码
腾讯云新一代行为验证码(Captcha),基于十道安全栅栏, 为网页、App、小程序开发者打造立体、全面的人机验证。最大程度保护注册登录、活动秒杀、点赞发帖、数据保护等各大场景下业务安全的同时,提供更精细化的用户体验。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档