#!/usr/bin/python
#-*- coding: utf-8 -*-
#图片中有大量冗余数据,需要删除,现在有开发跑出有用的图片,并且按照每天生产.txt 文件
#1.遍历按天生产.txt文件,新建一个新的目录,将有用文件都移动到此目录下。让后新老目录名兑换
#样列:http://test.xx.com/v0/app-feed/soft/apk/201202/20120224164134.apk
import os
import shutil
rootdir="/root/python/apk"
apknewdir="/www/v0/app-feed/soft/apknew1"
#开始遍历文件
for parent,dirnames,filenames in os.walk(rootdir):
for filename in filenames:
file_object= open(os.path.join(rootdir,filename),'r')
try:
list_of_all_the_lines=file_object.readlines()
for line in list_of_all_the_lines:
#使用截取字符串,拼接文件名
#apkfilename="/www/"+line.split("/",3)[3]
#通过字符串替换 得到文件名
apkfilename=line.replace("http://test.xx.com","/www")
#apkfilename="/www/v0/app-feed/soft/apk/201202/20120224164134.apk" 取文件名
datedir=apkfilename.split("/",7)[6]
#datedir="201202" 取时间
#判断日期文件夹是否存在,如果不存在就创建,否则就复制文件到新的目录中
if os.path.exists(os.path.join(apknewdir,datedir)):
#shutil.copy(apkfilename,os.path.join(apknewdir,datedir))
print(apkfilename+"_____"+os.path.join(apknewdir,datedir))
else :
os.path.mkdir(os.path.join(apknewdir,datedir))
#print("create"+os.path.join(apknewdir,datedir))
finally:
file_object.close()