python 的第三方包glob识别特定格式的文件
在做kaggle的猫狗识别的比赛时,要对图片来分区是猫还是狗,glob包起了很大的作用。下面来用例子说明:
from glob import glob
import os
os.chdir("E:\\Windows.old\\Users\\zhangxiang\\Desktop\\tensorflow_learning\\tensorflowCatVsDog-master")
files_path = './train'
#构建匹配的模板
cat_files_path = os.path.join(files_path, 'cat*.jpg')
dog_files_path = os.path.join(files_path, 'dog*.jpg')
print (cat_files_path)
结果: ./train\cat*.jpg 用于匹配猫的图片
下面来把所有猫的图片找出来,以及是狗的图片也找出来。
#glob,找出所有匹配的图片
cat_files = glob(cat_files_path)
dog_files = glob(dog_files_path)
print(dog_files[0:10])
结果: [‘./train\dog.0.jpg’, ‘./train\dog.1.jpg’, ‘./train\dog.10.jpg’, ‘./train\dog.100.jpg’, ‘./train\dog.1000.jpg’, ‘./train\dog.10000.jpg’, ‘./train\dog.10001.jpg’, ‘./train\dog.10002.jpg’, ‘./train\dog.10003.jpg’, ‘./train\dog.10004.jpg’]
这样就可以把猫和狗的图片找出来。
代码和数据:
https://github.com/zhangdm/Hello-World/tree/master/python_glob_识别特定类的图片