三分钟掌握文件格式识别

fleep是一个为Python而写的检测文件类型的库,用法十分简单,功能强大。

使用方法

fleep有一个主函数get(),该函数提取128bytes就能判断一个文件的格式信息。

get()返回的对象有以下几种方法:

type() 返回文件类型列表,如图片、文档、可执行文件、压缩文件

extension() 返回文件格式列表,如图片中有jpg、png、jpeg

mime 以上两种信息都提供,如 image/png

get返回的对象,还能提供检测文件类型与格式,返回布尔值:

type_matches() 检测文件类型,,返回布尔值

extension_matches() 检测文件格式,返回布尔值

mime_matches() 检测文件类型与格式,返回布尔值

使用示例

支持的格式

Image

bmp、gif、ico、jp2、jpeg、png、psd、webp

Video

avi、flv、mkv、mp4、mpg、wmv

Document

doc、docx、epub、pdf、ppt、xls、xlsx、xml

Executable

com、exe、jar

System

cab、cat、dll、sys、sdb、drv

Database

sqlite

数据采集

文本处理分析图片数据处理其他

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180114G00ICZ00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券