对比获取文件Content-Type的四种方法

先放一个链接:HTTP Content-Type在线工具 后面会用到。

有时候我们需要获取本地文件的Content-Type,我已知的是 Java 中自带了三种方式来获取文件类型。

另外还有第三方包 Magic 也提供了API。Magic依赖:

        <dependency>
            <groupId>net.sf.jmimemagic</groupId>
            <artifactId>jmimemagic</artifactId>
            <version>0.1.4</version>
        </dependency>

下面我们来通过单元测试看下这四种方式的效果。主要代码:

    @Test
    public void test() {
        String pathname = "D:\\...";

        try {
            Magic parser = new Magic() ;
            MagicMatch match = parser.getMagicMatch(new File(pathname),false);
            System.out.println("第一种Magic: " + match.getMimeType()) ;
        } catch (MagicParseException e) {
            e.printStackTrace();
        } catch (MagicMatchNotFoundException e) {
            e.printStackTrace();
        } catch (MagicException e) {
            e.printStackTrace();
        }

        String type = new MimetypesFileTypeMap().getContentType(new File(pathname));
        System.out.println("第二种javax.activation: "+type);

        try {
            String s = Files.probeContentType(new File(pathname).toPath());
            System.out.println("第三种java.nio: "+s);
        } catch (IOException e) {
            e.printStackTrace();
        }

        FileNameMap fileNameMap = URLConnection.getFileNameMap();
        String contentType = fileNameMap.getContentTypeFor(pathname);
        System.out.println("第四种java.net: "+contentType);
    }

No.1,新建文本文件更名为new.json,测试。

log4j:WARN No appenders could be found for logger (net.sf.jmimemagic.Magic).
log4j:WARN Please initialize the log4j system properly.
net.sf.jmimemagic.MagicMatchNotFoundException
....
第二种javax.activation: application/octet-stream
第三种java.nio: null
第四种java.net: null

可以看到,Magic直接抛了异常。javax.activation提示不知道的二进制流。nio 和 net 报null。就此次来说,第2,3, 4种方法对未知类型的处理都可以。唯有第一种不令人满意。

接下来随便写入字符串到new.json文件。然后运行。

第一种Magic: text/plain
第二种javax.activation: application/octet-stream
第三种java.nio: null
第四种java.net: null

Magic提示的是文本类型,javax.activation提示不知道的二进制流。nio 和 net 方式直接为null。Magic胜出。

接下来把new.json文件改名为new.xml文件。再次运行。

第一种Magic: text/plain
第二种javax.activation: application/octet-stream
第三种java.nio: text/xml
第四种java.net: application/xml

javax.activation又提示不知道的二进制流。其它几个提示的都差不多是文本类型,还算靠谱。

再把文件更名为new.html,运行。

第一种Magic: text/plain
第二种javax.activation: text/html
第三种java.nio: text/html
第四种java.net: text/html

可以看到,除了Magic提示文本类型,其它都是html,很准确。

再次把文件改为new.png,运行。

第一种Magic: text/plain
第二种javax.activation: application/octet-stream
第三种java.nio: image/png
第四种java.net: image/png

我们再把pathname改为一张真实图片的地址,运行。

第一种Magic: image/png
第二种javax.activation: application/octet-stream
第三种java.nio: image/png
第四种java.net: image/png

这时Magic的运行结果和上次又不相同。可见,Magic并不是通过文件扩展名来对文件类型进行判定的。

总结

nio 和 net的方式区别不大。Magic的异常是一个坑。javax.activation大部分只报application/octet-stream。

建议使用nio 与javax.activation 结合的方法。代码如下:

    public String getContentType() {
        //利用nio提供的类判断文件ContentType
        Path path = Paths.get(getUri());
        String content_type = null;
        try {
            content_type = Files.probeContentType(path);
        } catch (IOException e) {
            logger.error("Read File ContentType Error");
        }
        //若失败则调用另一个方法进行判断
        if (content_type == null) {
            content_type = new MimetypesFileTypeMap().getContentType(new File(getUri()));
        }
        return content_type;
    }

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏Java学习网

Java Web Response对象的27个方法及状态码

response表示HttpServletResponse对象,主要将JSP容器处理后的结果传回到客户端。 ? 网络配图 1、void addCookie(...

54870
来自专栏me的随笔

ASP.NET MVC5中View-Controller间数据的传递

使用ASP.NET MVC做开发时,经常需要在页面(View)和控制器(Controller)之间传递数据,那么都有哪些数据传递的方式呢?

18110
来自专栏冰霜之地

Weex 中别具匠心的 JS Framework

为了达到所有页面在用户端达到秒开,也就是网络(JS Bundle下载)和首屏渲染(展现在用户第一屏的渲染时间)时间和小于1s。

39730
来自专栏老马说编程

(64) 常见文件类型处理: 属性文件/CSV/EXCEL/HTML/压缩文件 / 计算机程序的思维逻辑

查看历史文章,请点击上方链接关注公众号。 对于处理文件,我们介绍了流的方式,57节介绍了字节流,58节介绍了字符流,同时,也介绍了比较底层的操作文件的方式,60...

44280
来自专栏零基础使用Django2.0.1打造在线教育网站

零基础使用Django2.0.1打造在线教育网站(七):数据库字段的定义(上)

努力与运动兼备~有任何问题可以加我好友或者关注微信公众号,欢迎交流,我们一起进步!

41760
来自专栏逆向技术

PE格式第六讲,导出表

                PE格式第六讲,导出表 请注意,下方字数比较多,其实结构挺简单,但是你如果把博客内容弄明白了,对你受益匪浅,千万不要看到字...

20260
来自专栏我有一个梦想

QT Creator 快速入门教程 读书笔记(三)

一   信号和槽   GUI 程序除了要绘制控件,还要响应系统和用户事件,例如重绘、绘制完成、点击鼠标、敲击键盘等。当事件发生时,UI 会产生相应的变化,让用户...

30280
来自专栏Python研发

Django之Model世界

django为使用一种新的方式,即:关系对象映射(Object Relational Mapping,简称ORM)

15420
来自专栏JetpropelledSnake

Django学习笔记之Django Form表单

14440
来自专栏生信宝典

Linux学习-文件排序和FASTA文件操作

环境变量的补充 PATH只是众多环境变量中的一个变量,用于存储可执行文件所在的目录,以便在用户输入命令时可以查询的到。尤其是自己写的脚本或安装的程序,系统不会知...

288100

扫码关注云+社区

领取腾讯云代金券