我需要检测Ruby中的文件类型和编码。
我目前正在通过UTF gem使用libmagic,但它有一个问题:如果没有magic,它就不能检测UTF16文件。This就是这类文件的一个例子。
$ file -i text_without_bom.txt
text_without_bom.txt: application/octet-stream; charset=binary
有没有其他库或方法可以用来正确检测UTF-16文件?
另外,他们还尝试了rchardet和charlock_holmes,但都没有太多运气。
发布于 2019-02-21 02:48:49
您可以随时切断BOM表并在没有BOM表的情况下处理文件。This描述了如何做到这一点。
https://stackoverflow.com/questions/54792298
复制相似问题