[Linux] 解压zip文件中文乱码问题解决

在Linux下,解压电脑上的.zip文件时,有时候由于编码问题,中文文件名或者文件夹名会出现乱码……

为了方便,于是自己写了一个python的解压.zip文件的脚本,亲测可用。

脚本myunzip.py

#!usr/bin/env python2
# -*- coding utf-8

import os
import sys
import zipfile

print "processing File " + sys.argv[1]

file = zipfile.ZipFile(sys.argv[1], "r");
for name in file.namelist():
    utf8name=name.decode('gbk')
    print "Extracting " + utf8name
    pathname = os.path.dirname(utf8name)
    if not os.path.exists(pathname) and pathname != "":
        os.makedirs(pathname)
    data = file.read(name);
    if not os.path.exists(utf8name):
        fo = open(utf8name, "w")
        fo.write(data)
        fo.close
file.close()

解压文件时,直接执行:

$ python myunzip.py xxx.zip

或者,先增加可执行权限,然后执行:

$ chmod +x myunzip.py
$ ./myunzip.py xxx.zip

Example:

附录(Linux下使用enca查看文件编码并转换)

在Linux做开发或者系统管理遇到乱码是经常的事情,主要Windows下中文的编码多用GB2312和GBK,而Linux下是UTF-8。很多时候 涉及到和Windows平台系统的通信免不了编码的转化,可能大部分人都用iconv库函数(包含在glib中)和iconv命令来执行编码转换,今天我要推荐的是另一个shell下编码转换工具enca。用它不仅可以转换编码,还可以查看文件的原始编码,使用上也比iconv方便一些。

Ubuntu下安装enca很简单,apt-get一下就行了。

$ sudo apt-get install enca

enca用法如下:

  • enca -L zh_CN file  检查文件的编码
  • enca -L zh_CN -x UTF-8 file  将文件编码转换为”UTF-8″编码
  • enca -L zh_CN -x UTF-8 < file1 > file2  如果不想覆盖原文件可以这样

除了有检查文件编码的功能以外,”enca”还有一个好处就是如果文件本来就是你要转换的那种编码,它不会报错,还是会print出结果来, 而”iconv”则会报错。这对于脚本编写是比较方便的事情。

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏三木的博客

mysql数据库及django用户名启用中文的方法

mysql数据库启用中文 在mysql的配置文件/etc/my.cnf的[mysqld]下加入 character_set_server=utf8 Django...

33580
来自专栏圆方圆学院精选

【刘文彬】RPC的基础:调研EOS插件http_plugin

原文链接:醒者呆的博客园,https://www.cnblogs.com/Evsward/p/httpPlugin.html

14310
来自专栏Java帮帮-微信公众号-技术文章全总结

Java基础-01总结概述,dos,功能键,path

1:计算机概述(了解) (1)计算机 (2)计算机硬件 (3)计算机软件 系统软件:window,linux,mac 应用软件:qq,yy,飞秋 (...

381130
来自专栏专注数据中心高性能网络技术研发

[Effective Modern C++(11&14)]Chapter 7: The Concurrency API

21850
来自专栏Java技术栈

Maven Optional & Exclusions使用区别

Optional和Exclusions都是用来排除jar包依赖使用的,两者在使用上却是相反。 Optional定义后,该依赖只能在本项目中传递,不会传递到引用该...

34690
来自专栏python3

python3--基础综合练习题

允许用户最多尝试3次,3次都没猜对的话,就直接退出,如果猜对了,打印恭喜信息并退出

33130
来自专栏木子昭的博客

百度贴吧 | 通用抓图脚本搞专业爬虫的话,先保证网速够好,再考虑多进程还是多线程~

多进程优势:单个进程的崩溃,不会影响其它进程 随之而来的问题是,进程之间,资源不共享,信息不共享,所以进程通讯的问题,是实现多进程协作,必须解决的问题 ...

400120
来自专栏阮一峰的网络日志

PHP最佳实践

虽然名字叫《PHP最佳实践》,但是它主要谈的不是编程规则,而是PHP应用程序的合理架构。

29210
来自专栏全沾开发(huā)

使用postman进行API自动化测试

使用postman进行API自动化测试 最近在进行一个老项目的升级,第一步是先将node版本从4.x升级到8.x,担心升级会出现问题...

65270
来自专栏木头编程 - moTzxx

微信小程序Ⅳ [js文件的外部引用]

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/u011415782/article/de...

90520

扫码关注云+社区

领取腾讯云代金券