Linux乱码问题解决方案

linux系统中文件名内容为urf8编码, windows系统中文件名默认为gbk编码, 多数文档使用gbk编码,系统采用utf8编码

无中文输入法导致的乱码

1、ibus输入法

Ubuntu 系统安装后已经自带了ibus输入法,在英语环境下默认不启动。配置ibus自动启动可以在ubuntu系统菜单上选择System --- Preferences --- Startup Applications,在该窗口中增加一个程序:

Name: ibus-daemon
Command: ibus-daemon -d -x -r

ibus默认提供的中文输入法比较弱智,需要额外安装ibus-pinyin,命令如下:

sudo apt-get install ibus-pinyin

这时,还需要将ibus-pinyin输入法启动。在ubuntu系统菜单上选择System --- Preferences --- IBus Preferences,在Input Method页中的“Select an input method”下拉框中选择增加Chinese – Pinyin,就是图标中有个一个大大的“拼”字的那一个,然后点击Add按钮,最后通过Up按钮将该输入法移动到最上面。系统重启后,通过Ctrl + 空格即可调出ibus输入法。ibus输入法总体来说不错,但是在我的环境下发现无法在部分Java程序中调出来,例如Netbeans、OpenProj。

2、fcitx输入法

由于ibus的缺陷,所以我尝试了fcitx,使用下来也非常不错,而且可以在Java程序中正常使用,只是在这种情况下光标跟随有些问题,输入界面会停 留在屏幕最下端,但是可以接受,比起ibus不能使用要好多了。

安装fcitx:

sudo apt-get install fcitx

启动fcitx:

im-switch -s fcitx

注销后重新登录,fcitx就会生效。如果需要切换回ibus,可以运行im-switch -s ibus,然后注销,重新登录。fcitx同样可以通过Ctrl + 空格调出,这时会发现fcitx显示的中文是方框,因此需要修改fcitx的配置。Fcitx的配置文件在~/.fcitx/config,该文件为 GBK编码,在Ubuntu下显示不正常,可以通过如下方式操作:

cd ~/.fcitx
iconv -f gbk -t utf8 config > config.tmp

编辑config.tmp文件:

显示字体(中)=WenQuanYi Micro Hei
显示字体大小=10
使用粗体=0

保存退出,然后运行命令:

iconv -f utf8 -t gbk config.tmp > config

注销后重新登录,fcitx显示正常。

对于搜狗输入候选字乱码问题,先运行

sudo apt-get install fcitx-module-kimpanel

然后注销或者重启,一般就可以了

utf8 和 UTF-8 有什么区别

“UTF-8”是标准写法,在windows下边英文不区分大小写,所以也可以写成“utf-8”。“UTF-8”也可以把中间的“-”省略,写成“UTF8”。一般程序都能识别,但也有例外(如下文),为了严格一点,最好用标准的大写“UTF-8”。只有在MySQL中可以使用“utf-8”的别名“utf8”,但是在其他地方一律使用大写“UTF-8”。

网页上Flash中的中文显示为方框的解决办法

编辑/etc/fonts/conf.d/49-sansserif.conf文件,作如下修改:

<edit name="family" mode="append_last">
<string>WenQuanYi Micro Hei</string>
</edit>

Java程序部分中文显示为方框的解决办法

在$JAVA_HOME/jre /lib/fonts目录下建立fallback目录,将中文字体文件复制(或link)到fallback目录。

sudo mkdir $JAVA_HOME/jre/lib/fonts/fallback
sudo ln /usr/share/fonts/truetype/wqy/wqy-microhei.ttc $JAVA_HOME/jre/lib/fonts/fallback/

“GBK乱码”,参考

乱码的样子类似:

à??ü òá??à3?£???1,°2à??ü òá??à3?£???1

解决方法:

convmv -r -f utf8 -t iso88591 --notest --nosmart * && convmv -r -f gbk -t utf8 --notest --nosmart * # 把乱码文件名文件复制在一个空目录里运行(这样错了也不怕):

“ascii乱码”参考

乱码的样子类似:

%E5%8C%BB%E4%BF%9D

解决方法:

1.使用uni2ascii 代码:echo 乱码原文 | ascii2uni -a J 2.安装nautilus-filename-repairer0.06(官方有源码,但是依赖问题,我还没安装成功,而0.05版与现在的nautilus有点小小的合作障碍,只能看不能改名) 3.用chromeplus-1.3.3.1下载(因为这类乱码主要在用ff(默认utf8)下载qq群里的文件之后产生,用chromeplus(默认GBK)下就没问题了)

另外,至于文件里面内容的乱码问题可以搜索enca.

解决Rhythmox乱码问题:

安装Rhythmox:sudo apt-get install rhythmbox
安装mid3iconv:sudo apt-get install python-mutagen
mid3iconv -h

Clementine乱码问题

安装mid3iconv:sudo apt-get install python-mutagen
mid3iconv -h

Clementine不支持utf8,需要吧所有的mp3歌曲转换为gbk格式,wma好像不用转就可以

mid3iconv -e gbk *.mp3(由于不能带-r参数,所以要依次进入每个文件夹)

另外clementine采用gstreamer作为后端,需要安装gstreamer插件:

  • 如果想支持mp3,需要安装gstreamer-0.10-plugins-bad和gstreamer-0.10-plugins-ugly
  • 如果想支持wma,需要安装gstreamer-0.10-ffmpeg
  • 如果想支持mms流媒体,需要安装gstreamer plugins for mms

另外Clementine基于Amarok,所以支持Amarok的插件一般都支持Clementine,比如osdlyrics。

转换文件内容编码:

file -i <file name> 检测文件编码
iconv --help

转换文件名编码

sudo apt-get install convmv
convmv --help
convmv -f gbk -t utf8 -r --notest files
convmv -r -f utf8 -t iso88591 * --notest --nosmart && convmv -r -f gbk -t utf8 * --notest --nosmart

解决gedit乱码问题:

gsettings set org.gnome.gedit.preferences.encodings auto-detected "['GB18030', 'GB2312', 'GBK', 'UTF-8', 'BIG5', 'CURRENT', 'UTF-16']"
gsettings set org.gnome.gedit.preferences.encodings shown-in-menu "['GB18030', 'GB2312', 'GBK', 'UTF-8', 'BIG5', 'CURRENT', 'UTF-16']"

解决PDF中文乱码:

sudo apt-get install poppler-data

解决rar文件乱码

使用rar

解压zip文件乱码

最近碰到这个问题,网上搜了一圈,都是什么unzip -O,一点用都没有,这些哥们估计是直接复制,用都没用过。后来找了个终极方法,用python的脚本来解压,试了下,还真管用!!!以下为python脚本的代码,新建文件jieya.py,写入以下代码:

    #!/usr/bin/env python
    # -*- coding: utf-8 -*-

    import os
    import sys
    import zipfile

    print "Processing File " + sys.argv[1]
    file=zipfile.ZipFile(sys.argv[1],"r");
    for name in file.namelist():
        utf8name=name.decode('gbk')
        print "Extracting " + utf8name
        pathname = os.path.dirname(utf8name)
        if not os.path.exists(pathname) and pathname!= "":
            os.makedirs(pathname)
        data = file.read(name)
        if not os.path.exists(utf8name):
            fo = open(utf8name, "w")
            fo.write(data)
            fo.close
    file.close()

然后zip文件跟jieya.py放在同一级目录,运行命令python jieya.py file.zip,哦了!

smplayer 中文字幕乱码解决方法

  1. 打开选项-》首选现:选择字幕选项卡。
  2. 找到“默认字符编码”选项,在下拉框中选择“简体中文(cp936)”
  3. 再打开“字体”页卡(上边),选择“系统字体”在下拉选框中选择一种简体中文字体,如 Weu Quanyi Zen Hei 等。

VLC播放器显示文件名乱码

初选项中修改一种支持中文的字体

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏更流畅、简洁的软件开发方式

【自然框架】 页面里的父类——把共用的东东都交给父类,让子类专注于其他。

【类图】 ? 【命名空间】——————————————————【文件截图】 ? ? 可能您会问,不就是弄个父类吗,怎么又是这么复杂呢?这个嘛,听...

23780
来自专栏用户2442861的专栏

webStorm 3.0配置使用主题背景色等

http://www.cnblogs.com/jikey/archive/2012/01/16/2323590.html

29210
来自专栏猿人谷

有趣的Linux命令行效果

有趣的Linux命令行功效 1. Linux"sl"命令行 尽管"sl"代表了"蒸汽机机头",但它是用来提醒那些命令行控们别把"ls"打成了"sl"。让我们看看...

28180
来自专栏阮一峰的网络日志

JavaScript 运行机制详解:再谈Event Loop

一年前,我写了一篇《什么是 Event Loop?》,谈了我对Event Loop的理解。 上个月,我偶然看到了Philip Roberts的演讲《Help, ...

43370
来自专栏Danny的专栏

【MyEclipse】——MyEclipse设置注释模板

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/huyuyang6688/article/...

13530
来自专栏编程

14个你可能不知道的JavaScript调试技巧

问题:我怎么才能收到你们公众号平台的推送文章呢? ? 熟悉工具可以让工具在工作中发挥出更大的作用。尽管江湖传言 JavaScript 很难调试,但如果你掌握了几...

21090
来自专栏林冠宏的技术文章

关于在用curl函数post网页数据时,遇上表单提交 type为submit 类型而且没有name和id时可能遇到的问题及其解决方法

curl函数库实现爬网页内容的链接在 http://www.cnblogs.com/linguanh/p/4292316.html 下面这个是没有name和id...

21370
来自专栏大学生计算机视觉学习DeepLearning

VS下如何建立一个新的MFC程序 网络编程 课设 基于C++ MFC 连接数据库 小应用 小项目浅析展示

45030
来自专栏互联网杂技

Event Loop

一、为什么JavaScript是单线程? JavaScript语言的一大特点就是单线程,也就是说,同一个时间只能做一件事。那么,为什么JavaScript不能有...

31270
来自专栏奔跑的蛙牛技术博客

angular2.0+ 模块之间共享service并订阅更新

之前试过用“eventEmitter”想再值变动之后发射出去,但是在“ChildComponent”接受不到值的变化,通过查阅得知“eventEmitter”只...

32430

扫码关注云+社区

领取腾讯云代金券