首页
学习
活动
专区
工具
TVP
发布
社区首页 >问答首页 >在字符集之间转换文本文件的最佳方法?

在字符集之间转换文本文件的最佳方法?

提问于 2017-12-19 11:01:54
回答 2关注 0查看 592

什么是在字符集之间转换文本文件的最快速,最简单的工具或方法?

具体来说,我需要从UTF-8转换为ISO-8859-15,反之亦然。

一切顺利:您最喜爱的脚本语言,命令行工具或其他OS,网站等工具。

迄今最好的解决方案:

在Linux / UNIX / OS X / cygwin上:

由Troels Arvin建议的Gnu iconv最适合用作过滤器。这似乎是普遍可用的。例:

代码语言:txt
复制
$ iconv -f UTF-8 -t ISO-8859-15 in.txt > out.txt

正如Ben所指出的那样,有一个使用iconv的在线转换器。

由Cheekysoft建议的Gnu recode(手动)将转换一个或几个文件到位。例:

代码语言:txt
复制
$ recode UTF8..ISO-8859-15 in.txt

这个使用较短的别名:

代码语言:txt
复制
$ recode utf8..l9 in.txt

Recode还支持可用于在不同行结束类型和编码之间转换的表面:

将换行从LF(Unix)转换为CR-LF(DOS):

代码语言:txt
复制
$ recode ../CR-LF in.txt

Base64编码文件:

代码语言:txt
复制
$ recode ../Base64 in.txt

你也可以把它们组合起来。

将带有Unix行尾的Base64编码的UTF8文件转换为带有Dos行尾的Base64编码的拉丁文件1:

代码语言:txt
复制
$ recode utf8/Base64..l1/CR-LF/Base64 file.txt

在与Powershell(Jay Bazuzi)的Windows上:

代码语言:txt
复制
PS C:\> gc -en utf8 in.txt | Out-File -en ascii out.txt

(虽然没有ISO-8859-15的支持,但是支持的字符集是unicode,utf7,utf8,utf32,ascii,bigendianunicode,default和oem。)

意思是iso-8859-1支持?使用“字符串”可以做到这一点,反之亦然

代码语言:txt
复制
gc -en string in.txt | Out-File -en utf8 out.txt

注意:可能的枚举值是“Unknown,String,Unicode,Byte,BigEndianUnicode,UTF8,UTF7,Ascii”。

CsCvt - Kalytta的字符集转换器是Windows的另一个基于命令行的转换工具。

回答

和开发者交流更多问题细节吧,去 写回答
相关文章

相似问题

相关问答用户
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档