我只是想在Django项目中开发一个翻译应用程序,使注册用户能够翻译它在最新版本中出现的每一条消息。
我的问题是,在这个翻译应用中,我应该为数据库表使用什么字符集?看起来有些欧洲语言字符不能存储在UTF-8中?
发布于 2010-03-13 23:38:00
看起来有些欧洲语言的字符不能存储在UTF-8中?
不是这样的。UTF-8可以无限制地存储任何字符集,可能除了Klingon之外。UTF-8是您国际化的一站式商店。如果你在字符方面有问题,他们很可能是编码问题,或者在你用来显示数据的字体中缺少对该字符范围的支持(虽然对于欧洲语言字符来说非常不可能,但在欧洲计算机上查看印度网站时是很常见的。另请参阅this question)
如果不能呈现非西方字符集,则可能是用户的内置字体没有覆盖该范围的UTF-8。
更新: Klingon它确实不是的一部分:
在ConScript统一码注册表中列出了一些尚未包含在统一码中的现代发明脚本(例如,Tengwar),或者由于缺乏实际使用而不符合纳入统一码的条件(例如,克林贡语),以及非官方但广泛使用的专用区号分配。
然而,有一个volunteer project在私有区域中非正式地将代码点F8D0-F8FF分配给了克林贡语。
发布于 2010-03-13 23:37:53
UTF-8可以用来表示所有的Unicode,所以它不能让你表达所有的通用语言。它允许你表达所有的语言。
如果一些欧洲字符看起来不能工作,那就是编码问题。
https://stackoverflow.com/questions/2438896
复制相似问题