首页
学习
活动
专区
工具
TVP
发布
社区首页 >问答首页 >Ruby 1.9:如何正确地大小写多字节字符串?

Ruby 1.9:如何正确地大小写多字节字符串?
EN

Stack Overflow用户
提问于 2009-12-16 05:34:58
回答 2查看 17.1K关注 0票数 56

因此,matz决定将upcasedowncase限制为Ruby1.9.1中的/[A-Z]/i

长期以来,ActiveSupport::Multibyte通过String#mb_chars在Ruby1.8.x中有很好的i18n用例。

然而,当在ruby 1.9.1下尝试时,它似乎不起作用。下面是我写的一个简单的测试脚本,以及我得到的输出:

代码语言:javascript
复制
$ cat test.rb
# encoding: UTF-8

puts("@ #{RUBY_VERSION} " + (__ENCODING__ rescue $KCODE).to_s)
sd, su = "Iñtërnâtiônàlizætiøn", "IÑTËRNÂTIÔNÀLIZÆTIØN"
def ps(u, d, k); puts "%-30s:  %24s / %-24s" % [k, u, d] end
ps sd.upcase, su.downcase, "Plain ruby"

require 'rubygems'; require 'active_support'
ps sd.upcase, su.downcase, "With active_support"
ps sd.mb_chars.upcase.to_s, su.mb_chars.downcase.to_s, "With active_support mb_chars"

$ ruby -KU test.rb
@ 1.8.7 UTF8
Plain ruby                    :  IñTëRNâTIôNàLIZæTIøN / iÑtËrnÂtiÔnÀlizÆtiØn
With active_support           :  IñTëRNâTIôNàLIZæTIøN / iÑtËrnÂtiÔnÀlizÆtiØn
With active_support mb_chars  :  IÑTËRNÂTIÔNÀLIZÆTIØN / iñtërnâtiônàlizætiøn

$ ruby1.9 test.rb
@ 1.9.1 UTF-8
Plain ruby                    :      IñTëRNâTIôNàLIZæTIøN / iÑtËrnÂtiÔnÀlizÆtiØn
With active_support           :      IñTëRNâTIôNàLIZæTIøN / iÑtËrnÂtiÔnÀlizÆtiØn
With active_support mb_chars  :      IñTëRNâTIôNàLIZæTIøN / iÑtËrnÂtiÔnÀlizÆtiØn

那么,如何使用Ruby1.9.1获得国际化的upcasedowncase呢?

更新

我应该补充说,我还使用ActiveSupport在GitHub的当前master2-3-*3-0-unstable rails分支进行了测试。同样的结果。

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2009-12-16 06:30:07

大小写转换依赖于区域设置,并不总是往返的,这就是为什么Ruby1.9没有涵盖它(参见herehere)。

unicode-util gem应该能满足您的需求。

票数 39
EN

Stack Overflow用户

发布于 2016-06-24 22:45:03

大小写转换很复杂,而且依赖于区域设置。幸运的是,Martin Dürst在Ruby2.4中添加了full Unicode case mapping

代码语言:javascript
复制
puts RUBY_DESCRIPTION

sd, su = "Iñtërnâtiônàlizætiøn", "IÑTËRNÂTIÔNÀLIZÆTIØN"
def ps(u, d, k); puts "%-30s:  %24s / %-24s" % [k, u, d] end 
ps sd.upcase,              su.downcase,              "Ruby 2.4 (default)"
ps sd.upcase(:ascii),      su.downcase(:ascii),      "Ruby 2.4 (ascii)"
ps sd.upcase(:turkic),     su.downcase(:turkic),     "Ruby 2.4 (turkic)"
ps sd.upcase(:lithuanian), su.downcase(:lithuanian), "Ruby 2.4 (lithuanian)"
ps "-",                    su.downcase(:fold),       "Ruby 2.4 (fold)"

输出:

代码语言:javascript
复制
ruby 2.4.0dev (2016-06-24 trunk 55499) [x86_64-linux]
Ruby 2.4 (default)            :      IÑTËRNÂTIÔNÀLIZÆTIØN / iñtërnâtiônàlizætiøn
Ruby 2.4 (ascii)              :      IñTëRNâTIôNàLIZæTIøN / iÑtËrnÂtiÔnÀlizÆtiØn
Ruby 2.4 (turkic)             :      IÑTËRNÂTİÔNÀLİZÆTİØN / ıñtërnâtıônàlızætıøn
Ruby 2.4 (lithuanian)         :      IÑTËRNÂTIÔNÀLIZÆTIØN / iñtërnâtiônàlizætiøn
Ruby 2.4 (fold)               :                         - / iñtërnâtiônàlizætiøn
票数 13
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/1910573

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档