前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >2019-11-10-看看藏文里面一共有多少个字吧

2019-11-10-看看藏文里面一共有多少个字吧

作者头像
黄腾霄
发布2020-06-10 14:38:05
7070
发布2020-06-10 14:38:05
举报
文章被收录于专栏:黄腾霄的博客

还记得我10min之前发的2019-11-10-使用StringInfo正确查找字符个数 - huangtengxiao这篇博客么?

你们以为2个Unicode组成的emoji就是极限了么?

这篇文章会带你们体验下世界语言的博大之组合字。


组合字就是说对于某些精妙的语言,多个单独可渲染的文字,放在一起后就会渲染成一个文字。

其中最著名的就是我们的藏文。下图是wiki上的说明,大致意思就是一个藏文基字可以通过加加加好多个字,变成还是一个字。

image-20191110161620779
image-20191110161620779

比如我们可以看到下面两个藏文Unicode的渲染是这样的

image-20191110162106541
image-20191110162106541
image-20191110162116073
image-20191110162116073

但是他们合并起来之后就变成这样了

image-20191110162138381
image-20191110162138381

同样对于སྒྲོ字符,你看着是一个字符,实际上它有4个Unicode编码。

image-20191110162230836
image-20191110162230836

那么问题来了,2019-11-10-使用StringInfo正确查找字符个数 - huangtengxiao博客中提到的SringInfo能不能正确识别藏文的显示字符数呢?

image-20191110162637693
image-20191110162637693

成功!!所以再也不用担心自己编写文字软件时,找不对这些文字的光标位置了。


参考文献:

2019-11-10-使用StringInfo正确查找字符个数 - huangtengxiao

藏文 - 维基百科,自由的百科全书


本文会经常更新,请阅读原文: https://xinyuehtx.github.io/post/%E7%9C%8B%E7%9C%8B%E8%97%8F%E6%96%87%E9%98%BF%E6%8B%89%E4%BC%AF%E6%96%87%E9%87%8C%E9%9D%A2%E4%B8%80%E5%85%B1%E6%9C%89%E5%A4%9A%E5%B0%91%E4%B8%AA%E5%AD%97%E5%90%A7.html ,以避免陈旧错误知识的误导,同时有更好的阅读体验。

本作品采用 知识共享署名-非商业性使用-相同方式共享 4.0
本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2019-11-10 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档