前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >[oeasy]python0131_[趣味拓展]各种符号_汉语拼音符号_中文全角英文字母_中文全角标点

[oeasy]python0131_[趣味拓展]各种符号_汉语拼音符号_中文全角英文字母_中文全角标点

原创
作者头像
oeasy
发布2023-04-09 18:14:19
9100
发布2023-04-09 18:14:19
举报
文章被收录于专栏:oeasy教您玩转linux、python

各种符号 回忆上次内容

  • 中文字符可以有各种分类方法
  • 声母
  • 拼音检字法
  • 韵母
  • 合辙押韵的分类
  • 偏旁部首
  • 实际上unicode的排序方法

添加图片注释,不超过 140 字(可选)

  • 我们以前勇闯地下城时候获得了一把屠龙宝刀
  • 给他镶上了❤️宝石
  • 这宝石应该如何理解?
  • 今天我们就来彻底解密红色爱心的原理

闭环

  • 首先是文字
  • 我们的汉字可以构成一个闭环

添加图片注释,不超过 140 字(可选)

  • 这♥也可以构成一个闭环吗?

构成闭环

添加图片注释,不超过 140 字(可选)

  • 这种编解码方式是unicode-escape
  • 也可以构成闭环

添加图片注释,不超过 140 字(可选)

  • 这符号最初怎么来的呢?

插入符号

  • 搜索出来的

添加图片注释,不超过 140 字(可选)

  • ♠ ♣ ♥ ♦
  • 把字符复制下来
  • 然后粘到系统里面观察
  • 类似的有很多好玩的东西
  • ꧁༺新闻༒计算༻꧂
  • ༺动院༒编程༻
  • 加到名字里感觉萌萌哒
  • ლ(′◉❥◉`ლ)

输出符号

  • 这些其实都是uncode字符

添加图片注释,不超过 140 字(可选)

  • 这个东西是可以作为字符串里的字符输出的
  • 但是他的 ordinal (序号) 是多少呢?

得到序号

添加图片注释,不超过 140 字(可选)

  • 通过字符得到序号 ord
  • 反过来通过序号得到字符 chr
  • 输出红心试试

添加图片注释,不超过 140 字(可选)

  • 真的可以
  • 这个红桃符号在存储和传输的时候传的都是二进制形式
  • 可以看看红桃的序号的 16进制 或者 2进制 形式么 ?

16 进制

添加图片注释,不超过 140 字(可选)

  • 字符可以拼合
  • 前面一个 \u
  • 后面加上 4位 16进制 数
  • 就可以进行输出字符
  • 好像是又在\转义(escape)了
  • 这次的转义序列是\u2660
  • 黑红梅方都可以有对应序号么?
  • 不要翻篇
  • 上下找找
  • 自己试试

遍历花色

  • 从0x2660到0x2670
  • 将这16个数字对应的字符进行输出

添加图片注释,不超过 140 字(可选)

  • 他们分别都是多少呢?

遍历扑克

添加图片注释,不超过 140 字(可选)

  • 选出实心的黑红梅方

转义

添加图片注释,不超过 140 字(可选)

  • 我想要的不是默认红
  • 我想要纯红色的大红心
  • 怎么办?

回忆颜色

  • 高亮基础色

添加图片注释,不超过 140 字(可选)

  • 然后我们了解了\33[38;5;XXXm 索引颜色
  • 每个颜色 0-5 总共 6 级

添加图片注释,不超过 140 字(可选)

  • 甚至可以用RGB得到各种颜色
  • \33[38;2;R;G;Bmoeasy\33[0m
  • 颜色真不少了
  • 我想用大红色画个桃心 ♥️
  • 有可能吗??🤔

大红心

添加图片注释,不超过 140 字(可选)

  • \33[38;5;196
  • 使用索引色
  • 196 = 16 + 625 + 610 + 60*0
  • 红色打满

添加图片注释,不超过 140 字(可选)

  • rgb形式 也没有问题
  • 那么 红色方板 应该怎么做呢?

添加图片注释,不超过 140 字(可选)

  • 这个\u 又是什么意思呢?
  • 好像是也是一种通过数字找到对应字符的方法
  • 以前都有什么通过数字找字符的方法呢?

ascii

  • 最基础的肯定是ascii

sudo apt install ascii ascii

添加图片注释,不超过 140 字(可选)

输出字符

  • 可以用\输出字符
  • \xhh
  • x意味着hexdecimal
  • h 是十六进制数子
  • \ooo
  • o 是八进制数字

添加图片注释,不超过 140 字(可选)

  • 不要翻页
  • 再复习 如何用chr函数
  • 通过 数字直接输出oeasy字符串

输出

添加图片注释,不超过 140 字(可选)

  • 尝试用16进制和8进制输出

数字化输出

添加图片注释,不超过 140 字(可选)

  • 可是这个\u 究竟是什么呢?

添加图片注释,不超过 140 字(可选)

  • 不会了就去搜帮助

查看帮助

添加图片注释,不超过 140 字(可选)

  • 查找关于字符串的帮助
  • 具体转义序列语法如下

添加图片注释,不超过 140 字(可选)

  • \nnn 8 进制
  • \xhh 16 进制
  • \uhhhh 4 位的 Unicode 编码
  • \Uhhhhhhhh 8 位的 Unicode 编码
  • 那我们胡乱来试试吧

具体试试

  • \u后面
  • 4 位 16 进制数
  • 对应一个字符

添加图片注释,不超过 140 字(可选)

  • 这种对应关系就像ascii
  • ascii
  • 7 位 2进制数 对应一个字符
  • unicode
  • 范围更广
  • 字符更多
  • 其中中文标点
  • 我们要特别注意

调出中文标点

  • 点击桌面的sogou输入法
  • 开启中文输入法模式

添加图片注释,不超过 140 字(可选)

  • 可以切换
  • 中英文输入法
  • 全角半角

编程注意

  • 编程的时候
  • 只能使用英文标点
  • 不能使用中文标点
  • 这是为什么呢?

添加图片注释,不超过 140 字(可选)

  • 注意下图的括号不是半角的

原理

  • 中文括号和英文括号对应的根本不是一个序号
  • python解释器解释不下去
  • 就会报错了

添加图片注释,不超过 140 字(可选)

  • 引号,逗号等符号都要使用英文半角的
  • 在哪里切换标点的全角半角呢?

切换全角半角标点

  • 下图红框位置就是切换全角半角标点的位置

添加图片注释,不超过 140 字(可选)

  • 可以切换中英文标点
  • 那旁边的月亮怎么理解呢?

全角半角英文字符

  • 圆月是全角英文
  • 半月是半角英文

添加图片注释,不超过 140 字(可选)

  • 为什么会有全角英文字符呢?

全角英文

添加图片注释,不超过 140 字(可选)

  • 序号位置在中文之后

添加图片注释,不超过 140 字(可选)

  • 最初目的是和中文字符等宽
  • 其实也可以生成一系列特殊词元token
  • 因为这些词元看起来是英文单词
  • 但实际上并不是
  • 这应该是一块有趣的区域!
  • 另外汉语拼音字符
  • 应该如何理解呢?

汉语拼音

  • 汉语拼音符号:ā á ǎ à ō ó ǒ ò ē é ě è ī í ǐ ì ū ú ǔ ù ǖ ǘ ǚ ǜ ü ê ɑ  ń ň ǹ ɡ

添加图片注释,不超过 140 字(可选)

  • 这些序号
  • 好像并不是连续的
  • 可以将他们一起解码吗?

观察unicode编码

  • unicode中并没有汉语拼音block

添加图片注释,不超过 140 字(可选)

  • 我们把各个地方散乱的字符
  • 当做汉语拼音来用...

添加图片注释,不超过 140 字(可选)

  • ǖ ǘ ǚ ǜ ü 也是来自于拉丁语扩展

更多拼音

添加图片注释,不超过 140 字(可选)

  • 也有相应的拼音字符

1.[á]/[â] 2.[ǎ] 3.[ā] 4.[a̖]/[ȁ] 5.[a̗] 6.[à] 总结

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档