专栏首页Python小屋Python把汉字转换成拼音

Python把汉字转换成拼音

Python扩展库pypinyin支持汉字到拼音的转换,并且可以和分词扩展库配合使用。

>>> from pypinyin import lazy_pinyin, pinyin

>>> lazy_pinyin('董付国') #返回拼音

['dong', 'fu', 'guo']

>>> lazy_pinyin('董付国', 1) #带声调的拼音

['dǒng', 'fù', 'guó']

>>> lazy_pinyin('董付国', 2) #另一种拼音风格

['do3ng', 'fu4', 'guo2']

>>> lazy_pinyin('董付国', 3) #只返回拼音首字母

['d', 'f', 'g']

>>> lazy_pinyin('重要', 1) #能够根据词组智能识别多音字

['zhòng', 'yào']

>>> lazy_pinyin('重阳', 1)

['chóng', 'yáng']

>>> pinyin('重阳') #返回拼音

[['chóng'], ['yáng']]

>>> pinyin('重阳节', heteronym=True) #返回多音字的所有读音

[['zhòng', 'chóng', 'tóng'], ['yáng'], ['jié', 'jiē']]

>>> import jieba #其实不需要导入jieba,这里只是说明已安装

>>> x = '中英文混合test123'

>>> lazy_pinyin(x) #自动调用已安装的jieba扩展库分词功能

['zhong', 'ying', 'wen', 'hun', 'he', 'test123']

>>> lazy_pinyin(jieba.cut(x))

['zhong', 'ying', 'wen', 'hun', 'he', 'test123']

>>> x = '山东烟台的大樱桃真好吃啊'

>>> sorted(x, key=lambda ch: lazy_pinyin(ch)) #按拼音对汉字进行排序

['啊', '吃', '大', '的', '东', '好', '山', '台', '桃', '烟', '樱', '真']

本文分享自微信公众号 - Python小屋(Python_xiaowu),作者:董付国

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2016-09-17

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 使用Python给自己的录课视频添加字幕

    使用Python编写程序,给视频添加字幕,包括逐句出现的字幕和逐词出现的字幕,自己随意设置字幕的位置、起止时间等属性。

    Python小屋屋主
  • Python根据字幕文件自动给视频添加字幕(通用版)

    根据给定的字幕文件中的字幕信息,自动给视频添加字幕,运行程序后输入要添加字幕的视频文件和对应的字幕文件路径即可。实际使用时不需要对程序做任何修改,只需要根据实际...

    Python小屋屋主
  • Python内置函数sorted()高级排序用法

    可以结合Python内置函数sorted()从入门到精通来看一些稍微基础的排序用法。 >>> from operator import itemgetter >...

    Python小屋屋主
  • 并发出体验 -- 解决小规模并发下单的问题

      现在有这么一个业务场景,线上通过手机app下单买祈福灯,支付成功后,线下寺庙点亮。存在多个 用户同时选择同一个灯的情况出现,如下图。此时,正常情况应为一个用...

    Kevin_Zhang
  • 【2019年8月版本】OCP 071认证考试最新版本的考试原题-第9题

    Which three statements are true about views in an Orade batabase?

    用户5892232
  • 设计数据密集型应用(3):Storage and Retrieval

    Hash Index 是一种相对简单的索引结构。几乎每一种程序设计语言都有提供内存数据结构 hash map/table 的标准库,比如 C++ 中的 std:...

    linjinhe
  • python Bug | ImportError: No module named _curses

    一个较好的源:http://www.lfd.uci.edu/~gohlke/pythonlibs/ 去那里下载对应版本的whl文件

    努力在北京混出人样
  • BPF过滤器

    (1)BPF本质上来说是一个设备驱动(devicedriver),能够被应用程序用来读取网络上通过这个网络适配器的包。但是BPF又是一个特殊的驱动,因为它并没有...

    随心助手
  • 详述 Maven 依赖范围及依赖调节原则

    当在我们 POM 文件中配置 Maven 依赖的时候,常见的格式如下: <project> ... <dependencies> ...

    CG国斌
  • [编程题] 奇怪的表达式求值代码

    常规的表达式求值,我们都会根据计算的优先级来计算。比如*/的优先级就高于+-。但是小易所生活的世界的表达式规则很简单,从左往右依次计算即可,而且小易所在的世界没...

    desperate633

扫码关注云+社区

领取腾讯云代金券