前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >pypinyin 获取多音字的拼音组合

pypinyin 获取多音字的拼音组合

作者头像
Michael阿明
发布2022-11-27 17:21:06
6780
发布2022-11-27 17:21:06
举报
  • 使用 pypinyin

代码语言:javascript
复制
import pypinyin
from pypinyin import pinyin, lazy_pinyin
import itertools

text = '追剧、听音乐'
# heteronym 开启多音字选项, NORMAL不带声调
ans = list(itertools.product(*pinyin(text, heteronym=True, style=pypinyin.NORMAL)))
print(ans)

输出:

代码语言:javascript
复制
[('zhui', 'ju', '、', 'ting', 'yin', 'yue'), 
('zhui', 'ju', '、', 'yin', 'yin', 'yue'), 
('zhui', 'ju', '、', 'yi', 'yin', 'yue'), 
('dui', 'ju', '、', 'ting', 'yin', 'yue'), 
('dui', 'ju', '、', 'yin', 'yin', 'yue'), 
('dui', 'ju', '、', 'yi', 'yin', 'yue'), 
('tui', 'ju', '、', 'ting', 'yin', 'yue'), 
('tui', 'ju', '、', 'yin', 'yin', 'yue'), 
('tui', 'ju', '、', 'yi', 'yin', 'yue')]

吐槽一下,这个包输出的多音字有些是不对的,如上面的字不对

另外,注意 itertools.product 的结果是指数级增长的,多音字符数过多,会计算不出来结果(组合数太多,内存溢出、计算时间长)

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2022-03-16,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档