首页
学习
活动
专区
工具
TVP
发布

Human Language Processing——Speech Recognition

两者的Phoneme集合和Lexicon不一样 Grapheme 书写的最小单位 对于英文来说,Grapheme指的就是26个英文字母;对于中文来说,Grapheme指的就是约4000+个常用汉字。...由于在英文书写系统中,包括了标点符号和空格,所以,实际的英文Grapheme集合的数量为26(英文字母,不区分大小写)+ 1(空格)+ 12(常用标点符号)。...中文Grapheme集合的数量为3755(一级汉字)+ 3008(二级汉字)+ 16(标点符号) 值得一提的是,这种选取方式是Lexicon free的,它不需要语音学家的帮忙来制定复杂专业的Lexicon...Morepheme 单位大于Grapheme,小于word,是组成单词的最小有意义的单元 这种表示方式存在于英语、土耳其语中。但凡有词根、词缀的语言,都可以用这种表示方 式。...可以看到,使用grapheme方式的人是最多的,占到了41%;使用phoneme的也有不少,约为32%, 而使用word和 morpheme的人则分别只有10%和17% 输入Token有哪几种表示方式

77910
您找到你想要的搜索结果了吗?
是的
没有找到

扫码

添加站长 进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

    运营活动

    活动名称
    广告关闭
    领券