首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

自然语言处理-错字识别(基于Python)kenlm、pycorrector

特征 kenlm: kenlm统计语言模型工具 rnn_lm: TensorFlow、PaddlePaddle均有实现栈式双向LSTM的语言模型 rnn_attention模型: 参考Stanford...最后执行 pip install https://github.com/kpu/kenlm/archive/master.zip 之后在执行pip install pycorrector/。。。...以上安装参考连接: https://github.com/kpu/kenlm https://github.com/shibing624/pycorrector 其工作流程如下: ?...语言模型: Kenlm(统计语言模型工具) RNNLM(TensorFlow、PaddlePaddle均有实现栈式双向LSTM的语言模型) 代码: import pycorrector corrected_sent...后面这三点比较关键: 项目中使用了基于n-gram语言模型,使用kenLM训练得到的,DNN LM和n-gram LM各有优缺点,这里卖个关子,感兴趣的可以思考一下二者区别。

16.3K61
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    中文文本纠错工具推荐:pycorrector

    Feature 模型 kenlmkenlm统计语言模型工具,规则方法,语言模型纠错,利用混淆集,扩展性强 deep_context模型:参考Stanford University的nlc模型,该模型是参加...安装 pip install https://github.com/kpu/kenlm/archive/master.zip 安装kenlm-wiki 其他库包安装 pip install -r requirements.txt...加载自定义语言模型 默认提供下载并使用的kenlm语言模型zh_giga.no_cna_cmn.prune01244.klm文件是2.8G,内存较小的电脑使用pycorrector程序可能会吃力些。...支持用户加载自己训练的kenlm语言模型,或使用2014版人民日报数据训练的模型,模型小(140M),准确率低些。.../klm, 4)kenlm词粒度语言模型文件及其二进制文件people2014corpus_words.arps/klm。

    1.2K20

    一键式文本纠错工具,整合了BERT、ERNIE等多种模型,让您立即享受纠错的便利和效果

    实现了Kenlm、ConvSeq2Seq、BERT、MacBERT、ELECTRA、ERNIE、Transformer等多种模型的文本纠错,并在SigHAN数据集评估各模型的效果。...PS: 作者纠错分享 网友源码解读 2.2 模型推荐 Kenlm模型:本项目基于Kenlm统计语言模型工具训练了中文NGram语言模型,结合规则方法、混淆集可以纠正中文拼写错误,方法速度快,扩展性强,效果一般...使用示例: 图片 kenlm安装 pip install kenlm 安装kenlm-wiki 其他库包安装 pip install -r requirements.txt 6.应用场景 6.1 文本纠错...支持用户加载自己训练的kenlm语言模型,或使用2014版人民日报数据训练的模型,模型小(140M),准确率稍低,模型下载地址:people2014corpus_chars.klm(密码o5e9)。.../klm, 4)kenlm词粒度语言模型文件及其二进制文件people2014corpus_words.arps/klm。

    3.7K41

    扫码

    添加站长 进交流群

    领取专属 10元无门槛券

    手把手带您无忧上云

    扫码加入开发者社群

    相关资讯

    热门标签

    活动推荐

      运营活动

      活动名称
      广告关闭
      领券