OpenCC中文简体和繁体互转

下载地址:https://github.com/BYVoid/OpenCC.git

编译环境:MAC设备

1、OpenCC的安装

进行编译

make PREFIX=/usr/localsudo make PREFIX=/usr/local install

编译时报错:

image

安装 cmake

pip3 install cmake

再次编译报错:

image

brew install doxygen

安装完成后验证

image

此时验证成功

2、Configurations配置文件

解压之后在opencc中的share-->opencc中有需要的json文件就是opencc的配置文件,用来制定语言类型的转换

因为我是MAC环境,安装好之后,配置文件在/usr/local/⁨share⁩/opencc⁩目录下

image

3、opencc的使用

下面我们通过CMD命令,将下面这句话完成从繁体到中文简体的转换。

image

CMD命令如下:

opencc -i 需要转换的文件路径 -o 转换后的文件路径 -c 配置文件路径

栗子:

image

python代码使用

import opencccc = opencc.OpenCC('t2s')print(cc.convert('Open Chinese Convert(OpenCC)「開放中文轉換」,是一個致力於中文簡繁轉換的項目,提供高質量詞庫和函數庫(libopencc)。'))

4、错误解决方法

1、s2t.json not found or not accessible.

通过-c来指定配置文件的路径

2、Invalid UTF8

请确保文件的编码方式为UTF-8编码,如果文件不是UTF-8编码,可以通过NotePad++,编码-->转为UTF-8编码。

OpenCC的Windows使用教程请参考:

https://blog.csdn.net/sinat_29957455/article/details/81290356

温馨提示:如果遇到格式问题,请用网页打开即可!

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

扫码关注云+社区

领取腾讯云代金券