厉害了!竟然有程序员在GitHub上建了一个新华词典数据库

源 /开源最前线整编 /猿妹

今天,给大家推荐一个GitHub上的一个热门项目——chinese-xinhua ,一个新华字典数据库,截至今日,该项目已经获得了 332 个「star」以及 103 个「fork」。可能是知道的太少了

这个数据库收录了包括14032条歇后语,16142个汉字,31648个成语。(GitHub项目地址:https://github.com/pwxcoo/chinese-xinhua)

该数据库的所有数据都放在data/ 目录,对性能没需求的话,可以直接使用作者的新华字典 API 。下面,我们一起来详细了解一下这个数据库

项目结构

该数据库的项目结构如下:

chinese-xinhua/

|

+- .vscode/

||

|+- launch.json

|

+- data/

||

|+- idiom.json

| |

| +- word.json

||

|+- xiehouyu.json

| |

| +- ci.json

||

|+- ci.csv

|

+- scripts/

||

|+- addAbbreviation.py

| |

| +- chengyu.py

||

|+- word.py

| |

| +- xiehouyu.py

||

|+- ci.py

数据库介绍

成语

[

{

"derivation":"语出《法华经·法师功德品》下至阿鼻地狱。”",

"example":"但也有少数意志薄弱的……逐步上当,终至堕入~。★《上饶集中营·炼狱杂记》",

"explanation":"阿鼻梵语的译音,意译为无间”,即痛苦无有间断之意。常用来比喻黑暗的社会和严酷的牢狱。又比喻无法摆脱的极其痛苦的境地。",

"pinyin":"ā bí dì yù",

"word":"阿鼻地狱",

"abbreviation":"abdy"

},

...

]

词语

[

{

"ci":"宸纶",

"explanation":"1.帝王的诏书﹑制令。"

},

...

]

汉字

[

{

"word":"嗄",

"oldword":"嗄",

"strokes":"13",

"pinyin":"á",

"radicals":"口",

"explanation":"嗄〈叹〉\n\n 同啊”。表示省悟或惊奇\n\n 嗄!难道这里是没有地方官的么?--宋·佚名《新编五代史平话》\n\n 嗄á叹词。在句首,〈表〉疑问或反问~,这是什么?~,你想干什么?\"嗄\"另见shà㈠。\n\n 嗄shà\n\n ⒈声音嘶哑~声。\n\n 嗄a 1.助词。表示强调﹑肯定或辩解。 2.助词。方言。表示疑问或反诘。\n\n 嗄xià 1.见\"嗄饭\"。 2.见\"嗄程\"。",

"more":"嗄 ga、a 部首 口 部首笔画 03 总笔画 13 嗄2\nshà\n〈形〉\n(1)\n声音嘶哑的 [hoarse]\n终日嚎而嗌不嗄。--《老子》\n(2)\n又如嗄哑,嗄嘶(嗓音嘶哑)\n嗄\nshà\n〈叹〉\n(1)\n什么 [what]--表示否定\n我要丢个干干净,看你嗄法把我治。--清·蒲松龄《聊斋俚曲集》\n(2)\n旧时仆役对主人、下级对上级的应诺声 [yes]\n带进来”。两边军士应一声嗄”,即将牛皋推至面前。--《说岳全传》\n另见á\n嗄1\ná\n〈叹〉\n同啊”(á)。表示省悟或惊奇 [ah]\n嗄!难道这里是没有地方官的么?--宋·佚名《新编五代史平话》\n另见shà\n嗄1\nshà ㄕㄚ╝\n嗓音嘶哑。\n郑码janr,u55c4,gbke0c4\n笔画数13,部首口,笔顺编号2511325111354\n嗄2\ná ㄚˊ\n同啊2”。\n郑码janr,u55c4,gbke0c4\n笔画数13,部首口,笔顺编号2511325111354"

},

...

]

API接口

GET、POST均可,返回数据格式为JSON。下面将以GET做示例

直接请求成语,则需要两个参数:

● type=idiom 表示需要请求成语

● word=兴高采烈 表示请求的成语

示例,如请求兴高采烈的成语,返回结果如下:

当你请求的是成语时,返回的结果包括:成语的来源、成语的解释、成语的拼音、用成语造的句子以及成语的首字母缩写。

直接请求拼音首字母缩写,需要两个参数:

● type=idiom 表示需要请求成语

● word=xgcl 表示请求的成语拼音首字母缩写

请求歇后语,同样需要两个参数

● type=xiehouyu 表示需要请求歇后语

● riddle=王婆 表示请求的歇后语的语面。可以模糊匹配

请求歇后语,结果会返回带有你输入的关键词的所有歇后语。

请求汉字,需要两个参数

● type=word 表示需要请求汉字

● word=吴 表示请求的汉

感兴趣的可以到GitHub上看看,果然是最怕程序员有文化。

转载声明:本文选自「 开源最前线」,搜索「OpenSourceTop」即可关注

推荐程序员必备微信号

程序员内参

微信号:

programmer0001

推荐理由:

在这里,我们分享程序员相关技术,职场生活,行业热点资讯。不定期还会分享IT趣文和趣图。这里属于我们程序员自己的生活,工作和娱乐空间。

▼长按下方↓↓↓二维码识别关注

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180815B12QVC00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。

扫码关注云+社区

领取腾讯云代金券