资源 | 一网打尽成语歇后语,GitHub新华字典数据库

大数据文摘出品

作者:蒋宝尚

今天,文摘菌给大家推荐一个非常优秀的数据库——新华字典数据库。

数据库收录了包括14032条歇后语,16142个汉字,31648个成语。下面文摘菌就简单的介绍一下这个数据库。

这个数据库放在GitHub中,所有的数据放在data/目录下,并且如果对性能没有要求的同学,可以使用作者的新华字典API访问数据库。

数据库地址:

https://github.com/pwxcoo/chinese-xinhua

项目结构

在GitHub中,整个新华字典数据库的项目结构为:

整个结构包括数据文件夹,配置文件以及脚本文件夹,在脚本文件夹下提供了成语脚本和汉字脚本以及歇后语脚本的下载。

数据库介绍及API的使用

前面提到,整个数据库包括14032条歇后语,16142个汉字,31648个成语。

在使用API查询每条成语的时候,分为两种情况:

  • 如果直接请求成语,需要两个参数: type=idiom 表示需要请求成语 word=兴高采烈 表示请求的成语
  • 请求拼音首字母缩写,也需要两个参数: type=idiom 表示需要请求成语 word=xgcl 表示请求的成语拼音首字母缩写

下面文摘菌用Python简单实现了一下:

返回结果为:

上图可知,当你请求的是成语时,返回的结果包括:成语的来源、成语的解释、成语的拼音、用成语造的句子以及成语的首字母缩写。

当访问歇后语的时候则也需要两个参数:

  • type=xiehouyu 表示需要请求歇后语
  • riddle=王婆 表示请求的歇后语的语面。可以模糊匹配

Python实现?

由上图的Python实现可知,当你输入的关键词是模糊的时候,结果会返回带有关键词的所有歇后语。例如,你查询关键词为王婆的歇后语,返回了三条结果,每条结果包含歇后语的迷面以及歇后语的谜底。

当需要访问汉字的时候,当前接口只能直接请求汉字,不能请求拼音。如果请求了拼音,则返回的结果为空。

请求汉字需要两个参数:

  • type=word 表示需要请求汉字
  • word=“蒋” 表示请求的汉字

Python实现?

如上图所示,当请求‘蒋’这个汉字的时候,返回的结果包括汉字的拼音、汉字的来源、以及汉字的繁体版等等。

注:GET、POST均可,返回数据格式为JSON。

数据库GitHub地址:

https://github.com/pwxcoo/chinese-xinhua

【今日机器学习概念】

Have a Great Definition

原文发布于微信公众号 - 大数据文摘(BigDataDigest)

原文发表时间:2018-07-30

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏owent

可执行文件压缩

最近看Rust相关东西的时候看到一篇关于压缩可执行文件的文章。压缩可执行文件对嵌入式开发特别有用,但是延伸一下用来减少我们游戏行业里预编译的工具二进制包大小和A...

54110
来自专栏JadePeng的技术博客

axios介绍与使用说明 axios中文文档

本周在做一个使用vuejs的前端项目,访问后端服务使用axios库,这里对照官方文档,简单记录下,也方便大家参考。 Axios 是一个基于 Promise 的 ...

3.1K90
来自专栏bboysoul

cheat一个实用 Linux 命令示例集合

在使用linux的时候我们会经常碰到这样的问题,比如使用nmap,我后面到底加什么参数呢?碰到这种情况我们只能使用man或者它的帮助命令来查看使用方法,但是有的...

8820
来自专栏iOS 开发杂谈

iOS多线程之四:NSOperation的使用

一、NSOperation NSOperation是苹果公司对GCD的封装,完全面向对象,但是比GCD拥有更强的可控性和代码可读性。所以使用起来更好理解。 ...

14030
来自专栏大内老A

[WCF-Discovery]如何利用”发现代理”实现可用服务的实时维护?

上面的内容大部分是围绕着Ad-Hoc模式展开介绍的。Managed模式和Ad-Hoc不同之处在于可用服务的终结点通过发现代理来统一管理。客户端在进行可用目标服务...

26780
来自专栏存储

建立本地的Blast数据库

Blast(basic local alignment search tool) 局部序列比对基本检索工具,是NCBI开发的一款基于序列相似性的数据库搜索程序。...

63990
来自专栏Golang语言社区

《GO IN ACTION》读后记录:GO的并发与并行

一、使用goroutine来运行程序 1. Go的并发与并行 Go的并发能力,是指让某个函数独立于其他函数运行的能力。当为一个函数创建goroutine时,该函...

47370
来自专栏Java技术栈

Java 中的伪共享详解及解决方案

13330
来自专栏有趣的django

33.Django ModelForm

ModelForm  1.ModeForm简单验证 from django.db import models # Create your models her...

31240
来自专栏大神带我来搬砖

分布式系统小知识:Apche Storm可靠性机制里为什么要采用异或来判断消息得到完整性处理?

想起这个问题,是因为知乎上有人提问,https://www.zhihu.com/question/48583003/answer/111853985 stor...

333100

扫码关注云+社区

领取腾讯云代金券