首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

程序员自编的中华古诗词数据库在GitHub上火了!

“Hello 我 是 小 白,愿 携 手 共 闯 智 能 江 湖 ”

ZhiNengJiangHu

综合自网络

今天,给大家推荐一个GitHub上的一个热门项目——Chinese-poetry ,截至今日,该项目已经获得了 9700 个「star」以及 1383 个「fork」。

该诗词数据库包含5.5万首唐诗、26万首宋诗和2.1万首宋词。唐宋两朝近 1.4万古诗人,和两宋时期1500位词人,数据均来源于互联网。(项目地址:https://github.com/chinese-poetry/chinese-poetry)

数据分发形式

该项目中的古诗数据分发采用繁体字的分组JSON文件,保留繁体能更大程度地保存原数据。宋词数据分发采用sqlite数据库,使用简体字。

其他类型结构数据

● chinese-poetry / chinese-poetry-zhCN 简体中文版本数据(链接:https://github.com/chinese-poetry/chinese-poetry-zhCN)

● KomaBeyond / chinese-poetry-mysql 适用于mysql数据库的格式数据(链接:https://github.com/KomaBeyond/chinese-poetry-mysql)

转换数据库格式工具

● chinese-poetry-to-mysql-tool 转换成sql文件的脚本(链接:https://github.com/woodylan/chinese-poetry-to-mysql-tool)

古诗JSON结构

[

{

"strains": [

"平平平仄仄,平仄仄平平。",

"仄仄平平仄,平平仄仄平。",

"平平平仄仄,平仄仄平平。",

"平仄仄平仄,平平仄仄平。"

],

"author":"太宗皇帝",

"paragraphs": [

"秦川雄帝宅,函谷壯皇居。",

"綺殿千尋起,離宮百雉餘。",

"連甍遙接漢,飛觀迥凌虛。",

"雲日隱層闕,風煙出綺疎。"

],

"title":"帝京篇十首 一"

},

... 每单个JSON文件1000条唐诗记录.

]

作者JSON结构

[

{

"name":"太宗皇帝",

"desc":"帝姓李氏,諱世民,神堯次子,聰明英武。貞觀之治,庶幾成康,功德兼隆。由漢以來,未之有也。而銳情經術,初建秦邸,即開文學館,召名儒十八人爲學士。既即位,殿左置弘文館,悉引內學士,番宿更休。聽朝之間,則與討論典籍,雜以文詠。或日昃夜艾,未嘗少怠。詩筆草隸,卓越前古。至於天文秀發,沈麗高朗,有唐三百年風雅之盛,帝實有以啓之焉。在位二十四年,諡曰文。集四十卷。館閣書目,詩一卷,六十九首。今編詩一卷。"

},

...

]

数据分析

案例展示

除此之外,在GitHub页面,你还可以找到案例展示,如下:

animalize / QuanTangshi 离线全唐诗 Android(链接:https://github.com/animalize/QuanTangshi)

诗词周历

chinese-poetry / poetry-calendar 诗词周历(链接:http://shici.store/poetry-calendar/)

诗词桌面

okcy1016 / poetry-desktop 诗词桌面(链接:https://github.com/okcy1016/poetry-desktop/)

网友评论:

@猴猴猴要好好读书THU:像是程序员干的事…就怕你们这些人有文化…

@two3in2K:想到了 “2018”里的诗云

@xsp:中华文化博大精深,果断收藏了

@我是豆豆啊豆豆:“人间”真是个永恒的话题啊···

@逗猿一颗:最怕程序员有文化

我是小白,很开心在这里与你相遇,愿携手共闯智能江湖!!!

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180815B1SELS00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券