文本生成技术是深度学习赋予自然语言处理一项全新的技术,而刚好网上有这方面诸多的例子,因此趁着有空实现一下中国古诗的自动生成技术,还是挺好玩的。
具体步骤主要包括以下几点:
(1) 准备语料库,即对据有的古诗进行获取。
(2) 生成关键词,并进行词向量转化。
(3) 利用RNN的编码解码模型进行训练,由于RNN具备一对多的输出,因此可以很好地解决这种自动生成技术。
本文的具体参考代码为:https://github.com/DevinZ1993/Chinese-Poetry-Generation
由于原始代码是在python2.7环境下,因此需要更改多处代码才能运行。主要细节在于一些变量,filter, sorted ,cmp等这种python3所替代的方法。
(3) 测试结果如下:
做诗的相关文字为: 我佛慈悲 关键词个数为:4 关键词: 翻 冥 慈悲 我佛 生成古诗: 岭田商步更但望,为望柴眼亩魂新。 顶情向年一羽又,好时寂中田全心。 做诗的相关文字为: 我佛慈悲 关键词个数为:4 关键词: 冥 我佛 慈悲 翻 生成古诗: 千饥更琐初边臣,一花雷嶂化个残。 遂姿灵阴白鉴酒,诗宦无看烟衲骖。 做诗的相关文字为: 我佛慈悲 关键词个数为:4 关键词: 冥 慈悲 我佛 翻 生成古诗: 梦郑西清超江明,重共齐时日骝归。 送河醉其堪山韵,也樽定胜自隔规。 做诗的相关文字为: 我佛慈悲 关键词个数为:4 关键词: 我佛 翻 慈悲 冥 生成古诗: 布胸照似细士庙,故晚攀陵诗下暇。 东池只千一叶处,我道今老一力霞。 做诗的相关文字为: 我佛慈悲 关键词个数为:4 关键词: 慈悲 我佛 翻 冥 生成古诗: 蝴边客云道饶偃,玉竹似病限分家。 秋说听飞眉早看,但回何满缥东佳。 做诗的相关文字为: 我佛慈悲 关键词个数为:4 关键词: 冥 翻 慈悲 我佛 生成古诗: 云瑟累瓶辱州莫,楚花拄处自鹅苔。 谏是君雨是不过,叠行宝舟突髯台。 做诗的相关文字为: 我佛慈悲 关键词个数为:4 关键词: 慈悲 冥 我佛 翻 生成古诗: 浓枝十老不密飘,笙中北大落整长。 好问即陈梅多却,高凡到汾倚逢肠。 做诗的相关文字为: 我佛慈悲 关键词个数为:4 关键词: 慈悲 我佛 冥 翻 生成古诗: 猛事枝人春皪头,只向华声慈衣弦。 须似心上换皆土,数人怜少间及仙。