首页
学习
活动
专区
工具
TVP
发布

来,和人工智能对对联过大年!

春节贴春联是中国人庆祝春节(过年)的特有习俗。但我真正对对联有些认识和喜欢,不是从年年贴春联开始的,而是从《唐伯虎点秋香》那段经典的对对子开始的。那工整又有韵律和意境的对子,配上有节奏的配乐读出来着实让人热血沸腾,大呼过瘾。

本文末尾有对对联的入口,可以与人工智能对(tiao)对(xi)联(ta)哦~

先来回味一下这段台词吧,你的耳边是否响起了对对子的节奏。。。

对穿肠:一乡二里共三夫子,不识四书五经六义,竟敢教七八九子,十分大胆!

宁王:对啊,怎麼不对呢?你不给我面子,我可真的要发飙了!

唐伯虎:让我来试试! 十室九贫,凑得八两七钱六分五毫四厘,尚且三心二意,一等下流!

对穿肠:好工整啊!

华太师:华安,你来的正是时候。

唐伯虎:没事,没事,没事。

对穿肠:在下是七省文状元兼参谋将军,绰号对王之王的对穿肠。阁下是?

唐伯虎:小弟读过两年书,尘世中一个迷途小书僮,华安。

对穿肠:好!我就来会一会你!

(两人互相凝视,蓄势待发,突然......亲了一下......众人跌倒在地!)

唐伯虎:对不起,我俩惺惺相惜,情不自禁。

对穿肠:言归正传,我们开始了。

图书里,龙不吟虎不啸,小小书僮可笑可笑。

唐伯虎:棋盘里,车无轮马无韁,叫声将军提防提防。

众 人:对得好!对得好!

对穿肠:莺莺燕燕翠翠红红处处融融洽洽。

唐伯虎:雨雨风风花花叶叶年年暮暮朝朝。

众 人:华安真行啊!对得好!

宁 王:快出对子对死他,对死他!

对穿肠:十口心思,思君思国思社稷。

唐伯虎:八目共赏,赏花赏月赏秋香。

对穿肠:我上等威风,显现一身虎胆。

唐伯虎:你下流贱格,露出半个龟头。

对穿肠:我堂堂参谋将军会输给你个书僮? 你家坟头来种树。

唐伯虎:汝家澡盆杂配鱼。

对穿肠:鱼肥果熟入我肚。

唐伯虎:你老娘来亲下厨!

(对穿肠倒地喷血)

唐伯虎:对对本为消遣作乐,今曰穿肠兄居然对到呕出几十两血,可谓空前绝后,小弟佩服佩服!

十年前,微软亚洲研究院推出了一个对联生成引擎,可以根据用户输入的上联自动生成下联,当时火了一把。那时候我觉得这个好神奇啊。

十年后,人工智能的风已经热吹了几年。随着硬件GPU计算能力的提升,和深度学习框架(TensorFlow,PyTorch,MxNet等等)的推出和发展,人工智能(其实就是更深层的机器学习)首先在图像处理领域大放异彩,人脸识别、物体检测等技术应用广泛。然而,在自然语言处理处理方面,深度学习的应用还没有图像处理那么成熟。不过,人工智能作古诗,对对子应用的看起来还不错。

今天,在春节到来之前,我就来用Python搭建一套人工智能对对联的系统,供朋友们在春节期间娱乐一下。

一、人工智能的实现

基于深度学习实现的对对联已经有好多种方法。这次我们主要参考这个实现:

https://github.com/wb14123/seq2seq-couplet

并且,这个作者还提供了70万条对联的数据,有了这个数据就可以训练我们自己的模型了。

做深度学习训练是最考验硬件的,必须上GPU,不然训练可能要一两个月才能完成。通常深度学习的系统环境是这样的:

CPU:现在常规的已经足够,计算主要靠GPU;

内存:至少16GB,越多越好;

GPU: NVIDIA,至少是gtx-1060吧。目前最具性价比的是gtx-1080 Ti

OS: Ubuntu 16.04 (普遍使用的版本)

Python: Python 3.6 版 (2.x的版本用的很少了)

深度学习框架: TensorFlow、PyTorch和MxNet最流行

我的机器已经配置好了TensorFlow和GPU等环境,不过GPU只是1070,性能有点弱弱。按照说明可以比较容易的配置好训练环境。训练跑起来后,就听到GPU风扇转起来了,发热量有点大。好在是冬天,可以取取暖。要是夏天就只能流汗了~

训练的过程很漫长。。。最终训练了一周。搞人工智能的活儿没点儿像样的硬件,还真耗不起青春啊。训练期间,有足够的时间去完成其它的功能。

二、Web API的建立

上面的github中有个Flask写的Server。不过,我更喜欢Sanic,就用Sanic写一个吧。服务器接收上联,生成下联后返回json数据,Sanic很容易搞定。如果你用过Sanic,就知道它有多么容易了。

这个Server程序一运行,就先加载训练好的模型。然后给Server写一个路由响应函数即可。

三、与公众号对接

这个对接之前没有做过。通过读开发文档,弄明白了流程:在公众号后台设置服务器地址用来接收腾讯服务器发送的消息,我的服务器处理后再返回给腾讯服务器。

举个例子,关注公众号的用户给公众号发送一条上联,腾讯服务器收到后转发给我的服务器,我的服务器生成下联返回给腾讯服务器,腾讯服务器再传给用户的微信客户端。

弄清楚了数据传输路径,再结合文档中描述数据的格式,就可以实现跟微信对接的程序了。

(0)验证微信消息来源

(1)解析微信消息数据

微信服务器传过来的消息是一个xml结构的数据,具体格式参见其官方开发文档。我用lxml来解析这个xml结构:

(2)实现关注事件自动回复和关键字回复

之前已经在公众号后台设置了用户关注后自动打招呼,和基于关键词的自动回复。启用开发模式后,这个功能就要我自己实现了:

把设置的关键词和回复内容用dict保存,后面添加也很方便。用正则表达式匹配这些设置的关键词和微信消息内容,速度也够快。

(3)生成回复消息

我的服务器处理完微信服务器发过来的消息后,就要生成一个xml格式的消息返回给微信服务器,它接收后再发给微信用户,从而实现最终的自动回复微信用户。这个xml格式也是正在开发文档中描述。

不过,我不是这样做的。而是让对联功能的服务保持独立,因为它启动一次加载人工智能模型太费时间,调试不方便。把对外的web服务写成另外的Sanic服务程序,两者之间,通过requests访问:

完成后测试成功。可惜,只留下下面一条测试的截图(后面有解释)

到此为止,一切正常!

。。。。。。

但是,原来公众号设置的菜单不见了。后台显示开发模式下要自己开发这个菜单,没问题,难不倒我。根据文档试了试,竟然不成功?!

为什么呢?权限那里显示,菜单开发的权限只有在公众号认证后才能获得。晕,还要去认证公众号。好吧,公众号你赢了。也就是说,前面废了那么大劲儿从读文档到写程序对接的功夫全白费了,公众号对接的代码白写了~~,有需要的拿走不谢哦。

四、独立的网页

我就是不认证,就是不认证!但我可以换个思路,停用开发模式。增加一个菜单,菜单链接对对联的网页就可以了。做这个网页太简单了,还是上Sanic。有心的同学,可以在这个网页上发现对对联的API,你可以使用这个API开发自己的应用哦。

这个网页就是一个单页面,布局用bootstrap,用jQuery和服务器交互。因为就一个简单页面,没有用jinja模板,直接读取html文件并用 response.html() 返回即可。坏处是每次调整网页都有重启一下服务:

网页有点简陋,就是下面的样子,类似对话流。有兴趣的同学可以通过关注公众号和它对对子。

这个系统的搭建,主要是使用Python完成,涉及一点网页css和js的东西,也涉及系统和网络服务的知识,可以算得上一个全栈开发的例子。当然,主要的还是Python,不管是人工智能还是Web都有Python的用武之地。别想了,赶快学Python吧。

人工智能对对联的入口:

https://www.yuanrenxue.com/couplet

或者,给公众号发消息:对联,即可获得该网址。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20190131G0GU2900?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券