Python开发微信公众号后台(系列三)

專 欄

段晓晨,写过一点爬虫,写过几篇文章。能力虽有限,会尽量把想说的东西讲清楚。

知乎ID:段小草

知乎专栏:小段同学的杂记,

https://zhuanlan.zhihu.com/666666❈——

提要:

这篇文章里我们会写: 1、如何对一个聊天机器人进行抓包分析接口; 2、如何将现成的聊天机器 API 部署到自己的公众号上; 3、如何实现接收语音消息并调用聊天机器人 API 自动回复文字; 4、如何让机器人根据上下文回复消息。 上篇文章的结尾,我们实现了如下的功能: 1、回复 快递xxxxxx 自动识别快递公司 2、发送图片 识别性别和年龄 3、其他文字信息 原样返回 其实结束在上次的文章就挺好的,因为已经实现了最重要的 token 验证,也尝试了如何处理文字和图片类型的消息,更多的功能和接口可以自己尝试开发,这次我们再扩展一下公众号的功能吧。 鹦鹉学舌的自动回复显然是不能满足实际需要的,最多也就用来测试消息能不能正常返回。但是自己设置关键字回复需要的规则又太多,所以我们选择对已有的聊天机器人进行抓包。

之前有主流的小黄鸡机器人,但是没找到官方的网页版。(小黄鸡提供付费 API )尝试使用 http://www.niurenqushi.com/app/simsimi/(虽然事实证明这个网站用的是图灵机器人的 API 而非小黄鸡 API ,后面我们会再谈 API 怎么用)

很简单的一个请求。 http://www.niurenqushi.com/app/simsimi/ajax.aspx?txt= 网址后面加上内容就可以了。

# -*- coding: utf-8 -*-

import requests

def talk(content):

    s = requests.session()

    r = s.post('http://www.niurenqushi.com/app/simsimi/ajax.aspx?txt='+content)

recontent = r.text

returnrecontent

#如果请求失败自己试试加上headers

抓到了自动回复的内容以后,我们将用户输入的文本内容当作 content 传入,获取回复再返回即可。

从小黄鸡的回复我们可以看出来,丫并不是小黄鸡,而是图灵机器人伪装的。与其给人刷请求量还不如自己去申请一个图灵机器人的 API ,可以自己定制很多东西。 http://www.tuling123.com/ 注册以后会分配自己的 key ,免费版每天 5000 次请求。

官方提供了几种接入方式,其中一种是微信公众平台接入,这种方法直接接入图灵机器人提供的链接而不是自己的服务器,所以对于公众号来讲定制功能的限定就很多,但是如果有小伙伴没有自己的服务器的话,可以用这个尝尝鲜。

我们已经搭好了 Python 环境的服务器,所以选择 API 接入。 http://www.tuling123.com/html/doc/api.html(推荐自己详细阅读文档) 下面是对 API 调用的 Python 代码: 存储为talk_api.py (这里的重点是根据返回值中不同的 code 对相应返回的格式进行处理,否则会运行不成功或者返回信息不全)

# -*- coding: utf-8 -*-

import requests

importjson

global s

s = requests.session()





def talk(content):

url = 'http://www.tuling123.com/openapi/api'

da = {"key": "your API key", "info": content}

data = json.dumps(da)

    r = s.post(url, data=data)

    j = eval(r.text)

code = j['code']

if code == 100000:

recontent = j['text']

elif code == 200000:

recontent = j['text']+j['url']

elif code == 302000:

recontent = j['text']+j['list'][0]['info']+j['list'][0]['detailurl']

elif code == 308000:

recontent = j['text']+j['list'][0]['info']+j['list'][0]['detailurl']

else:

recontent = '这货还没学会怎么回复这句话'

returnrecontent

修改其中的 API key,然后修改之前的 weixinInterface.py

def POST(self):

str_xml = web.data() #获得post来的数据

    xml = etree.fromstring(str_xml)#进行XML解析

    #content=xml.find("Content").text#获得用户所输入的内容

msgType=xml.find("MsgType").text

fromUser=xml.find("FromUserName").text

toUser=xml.find("ToUserName").text

ifmsgType == 'image':

try:

picurl = xml.find('PicUrl').text

datas = imgtest(picurl)

            return self.render.reply_text(fromUser, toUser, int(time.time()), '图中人物性别为'+datas[0]+'\n'+'年龄为'+datas[1])

except:

            return self.render.reply_text(fromUser, toUser, int(time.time()),  '识别失败,换张图片试试吧')

else:

        content = xml.find("Content").text  # 获得用户所输入的内容

        if content[0:2] == u"快递":

post = str(content[2:])

kuaidi = cxkd.detect_com(post)

returnself.render.reply_text(fromUser,toUser,int(time.time()), kuaidi)



else:

try:

msg = talk_api.talk(content, userid)

returnself.render.reply_text(fromUser,toUser,int(time.time()), msg)

except:

                    return self.render.reply_text(fromUser,toUser,int(time.time(

这样我们就实现了调用图灵机器人 API 微信公众号后台自动回复的功能。你可以在http://www.tuling123.com/web/robot_settings!index.action?cur=l_02 修改机器人设定,机器人后台会根据设定自动修改相应回复。 示例:

实现了文本信息的聊天以后我就在想,我们已经可以处理文本、图片了,能不能处理语音呢? 刚好看到微信官方提供了接口:

这就意味着我们不需要做太多的修改就可以将接收到的语音消息作为文本信息处理了。 修改weixinInterface.py

def POST(self):

str_xml = web.data() #获得post来的数据

        xml = etree.fromstring(str_xml)#进行XML解析

        #content=xml.find("Content").text#获得用户所输入的内容

msgType=xml.find("MsgType").text

fromUser=xml.find("FromUserName").text

toUser=xml.find("ToUserName").text

        #picurl = xml.find('PicUrl').text

        #return self.render.reply_text(fromUser,toUser,int(time.time()), content)

ifmsgType == 'image':

try:

picurl = xml.find('PicUrl').text

datas = imgtest(picurl)

                return self.render.reply_text(fromUser, toUser, int(time.time()), '图中人物性别为'+datas[0]+'\n'+'年龄为'+datas[1])

except:

                return self.render.reply_text(fromUser, toUser, int(time.time()),  '识别失败,换张图片试试吧')

elifmsgType == 'voice':

content = xml.find('Recognition').text

try:

msg = takl_api.talk(content, userid)

returnself.render.reply_text(fromUser,toUser,int(time.time()), msg)

except:

                return self.render.reply_text(fromUser,toUser,int(time.time()), content + '这货还不够聪明,换句话聊天吧')

            #return self.render.reply_text(fromUser,toUser,int(time.time()), content)

else:

            content = xml.find("Content").text  # 获得用户所输入的内容

            if content[0:2] == u"快递":

post = str(content[2:])

                #result = cxkd.cxkd('PQ00708467161')



                r = urllib2.urlopen('http://www.kuaidi100.com/autonumber/autoComNum?text='+post)

                h = r.read()

                k = eval(h)

kuaidi = k["auto"][0]['comCode']

                '''

                j = requests.get('http://www.kuaidi100.com/query?type=huitongkuaidi&postid=280472503105')

                l = j.text

                #l = j.read()

                #m = eval(l)

                #outcome = ''

                #for c in m['data']:

                '''

                    #outcome = outcome + c['time']+'   '+c['context']+'\n'



returnself.render.reply_text(fromUser,toUser,int(time.time()), kuaidi)



else:

try:

msg = talk_api.talk(content)

returnself.render.reply_text(fromUser,toUser,int(time.time()), msg)

except:

                    return self.render.reply_text(fromUser,toUser,int(time.time(

这里重点就是加上了 elifmsgType == 'voice' 这部分。 示例:

这一步做完以后就已经实现了大部分我想要的功能了,但还是有一点问题,因为机器人并不理解上下文的语义,所以会出现这样的情况:

由于机器人并没有理解上下文语义,前一句话问你要去哪儿,你告诉他北京以后他却不知道你是因为什么回复的北京。所以要告诉机器人是谁在跟他聊天。 查看微信和图灵机器人的开发文档可以看到:

从微信接收到消息是,我们就能够获取到用户的 OpenID了,只需要将这个 ID 作为 userid 传给图灵机器人 API ,就可以保持上下文对话的语境了。(但是userid只支持0-9和数字,而微信 ID 中带有下划线,所以需要做一些简单处理) 修改talk_api.py (最终):

# -*- coding: utf-8 -*-

import requests

importjson

global s

s = requests.session()



def talk(content, userid):

url = 'http://www.tuling123.com/openapi/api'

da = {"key": "your key here", "info": content, "userid": userid}

data = json.dumps(da)

    r = s.post(url, data=data)

    j = eval(r.text)

code = j['code']

if code == 100000:

recontent = j['text']

elif code == 200000:

recontent = j['text']+j['url']

elif code == 302000:

recontent = j['text']+j['list'][0]['info']+j['list'][0]['detailurl']

elif code == 308000:

recontent = j['text']+j['list'][0]['info']+j['list'][0]['detailurl']

else:

recontent = '这货还没学会怎么回复这句话'

returnrecontent

可以看到,我们需要两个参数,content 和 userid 。

修改 weixinInterface.py(最终):

def POST(self):

str_xml = web.data() #获得post来的数据

        xml = etree.fromstring(str_xml)#进行XML解析

        #content=xml.find("Content").text#获得用户所输入的内容

msgType=xml.find("MsgType").text

fromUser=xml.find("FromUserName").text

toUser=xml.find("ToUserName").text

userid = fromUser[0:15]

        #picurl = xml.find('PicUrl').text

        #return self.render.reply_text(fromUser,toUser,int(time.time()), content)

ifmsgType == 'image':

try:

picurl = xml.find('PicUrl').text

datas = imgtest(picurl)

                return self.render.reply_text(fromUser, toUser, int(time.time()), '图中人物性别为'+datas[0]+'\n'+'年龄为'+datas[1])

except:

                return self.render.reply_text(fromUser, toUser, int(time.time()),  '识别失败,换张图片试试吧')

elifmsgType == 'voice':

content = xml.find('Recognition').text

try:

msg = talk_api.talk(content, userid)

returnself.render.reply_text(fromUser,toUser,int(time.time()), msg)

except:

                return self.render.reply_text(fromUser,toUser,int(time.time()), content + '这货还不够聪明,换句话聊天吧')

            #return self.render.reply_text(fromUser,toUser,int(time.time()), content)

else:

            content = xml.find("Content").text  # 获得用户所输入的内容

            if content[0:2] == u"快递":

post = str(content[2:])

                #result = cxkd.cxkd('')



                r = urllib2.urlopen('http://www.kuaidi100.com/autonumber/autoComNum?text='+post)

                h = r.read()

                k = eval(h)

kuaidi = k["auto"][0]['comCode']

                '''

                j = requests.get('http://www.kuaidi100.com/query?type=huitongkuaidi&postid=280472503105')

                l = j.text

                #l = j.read()

                #m = eval(l)

                #outcome = ''

                #for c in m['data']:

                '''

                    #outcome = outcome + c['time']+'   '+c['context']+'\n'



returnself.render.reply_text(fromUser,toUser,int(time.time()), kuaidi)



else:

try:

msg = talk_api.talk(content, userid)

returnself.render.reply_text(fromUser,toUser,int(time.time()), msg)

except:

                    return self.render.reply_text(fromUser,toUser,int(time.

提交代码即可。 测试:

原文发布于微信公众号 - Python中文社区(python-china)

原文发表时间:2017-01-14

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏Python绿色通道

使用Python自动化发布文章:(一)

写在前面:坚持解决一个问题,花了两三个小时的时间终于解决了问题,最后我的自动化发布文章的功能终于实现了。

4903
来自专栏编程

零基础如何自学Python

程序员在普通人眼里就像魔法师,一个脚本轻松抢几十盒月饼(虽然最后被开除),一个插件解决春运抢票难题,几十行代码搭建一个 Web 网站,用微信自动和妹纸聊天,在程...

5038
来自专栏程序员互动联盟

【前沿技术】啥叫实时虚拟化?

实时虚拟化听起来有点矛盾,但是它确实是有用的(在某些条件下),并且为 Linux 内核的灵活性又提供了一个强有力的证明。KVM2015 论坛的前两个演讲就详细的...

4234
来自专栏游戏杂谈

升级IOS8游戏上传自定义头像功能失效的问题

为了支持arm64,之前已经折腾了很久,昨晚打包准备提交苹果审核时,测试那边的同事反馈说游戏上传自定义头像功能不可用了。

912
来自专栏Youngxj

音乐搜索器 - 多站合一音乐搜索,音乐在线试听源码分享

5.3K3
来自专栏SAP最佳业务实践

SAP最佳业务实践:FI–资产会计(162)-20定期处理-S_ALR_87012936折旧模拟/初级成本计划

4.7.4 S_ALR_87012936折旧模拟/初级成本计划 您可以使用标准报表来帮助您预测复杂固定资产未来几年内的计划折旧。除简单清单显示选项外,还可以将...

3647
来自专栏星流全栈

15个你必须知道的Facebook开源项目

2792
来自专栏斑斓

工具 | 我们推荐的高效工具

几天前,ThoughtWorks China咨询师团队召开了一次团结的大会,成功的大会。为期三天的会议,分享的内容并不亚于坊间举行的技术大会,包含了敏捷组织转型...

3396
来自专栏Youngxj

[seo]新建网站做好SEO优化必看教程

1987
来自专栏Vamei实验室

树莓派:光阴的故事

作者:Vamei 出处:http://www.cnblogs.com/vamei 严禁任何形式转载。

1262

扫码关注云+社区

领取腾讯云代金券