前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >语音对话机器人

语音对话机器人

原创
作者头像
大发明家
发布2021-12-06 14:02:12
4K0
发布2021-12-06 14:02:12
举报
文章被收录于专栏:技术博客文章

一、材料准备

1、树莓派一个

2、免驱动USB麦克风

3、耳机

二、教程开始

1.录音

插上麦克风

我用到的是使用了arecord* 测试是否麦克风能否使用。

使用录音输入如下命令

代码语言:txt
复制
arecord -D "plughw:1" -f S16_LE -r 16000 -d 3 /home/pi/Desktop/voice.wav

2.语音识别

建立语音识别文件夹输入如下程序

代码语言:txt
复制
sudo nano yuyinshibie.py

去百度语音官网申请语音识别

img

写代码进去 将上面申请的ID和secret写进下面红色区域

代码语言:txt
复制
\# coding: utf-8
代码语言:txt
复制
import sys 
代码语言:txt
复制
 import json 
代码语言:txt
复制
 import urllib2 
代码语言:txt
复制
 import base64 
代码语言:txt
复制
 import requests
代码语言:txt
复制
reload(sys) 
代码语言:txt
复制
 sys.setdefaultencoding(“utf-8”)
代码语言:txt
复制
def get_access_token(): 
代码语言:txt
复制
 url = “https://openapi.baidu.com/oauth/2.0/token” 
代码语言:txt
复制
 body = { 
代码语言:txt
复制
 “grant_type”:”client_credentials”, 
代码语言:txt
复制
 “client_id” :”此处填写自己的client_id”, 
代码语言:txt
复制
 “client_secret”:”此处填写自己的client_secret”, 
代码语言:txt
复制
 }
代码语言:txt
复制
r = requests.post(url,data=body,verify=True)
代码语言:txt
复制
respond = json.loads(r.text)
代码语言:txt
复制
return respond["access_token"]
代码语言:txt
复制
def yuyinshibie_api(audio_data,token): 
代码语言:txt
复制
 speech_data = base64.b64encode(audio_data).decode(“utf-8”) 
代码语言:txt
复制
 speech_length = len(audio_data) 
代码语言:txt
复制
 post_data = { 
代码语言:txt
复制
 “format” : “wav”, 
代码语言:txt
复制
 “rate” : 16000, 
代码语言:txt
复制
 “channel” : 1, 
代码语言:txt
复制
 “cuid” : “B8-27-EB-BA-24-14”, 
代码语言:txt
复制
 “token” : token, 
代码语言:txt
复制
 “speech” : speech_data, 
代码语言:txt
复制
 “len” : speech_length 
代码语言:txt
复制
 }
代码语言:txt
复制
url = "http://vop.baidu.com/server_api"
代码语言:txt
复制
json_data = json.dumps(post_data).encode("utf-8")
代码语言:txt
复制
json_length = len(json_data)
代码语言:txt
复制
\#print(json_data)
代码语言:txt
复制
req = urllib2.Request(url, data=json_data)
代码语言:txt
复制
req.add_header("Content-Type", "application/json")
代码语言:txt
复制
req.add_header("Content-Length", json_length)
代码语言:txt
复制
\#print("asr start request\n")
代码语言:txt
复制
resp = urllib2.urlopen(req)
代码语言:txt
复制
\#print("asr finish request\n")
代码语言:txt
复制
resp = resp.read()
代码语言:txt
复制
resp_data = json.loads(resp.decode("utf-8"))
代码语言:txt
复制
if resp_data["err_no"] == 0:
代码语言:txt
复制
  return resp_data["result"]
代码语言:txt
复制
else:
代码语言:txt
复制
  print(resp_data)
代码语言:txt
复制
  return None
代码语言:txt
复制
def asr_main(filename,tok): 
代码语言:txt
复制
 try: 
代码语言:txt
复制
 f = open(filename, “rb”) 
代码语言:txt
复制
 audio_data = f.read() 
代码语言:txt
复制
 f.close() 
代码语言:txt
复制
 resp = yuyinshibie_api(audio_data,tok) 
代码语言:txt
复制
 return resp[0] 
代码语言:txt
复制
 except Exception,e: 
代码语言:txt
复制
 print “e:”,e 
代码语言:txt
复制
 return “识别失败”.encode(“utf-8”)

代码图示根据图改缩进

识别完成之后呢 我们就要开始第三步了 我们要和机器人对话

那么它一定得回复我们,对吧。为了能够智能点,我们就用到了图灵得接口图灵真的非常好用能够 查天气语音**讲故事**讲笑话 下面附上第三步的代码

3、“图灵回复"

(1)去图灵机器人官网注册创建一个微信机器人

在这里插入图片描述

(2)创建图灵机器人文件输入代码

代码语言:txt
复制
sudo nano Turling.py

(3) 写入代码,在红色处写自己申请的API KEY

代码语言:txt
复制
\# coding: utf-8
代码语言:txt
复制
import requests
代码语言:txt
复制
import json
代码语言:txt
复制
import sys
代码语言:txt
复制
reload(sys)
代码语言:txt
复制
sys.setdefaultencoding("utf-8")
代码语言:txt
复制
def Tuling(words):
代码语言:txt
复制
  Tuling_API_KEY = "此处填写自己的Turling KEY"
代码语言:txt
复制
  body = {"key":Tuling_API_KEY,"info":words.encode("utf-8")}
代码语言:txt
复制
  url = "http://www.tuling123.com/openapi/api"
代码语言:txt
复制
  r = requests.post(url,data=body,verify=True)
代码语言:txt
复制
  if r:
代码语言:txt
复制
    date = json.loads(r.text)
代码语言:txt
复制
    print date["text"]
代码语言:txt
复制
    return date["text"]
代码语言:txt
复制
  else:
代码语言:txt
复制
    return None

根据图片改代码缩进

4、语音合成

图灵回复了之后 我们要让它播放出来 就用到了百度的语音合成

(1)创建语音合成文件

代码语言:txt
复制
sudo nano yuyinhecheng.py

(2)写代码

代码语言:txt
复制
\# coding: utf-8
代码语言:txt
复制
import sys 
代码语言:txt
复制
 import urllib2 
代码语言:txt
复制
 import json 
代码语言:txt
复制
 import os 
代码语言:txt
复制
 import yuyinshibie
代码语言:txt
复制
reload(sys) 
代码语言:txt
复制
 sys.setdefaultencoding(“utf-8”)
代码语言:txt
复制
def yuyinhecheng_api(tok,tex): 
代码语言:txt
复制
 cuid = “B8-27-EB-BA-24-14” 
代码语言:txt
复制
 spd = “4” 
代码语言:txt
复制
 url = “http://tsn.baidu.com/text2audio?tex=“+tex+”&lan=zh&cuid=”+cuid+”&ctp=1&tok=”+tok+”&per=3” 
代码语言:txt
复制
 \#print url 
代码语言:txt
复制
 \#response = requests.get(url) 
代码语言:txt
复制
 \#date = response.read() 
代码语言:txt
复制
 return url
代码语言:txt
复制
def tts_main(filename,words,tok): 
代码语言:txt
复制
 voice_date = yuyinhecheng_api(tok,words)
代码语言:txt
复制
f = open(filename,"wb")
代码语言:txt
复制
f.write(voice_date)
代码语言:txt
复制
f.close()

根据图片改缩进

5、播放

语音合成之后我们要播放出来用到了mpg123为什么我会用这个呢因为它可以直接播放网页上的音频非常的好用

安装mpg123

代码语言:txt
复制
sudo apt-get install mpg123 

安装好了之后 我后面等用到了再说怎么用 现在先不说

现在录音 语音识别 语音合成 播放 所需要的工具 代码都准备好了 下面就开始整合在一起

6、整合

创建最终文件

代码语言:txt
复制
sudo nano yuyin.py

写代码

代码语言:txt
复制
\# coding: utf-8
代码语言:txt
复制
import os
代码语言:txt
复制
import time
代码语言:txt
复制
import yuyinhecheng
代码语言:txt
复制
import Turling
代码语言:txt
复制
import yuyinshibie
代码语言:txt
复制
tok = yuyinshibie.get_access_token()
代码语言:txt
复制
switch = True
代码语言:txt
复制
while switch:
代码语言:txt
复制
  os.system('sudo arecord -D "plughw:1" -f S16_LE -r 16000 -d 3 /home/pi/Desktop/voice.wav')
代码语言:txt
复制
  time.sleep(0.5)
代码语言:txt
复制
  info = yuyinshibie.asr_main("/home/pi/Desktop/voice.wav",tok)
代码语言:txt
复制
  if '关闭'.encode("utf-8") in info:
代码语言:txt
复制
    while True:
代码语言:txt
复制
      os.system('sudo arecord -D "plughw:1" -f S16_LE -r 16000 -d 10 /home/pi/Desktop/voice.wav')
代码语言:txt
复制
      time.sleep(10)
代码语言:txt
复制
      info = yuyinshibie.asr_main("/home/pi/Desktop/voice.wav",tok)
代码语言:txt
复制
      if '开启'.encode("utf-8") in info:
代码语言:txt
复制
        break
代码语言:txt
复制
    url = "http://tsn.baidu.com/text2audio?tex=开启成功&lan=zh&cuid=B8-27-EB-BA-24-14&ctp=1&tok="+tok+"&per=3"
代码语言:txt
复制
    os.system('mpg123 "%s"'%url)
代码语言:txt
复制
  elif '暂停'.encode("utf-8") in info:
代码语言:txt
复制
    url = "http://tsn.baidu.com/text2audio?tex=开始暂停&lan=zh&cuid=B8-27-EB-BA-24-14&ctp=1&tok="+tok+"&per=3"
代码语言:txt
复制
    os.system('mpg123 "%s"'%url)
代码语言:txt
复制
    time.sleep(10)
代码语言:txt
复制
    url = "http://tsn.baidu.com/text2audio?tex=暂停结束&lan=zh&cuid=B8-27-EB-BA-24-14&ctp=1&tok="+tok+"&per=3"
代码语言:txt
复制
    os.system('mpg123 "%s"'%url)
代码语言:txt
复制
    continue
代码语言:txt
复制
  else:
代码语言:txt
复制
    tex = Turling.Tuling(info)
代码语言:txt
复制
    url = yuyinhecheng.yuyinhecheng_api(tok,tex)
代码语言:txt
复制
    os.system('mpg123 "%s"'%url)
代码语言:txt
复制
    time.sleep(0.5)

根据图改缩进

img

7、运行

最后就可以运行机器人了

输入代码

代码语言:txt
复制
sudo python yuyin.py

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
作者已关闭评论
0 条评论
热度
最新
推荐阅读
目录
  • 二、教程开始
    • 1.录音
      • 2.语音识别
        • 3、“图灵回复"
          • 4、语音合成
            • 5、播放
              • 6、整合
                • 7、运行
                相关产品与服务
                语音合成
                语音合成(Text To Speech,TTS)满足将文本转化成拟人化语音的需求,打通人机交互闭环。提供多场景、多语言的音色选择,支持 SSML 标记语言,支持自定义音量、语速等参数,让发音更专业、更符合场景需求。语音合成广泛适用于智能客服、有声阅读、新闻播报、人机交互等业务场景。
                领券
                问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档