【教程】看看大神的思路!机器学习界网红7分钟教你如何搭建Chatbot?(中文版)

Siraj Raval 作为深度学习领域的自媒体人在欧美可以说是无人不知、无人不晓。

凭借在 Youtube 上的指导视频,Siraj Raval 在全世界吸粉无数,堪称是机器学习界的网红。说他是全球范围内影响力最大的 ML 自媒体人,怕也无异议。

因此,雷锋网 AI 研习社联系到了Siraj 本人,并获得授权将他最精华的 Youtube 视频进行字幕汉化,免费推送给大家。我们将不定期更新,敬请关注!

今天 Siraj 就带领大家做一个自己的 Chatbot(文末有GitHub链接)

视频内容

(建议在Wi-Fi环境下观看视频,土豪随意~)

为了方便流量不足的小伙伴们在路上看,我们特意整理出了文字版和动图~

微信、Skype、Messager以及其他主流通信软件如今都已经搭建了聊天机器人,许多科技巨头纷纷推出各自的聊天助手,各大电商也越来越多地使用聊天机器人参与客服工作。

不过Chatbot可以为你做些什么实实在在的事情呢?你可以和CNN机器人聊天来获取实时新闻,也可以让机器人订花送给女票... ...等等,没有女票?没关系,说出你的要求,让婚恋机器人给你介绍。

看来学会搭建一个Chatbot还是很有必要的。Siraj会带你用TensorFlow建一个聊天机器人,使用递归神经网络算法(RNN),步骤是下载数据集,创建模型,训练模型,聊天测试。

Step1 下载数据集

这里会用到来自康奈尔大学的电影对话数据集。包含了超过600部的好莱坞电影的对话。(恩,可以和女票秀一下深厚的台词功力了。)首先要下载数据集到数据文档中,然后将其切分为两个不同的训练数据集(分别为问和答)进行预处理。

Step2 创建模型

这里用到的模型是 seq2seq,它包含两个 LSTM 递归神经网络,第一个是 encoder 负责处理 input,第二个是 decoder 负责生成 output。使用encoder和decoder作为输入参数,把词汇转为向量形式。

Step3 训练模型

这是很小的数据集,完成整个训练可能也就几个小时。

Step4 聊天测试

随着训练进行,回答会越来越有逻辑。你投入的数据越多,聊得会越开心。

完整代码和数据集请参考Github链接(点击文末阅读原文进入)。

---------------------------------------------

Siraj Raval 何许人也?

Siraj Raval是YouTube极客网红,曾任职于Twilio和Meetup,客户包括Elon Mask和Google,教大家如何使用机器学习开发聊天机器人、无人驾驶车、AI艺术家等视频点击量累计数百万。

Siraj Raval 为什么这么火?

首先,当然是这位哥伦比亚大学高材生活儿好技术好,用自己特有的方式三言两语就能抛出一个原本晦涩的 ML、DL 概念,让听众细细咀嚼。再者,这家伙幽默逗比、口才便给。兴之所至常手舞足蹈,瞳仁奇光掩映,口吐智慧莲华。深度学习讲师不少,但这么风趣可亲的却不多。

原文发布于微信公众号 - AI研习社(okweiwu)

原文发表时间:2017-04-28

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏华章科技

有了800件T恤测量数据,能选出最合身的尺寸吗?

大家,特别是男士们,对于购买T恤,会为到底挑选那个牌子或选择尺码伤脑筋。今天的这篇文章为大家购买T恤,特别是购买国外品牌时,提供一点参考。

9320
来自专栏PPV课数据科学社区

大数据告诉你,如何写论文能上核心期刊

评职称要发论文,可是为什么论文投出去,都石沉大海、毫无音讯了呢?隔壁的王教授、张老师,为什么写一篇论文,核心期刊就发一篇,他有什么秘诀? 各位老师、同学,是不...

39430
来自专栏AI科技大本营的专栏

实战干货 | 这位成功转型机器学习的老炮,想把他多年的经验分享给你

这个年代,不怕你是大牛,就怕大牛还会写文章。 作为AI100智库专家,智亮总是能在口若悬河中,让人深入浅出地学到一堆堆干货,掏心窝子的干货。 多年的实战经验...

416100
来自专栏机器之心

开源 | 谷歌发布 Coarse Discourse:迄今为止最大的在线讨论标注数据集

选自Google Research Blog 作者:Praveen Paritosh等 机器之心编译 参与:蒋思源 近日,谷歌官方研究博客发布了一个开源数据集,...

31190
来自专栏量子位

用深度学习检测冠心病:不依赖血管造影且成本下降25%

安妮 编译自 英伟达官方博客 量子位出品 | 公众号 QbitAI 冠心病是人类的一大杀手,全球每年将近900万人死于冠心病。在美国,每年有1200万到1300...

38250
来自专栏机器学习人工学weekly

机器学习人工学2017/12/31

这周国外过节比较清净。注意下面很多链接需要开学上网,无奈国情如此 1. Facebook AML团队发文,从应用的角度披露了很多FB内部用的机器学习系统,其...

29760
来自专栏企鹅号快讯

机器学习人工学2017/12/31

这周国外过节比较清净。注意下面很多链接需要开学上网,无奈国情如此 1. Facebook AML团队发文,从应用的角度披露了很多FB内部用的机器学习系统,其中S...

23770
来自专栏ATYUN订阅号

OpenAI:人工智能程序在Dota2的5V5比赛在中击败人类玩家

国外人工智能团队OpenAI在一篇博客文章中透露,为Dota 2设计的最新版本AI击败了五支业余选手团队,其中包括一个由Valve员工组成的团队。上一代 Ope...

12040
来自专栏思影科技

HBM:阅读中语音产生期间的脑功能近红外光谱研究

摘要:发表在Human Brain Mapping上的一篇文章使用fNIRS探究了和发音并发声相关联的言语过程中皮层血流动力学和功能连接程度。被试在进行fNIR...

38590
来自专栏ATYUN订阅号

研究人员开发AI系统,从临床记录中预测急性肾损伤风险

急性肾损伤(AKI)是一种肾脏突然无法过滤血液中的废物的情况,可能会破坏危重病人的肾脏系统。如果超过第二阶段(AKI分为三个阶段),死亡率可接近89%。如果在腹...

13010

扫码关注云+社区

领取腾讯云代金券