专栏首页专知2017年深度学习总结:文本和语音应用

2017年深度学习总结:文本和语音应用

【导读】近日,大数据科学家Volodymyr Fedak发布一篇博客,总结了2017年深度学习的发展:深度学习在文本和语音领域的应用。深度学习从发展伊始就在图像领域取得了越来越好的效果,当今,图像领域也是深度学习最成功的应用领域之一。那么,最新的深度学习在文本和语音方面的发展情况怎样呢?本文就这两个方面给出了最新的总结:从谷歌翻译到Facebook的chatbot,从DeepMind Wavenet到牛津大学唇读。作者介绍了2017年在文本和语音领域中最新的深度学习技术,非常值得一读。

Deep Learning summary for 2017: Text and Speech Applications

深度学习正在改造许多行业,你所在的行业可能也不例外。 来一起了解下2017年最值得关注的深度学习主流项目,紧跟最前沿新技术,否则下一个被新技术淘汰的可能就是你了。

深度学习(DL)应用早已跨越传统行业的界限。 从医疗服务到保险,从银行到市场推出了各种DL项目。 例如,中国的目标是成为人工智能领域的全球领先者,到2030年将创造一个1500亿美元的人工智能产业,而百度集团的研究人员则大胆预测,以后对数十亿个样本数据集进行实验也只是小菜一碟。

因此,每个企业都应该密切关注其行业中可能存在的深度学习应用。 我们列出了2017年最受关注的文本和言语相关的DL最新应用,让机器学习专业人士和锐意进取的决策者都受益匪浅。

▌文本相关的深度学习应用



DL应用程序最重要的领域之一是处理文本:比如翻译,聊天机器人,文本分析和其他很多任务。

从Google翻译...

一年前,Google宣布推出新的Google翻译训练算法 - 循环神经网络(Recurrent Neural Network)。 近些年来,机器翻译结果经历了从生成毫无意义的聚在到生成出几乎完美无暇的翻译。 这些成就令人吃惊,Google的DL RNN 在不断提高!

...到Facebook谈判者chatbot

你可能听说过一个关于Facebook如何开发聊天机器人的故事,并由于它发明了一种新的语言而关闭了它。 而真相是,DL算法确实产生了一个非人类的词典,但它并没有阻止它实现其目标。 其目标实际上是让AI在与对手的对话中取得成功(特别是掌握书籍,拿到帽子等),尤其是通过掌握文本对话。

机器人训练使用一个监督的循环网络与一个真正的谈判的文本成绩单庞大的数据集,进一步磨练系统使用加强训练,而并且使系统的两个实例互相对话达到训练的目的。 chatbot已经掌握了现实生活中的谈判技巧之一,即虚假的兴趣。 它表示对它实际上并不需要的项目表示兴趣,并同意只有在给出实际需要的项目时才把它交给对方。

一旦任务完成,用人语言的限制就被解除了,这就导致了这个系统发明了一些新的术语。 随意调试代码,看看你的情况发生了什么!

语音处理和生成


DL应用的另一个重要领域涉及语音处理。 它包括语音和音乐的生成,嘴唇动作的识别和同步等。

▌DeepMind Wavenet



在AlphaGo背后的公司,Google Deepmind目前正在开发WaveNet - 一种将输入文本转换为原始音频的算法。 与以前的尝试相比,它显示出非常好的结果。

到目前为止,这个网络的主要缺陷是它的性能,因为1秒的音频需要1-2分钟才能产生,但是这个进程是惊人的。 要说更多,算法甚至可以创建钢琴音乐! 更多细节可在这里的PDF中找到。

▌从谷歌DeepMind和牛津大学唇读



另一项来自Google DeepMind的倡议与来自牛津大学(Oxford University)的专家一起工作 - 在他们的联合论文中深入介绍了唇读算法。 使用超过100,000个句子,视频和音频文件的数据集,使用用于音频的LSTM,用于视频的CNN + LSTM以及这两个用于生成状态字符的状态向量的组合来训练该模型。

该系统适用于不同类型的输入:音频,视频,音频+视频,使得这种算法是多元的。

▌嘴唇运动与音频流的同步



华盛顿大学处理了超过1万小时的奥巴马总统讲话的高清记录,并开发了一种能够使嘴唇运动与音频同步的DL算法。

这为游戏行业和CGI电影创造了巨大的能力......但是令人担忧的是,下一次总统演讲可能实际上是计算机生成的镜头,而不是真实的记录。

https://www.youtube.com/watch?v=9Yq67CjDqvw

▌结论



深度学习正在不断地在各个领域展示出新的激动人心新成就。 我们将在接下来的几周内描述机器感知的进步,强化学习和其他各种应用,敬请期待更新!

原文链接:

https://towardsdatascience.com/deep-learning-summary-for-2017-text-and-speech-applications-9ea02bb3835f

本文分享自微信公众号 - 专知(Quan_Zhuanzhi),作者:专知内容组(编)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2018-02-05

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 【下载】面向Python深度学习实战书籍《Deep Learning with Python》

    【导读】机器学习专家Nikhil S. Ketkar博士撰写的Python深度学习实战《Deep Learning with Python: A Hands-o...

    WZEARW
  • 【2017NIPS报告】Hinton高徒 Yee Whye Teh 《贝叶斯深度学习与深度贝叶斯学习》

    【导读】12月7日,第31届神经信息处理系统大会(Neural Information Processing Systems,NIPS)邀请牛津大学统计学教授、...

    WZEARW
  • 【深度学习中文讲义完整版】复旦邱锡鹏老师《神经网络与深度学习》教程分享(附pdf下载)

    【导读】复旦大学副教授、博士生导师、开源自然语言处理工具FudanNLP的主要开发者邱锡鹏(http://nlp.fudan.edu.cn/xpqiu/)老师撰...

    WZEARW
  • 2020人工智能课程超级大列表:深度学习-强化学习-图神经网络-自然语言处理等

    本篇博文主要为大家介绍一个课程网站,汇集了机器学习,深度学习、强化学习的各个方面,包括:

    深度学习技术前沿公众号博主
  • 吕乐:面向医学图像计算的深度学习与卷积神经网络(65ppt)

    【新智元导读】本文是美国国家研究院健康临床中心(NIH-CC)吕乐在GTC DC上的演讲整理,主题有关利用深度学习和深度神经网络进行医学影像分析。 ? 放射医学...

    新智元
  • 无人驾驶、语音识别这些大火的技术都怎么实现的?

    很早之前,我就听雷军说过一句话:“站在风口上,猪都可以飞起来!”这句话用来形容现在的深度学习非常贴切。近几年来,深度学习的发展极其迅速,其影响力已经遍地开花,在...

    CSDN技术头条
  • 一篇文章解决机器学习,深度学习入门疑惑

    研究生有不少日子,和之前的几个学长以及几个学弟偶尔也聊聊天。大部分聊的话题无关乎这几年大火的机器学习深度学习神经网络,而这篇文章的目的,则是从学生的角度(不管是...

    OLDPAN
  • 机器学习(一)--------简介

    包括机器学习(Machine Learning)、专家系统、、进化计算、模糊逻辑、计算机视觉、自然语言处理、推荐系统等。

    实时计算
  • 机器学习 vs. 深度学习

    在这篇文章中,我们将研究深度学习和机器学习的对比。我们也将分别学习它们。我们还将讨论他们在不同问题上的分歧。在进行深度学习和机器学习比较的同时,我们也会研究它们...

    程序你好
  • 机器学习和深度学习有什么区别?

    在本文中,我们将研究深度学习和机器学习之间的差异。我们将逐一了解它们,然后讨论他们在各个方面的不同之处。除了深度学习和机器学习的比较外,我们还将研究他们未来的趋...

    liuxuewen

扫码关注云+社区

领取腾讯云代金券