前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >边玩边入门深度学习,我们帮你找了10个简易应用demo

边玩边入门深度学习,我们帮你找了10个简易应用demo

作者头像
大数据文摘
发布2018-05-24 16:50:16
1.6K0
发布2018-05-24 16:50:16
举报
文章被收录于专栏:大数据文摘大数据文摘

大数据文摘作品,转载要求见文末

编译 | 江凡、刘云南、钱天培

导读:想玩转深度学习,又不想从一开始就接触大量的理论和数学公式,怎么办?别怕,我们为你找了10个应用到前沿深度学习技术的简易demo。一起来试试!

语音识别、图像识别、作曲作画,甚至是帮你玩游戏。

这些深度学习“diao炸天”的应用相信对你来说早已经不陌生了。既然深度学习这么神通广大,就让我们一起开心地学习深度学习吧!

赶紧找到一本深度学习教程,翻开。接下来,你看到的画面可能是 理论、理论、理论、数学、数学、数学......

妈妈,我再也不想学深度学习了。

No worries!别急。我们在这里给你搜集了10个炫酷的深度学习的demo和代码来源。没有理论、没有数学,代码下载完就能迅速开始运行,和神烦的各种前置软件条件说拜拜。

下面我们将要介绍的模型,每一个都只需不到10分钟的下载时间,然后就可以在Macbook或者亚马逊云计算(AWS)上开始运行了。他们运行的时间在在5秒钟(已训练过的神经网络)和几小时(GPU密集型神经网络训练)之间。如果你等不了几小时,那5秒钟你总还是有的吧?

1. 用深度强化学习(Deep Q-learning)玩Flappy Bird

如果你玩过Flappy Bird,那一定会对这只又蠢又丑的鸟不陌生吧。这只不听话的鸟在经过深度强化学习训练后的自动操作中可是身手敏捷,一路披荆斩棘哦。

视频内容

代码:https://github.com/yenchenlin/DeepLearningFlappyBird

2. 用谷歌Magenta基础循环神经网络(RNN)实现长短期记忆网(LSTM)的音乐生成

想学文艺青年给对象写首歌,又苦于没有音乐细胞?让程序猿来拯救你吧!下面你听到的这段复调旋律就是用谷歌Magenta的基础循环神经网络制作而成的,是不是毫无违和感呢。

视频内容

代码:https://github.com/tensorflow/magenta/tree/master/magenta/models/melody_rnn#basic

3. 用iOS语音APIs实现实时字幕

接下来这个demo也是相当实用的,生肉经过这个API可以一秒变鲜肉,再也不用担心下载的美剧没有字幕了。

视频内容

代码:https://github.com/zats/SpeechRecognition

4. 用iOS语音APIs实现符号化的人工智能语音识别

这个demo的名字听起来很有技术范,其实本质还是语音识别的应用。什么叫“符号化”语音识别呢?让我们一起来看看这个demo就明白了。

代码:https://github.com/darjeelingsteve/speech-recognition

5. 用Torch7转换视频风格

想制作出你符合你口味的风格的视频?福利来了!现在你可以用Torch7轻轻松松将梵高大名鼎鼎的《星月夜》和小蝴蝶飞在花丛中的视频混搭起来。于是你就得到了一个梵高画风的视频。虽然比不上梵高大师本人,但拿来耍耍帅也是绰绰有余了。

代码:http://demos.algorithmia.com/colorize-photos/

6. Algorithmia 图像自动填色API

相信每个人家里都存了几张黑白老照片吧(比如你曾祖母年轻时的美照)。想知道那些黑白照片填上颜色后到底是什么样的吗?那就来试试Algorithmia的这个API吧。

代码:http://demos.algorithmia.com/colorize-photos/

7. 安卓上视频的Clarifai信息提取

下面的demo展示的是一个运用人工智能、机器学习、深度学习等技术的库,名为onyx。onyx可以自动识别出某一个app所展示的内容,比如你可以用它来识别一张图片的性质,并决定要不要屏蔽这张图片。如果你家里有个小孩的话,你就可以用这个库来审查你小孩用的app的内容。

代码:https://github.com/hanuor/onyx

8. 基于TensorFlow的价值迭代网络实现(NIPS ‘16 会议最佳论文奖)

下面我们要介绍的demo在Tensorflow上实现了价值迭代网络(NIPS ‘16 会议最佳论文奖)这一算法。如果你对这一算法有所耳闻,那这一demo是你不容错过的。

代码:https://github.com/TheAbhiKumar/tensorflow-value-iteration-networks

下面的2个demo是在iOS系统上实现的深度学习的应用。

9. iOS上基于TensorFlow的卷积神经网络实现

这一demo展示了在OS上实现的卷积神经网络图像识别。准确率还是相当不错的。

代码:https://github.com/LunarFlash/convolutional-neural-network-image-recognition

iOS上的“你只活一次”(YOLO-You Only Live Once)的项目也有着异曲同工之妙,这一项目借助图像识别让盲人第一次看见世界。

代码:https://github.com/hollance/Forge/tree/master/Examples/YOLO

10. 在iOS上挑战MNIST数据库

对深度学习有所了解的同学一定对MNIST数据库不陌生了,让我们试着在iOS上迅速解决这个经典问题吧!

代码:https://github.com/hollance/Forge/tree/master/Examples/MNIST

最后,让我们感谢那些模型创建者:Algorithmia, Clarifai, Anant Gupta,Abhishek Kumar, Yen-Chen Lin, Sash Zats, Marc Brown, Terry Wang,Matthijs Hollemans, Stephen Anthony, Manuel Ruder, 和Shantanu Johri。

关于转载 如需转载,请在开篇显著位置注明作者和出处(转自:大数据文摘 | bigdatadigest),并在文章结尾放置大数据文摘醒目二维码。无原创标识文章请按照转载要求编辑,可直接转载,转载后请将转载链接发送给我们;有原创标识文章,请发送【文章名称-待授权公众号名称及ID】给我们申请白名单授权。未经许可的转载以及改编者,我们将依法追究其法律责任。联系邮箱:zz@bigdatadigest.cn。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2017-07-13,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 大数据文摘 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
语音识别
腾讯云语音识别(Automatic Speech Recognition,ASR)是将语音转化成文字的PaaS产品,为企业提供精准而极具性价比的识别服务。被微信、王者荣耀、腾讯视频等大量业务使用,适用于录音质检、会议实时转写、语音输入法等多个场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档