前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >你比个手势,AI就识别出Emoji,浏览器上跑:已开源,推特2.8万赞

你比个手势,AI就识别出Emoji,浏览器上跑:已开源,推特2.8万赞

作者头像
AI算法与图像处理
发布2019-05-22 18:42:43
8930
发布2019-05-22 18:42:43
举报
圆栗子 发自 凹非寺 量子位 报道 | 公众号 QbitAI

一只手势识别AI,怎样才算得上 (优) 秀啊?

不停地变换姿势,都能实时输出Emoji,大约是很秀了:

?是守卫 (误) ,是来自《星际旅行》瓦肯的举手礼。不大常用,做起来甚至有难度。

?是好运,一般会两只手一起比。不过,也不是人类通用的手势。

即便这样,AI依然机智地识别出来。并且,它是在浏览器上跑,也几乎没有延时

AI的爸爸,名字叫Nick Bourdakos (简称“尼克”) ,是来自IBM的程序猿。

尼克把自己的调教成果发了推特,揽下2.8万赞

666

尼克用的是TensorFlow.js,实时识别毫无压力。

他把算法开源了,说大家都可以试一试。

半小时就好

尼克说这个模型很简单,就是SSD-MobileNet

MobileNet是分类,SSD是目标检测,搭配食用也是常规方法。

他是用IBM云上的GPU训练的,免费的k80,半小时就训练好了。

在训练开始之前,要先准备数据:AI吃的是标注过的手势图

准备就绪,就来安装模型吧:

代码语言:javascript
复制
1$ npm install -g cloud-annotations

然后,可以开始训练了:

代码语言:javascript
复制
 1$ cacli
 2┌─────────────────────────────┐
 3│ (C)loud (A)nnotations (CLI) │
 4│ version 1.0.12              │
 5└─────────────────────────────┘
 6
 7Usage: cacli <command>
 8
 9where <command> is one of:
10  init         Interactively create a config.yaml file
11  train        Start a training run
12  logs         Monitor the logs of a training run
13  progress     Monitor the progress of a training run
14  list         List all training runs
15  download     Download a trained model
16
17cacli <cmd> -h     quick help on <cmd>

当然,也不是非要用IBM云,也不是非要用GPU。拿CPU也能调教AI,大概要几小时吧。

训练完成,该在浏览器上跑了。GitHub项目里,自带了转换为TensorFlow.js模型的脚本。

把模型添加到React App里面。

最后,写一句nmp start,用浏览器打开http://localhost:3000。

耶,这样就可以对着屏幕随意舞动手指了,你的AI会明白的:

当然,这只机智的AI,才不是只能识别手指。

喝点什么

只看你用什么样的数据去投喂AI了。

曾经,尼克就帮AI修炼了分辨汽水的眼力。

第一题:一瓶雪碧,一瓶Canada Dry,都是绿色。

不管调换位置、还是侧过瓶身,AI都不会被迷惑。定格一看:

第二题:加大难度,两瓶都是Mountain Dew,一瓶普通一瓶低糖。

AI依然分得清楚,毫不犹豫。

分辨手势,分辨汽水,都不失水准。

那么问题来了,你想让AI识别什么呢?

想好了就开始调教吧,代码在这里:

https://github.com/cloud-annotations/training/

P.S. 推特评论区,已经有小伙伴亲测成功,并表示Easy。

再把识别结果,显示成Emoji就完美了

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-05-16,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 AI算法与图像处理 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 半小时就好
  • 喝点什么
相关产品与服务
对象存储
对象存储(Cloud Object Storage,COS)是由腾讯云推出的无目录层次结构、无数据格式限制,可容纳海量数据且支持 HTTP/HTTPS 协议访问的分布式存储服务。腾讯云 COS 的存储桶空间无容量上限,无需分区管理,适用于 CDN 数据分发、数据万象处理或大数据计算与分析的数据湖等多种场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档