首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >来和这个机器人玩玩“石头剪刀布”,享受被支配的快感吧

来和这个机器人玩玩“石头剪刀布”,享受被支配的快感吧

作者头像
新智元
修改2019-08-13 11:34:48
7410
修改2019-08-13 11:34:48
举报
文章被收录于专栏:新智元新智元


新智元报道

来源:reddit

编辑:大明

【新智元导读】来和机器人玩“石头剪刀布”,体验被支配的快感!Reddit上一位大神用3层简单RNN训练出一个“石头剪刀布”大师,你下一把想出什么,它都能猜个差不多。采用3D打印的漂亮外壳,纽扣电池即可供电,不服来战!关注新智元和群,了解更多前沿AI资讯!

我们每个人都玩过石头剪刀布,这个简单的游戏,似乎总有人特别擅长。你总觉得自己出什么,都尽在对面的掌握之中。

终于,在你连输N次5局3胜的比试,被弹了一头包之后,你硬着头皮问对面那个满脸得意的人:“哥,你咋怎么厉害呢?”

对面一般会一脸神秘又略带不屑地对你说一句:“你要出啥,我早都预料到了。”

近日Reddit上热议的一个话题就是,如何用机器学习练出一个玩“石头剪刀布”的大师出来。

也许这篇文章的作者小时候也被大神蹂躏过。他利用机器学习训练模型,造出了一台会玩“石头剪刀布”的微型机器人,它的本事就是预测对面下一次出啥。

作者表示,这个机器人在机器学习原理方面并不复杂,模型使用的网络是一个小型的3层vanilla RNN(在TensorFlow/keras中训练),训练数据是两名玩家玩”石头剪子布”的记录数据,将这些数据作为输入,并预测输出对手下一步会出什么。这些记录数据来自roshambo.me上的真人游戏信息。

“我添加了一些周期序列的模拟数据,人们在与AI对战时很可能会尝试的做这些事情。”

如果没有模拟数据(易于预测),模型在测试集上的准确率达到38%(相比之下,完全随机对战的胜率为33%,这么看,其实也没强太多?)。

模型在较大批规模进行训练时遇到了一些问题(无论是填充还是填充和屏蔽渐变)所以最后训练的批规模(batch_size)为1,这对于规模如此之小的网络来说还是可以接受的。

更有趣的部分是,这个网络能够在一个小型微控制器上运行。对网络权重进行量化(以8位整型数据存储)可以节省一些空间,因为使用的微控制器只有2kB RAM和16kB闪存,计算是使用软件浮点数完成的,性能不是真正的问题。微控制器上运行的C语言代码都是定制的,不是特别复杂。

最终的实体设备大约为硬币大小(但更厚一些)。使用定制的PCB板,由CR2032纽扣电池即可供电,并有一个漂亮的3D打印外壳。外形上非常接近我之前定制完成的电子骰子,所以其实工作量不是太大。

参考链接:

Reddit:

https://www.reddit.com/r/MachineLearning/comments/ca88r4/p_a_little_gadget_that_plays_rockpaperscissors/

GitHub:

https://github.com/PaulKlinger/rps-rnn

视频:

https://www.youtube.com/watch?v=iuTKBHW0OaU

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-07-12,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 新智元 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 【新智元导读】来和机器人玩“石头剪刀布”,体验被支配的快感!Reddit上一位大神用3层简单RNN训练出一个“石头剪刀布”大师,你下一把想出什么,它都能猜个差不多。采用3D打印的漂亮外壳,纽扣电池即可供电,不服来战!关注新智元和群,了解更多前沿AI资讯!
相关产品与服务
数据保险箱
数据保险箱(Cloud Data Coffer Service,CDCS)为您提供更高安全系数的企业核心数据存储服务。您可以通过自定义过期天数的方法删除数据,避免误删带来的损害,还可以将数据跨地域存储,防止一些不可抗因素导致的数据丢失。数据保险箱支持通过控制台、API 等多样化方式快速简单接入,实现海量数据的存储管理。您可以使用数据保险箱对文件数据进行上传、下载,最终实现数据的安全存储和提取。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档