Github近期最有趣的10款机器学习开源项目

来源:PaperWeekly

本文共900字,建议阅读6分钟。 本文为你罗列近期Github上十大有趣的机器学习开源项目。

-01-

Face Recognition

#世界上最简单的人脸识别库

本项目号称世界上最简单的人脸识别库,可使用 Python 和命令行进行调用。该库使用 dlib 顶尖的深度学习人脸识别技术构建,在户外脸部检测数据库基准(Labeled Faces in the Wild benchmark)上的准确率高达 99.38%。

项目链接:

https://github.com/ageitgey/face_recognition

-02-

MUSE

#多语言词向量 Python 库

由 Facebook 开源的多语言词向量 Python 库,提供了基于 fastText 实现的多语言词向量和大规模高质量的双语词典,包括无监督和有监督两种。其中有监督方法使用双语词典或相同的字符串,无监督的方法不使用任何并行数据。

无监督方法具体可参考 Word Translation without Parallel Data 这篇论文。

论文链接:

https://www.paperweekly.site/papers/1097

项目链接:

https://github.com/facebookresearch/MUSE

-03-

FoolNLTK

#中文处理工具包

本项目特点:

• 可能不是最快的开源中文分词,但很可能是最准的开源中文分词

• 基于 BiLSTM 模型训练而成

• 包含分词,词性标注,实体识别,都有比较高的准确率

• 用户自定义词典

项目链接:

https://github.com/rockyzhengwu/FoolNLTK

-04-

Arnold

#最擅长玩《毁灭战士》的游戏AI

本项目来自卡耐基梅隆大学,是 2017 年 VizDoom《毁灭战士》AI 死亡竞赛冠军 Arnold 的 PyTorch 开源代码。

论文链接:

https://www.paperweekly.site/papers/1440

项目链接:

https://github.com/glample/Arnold

-05-

Bottom-Up Attention VQA

#2017 VQA Challenge 第一名

本项目是 2017 VQA Challenge 第一名团队两篇论文的 PyTorch 复现。

论文:Bottom-Up and Top-Down Attention for Image Captioning and Visual Question Answering

链接:https://www.paperweekly.site/papers/754

论文:Tips and Tricks for Visual Question Answering: Learnings from the 2017 Challenge

链接:https://www.paperweekly.site/papers/1441

项目链接:

https://github.com/hengyuan-hu/bottom-up-attention-vqa

-06-

YOLOv2 - PyTorch

#PyTorch 版 YOLOv2

著名物体检测库 YOLOv2 的 PyTorch 版本,本项目还可以将训练好的 model 转换为适配 Caffe 2。

项目链接:

https://github.com/ruiminshen/yolo2-pytorch

-07-

Simple Railway Captcha Solver

#基于 CNN 的台铁订票验证码辨识

本项目利用简单的 Convolutional Neural Network 来实作辨识台铁订票网站的验证码,训练集的部分以模仿验证码样式的方式来产生、另外验证集的部分则自台铁订票网站撷取,再以手动方式标记约 1000 笔。

目前验证集对于 6 码型态的验证码的单码辨识率达到 98.84%,整体辨识成功率达到 91.13%。

项目链接:

https://github.com/JasonLiTW/simple-railway-captcha-solver

-08-

AlphaZero-Gomoku

#用 AlphaZero 下五子棋

这是一个将 AlphaZero 算法应用在五子棋的实现,由于五子棋相比围棋或国际象棋简单得多,所以只需几个小时就可以训练出一个不错的 AI 模型。

论文:AlphaZero: Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm

链接:https://www.paperweekly.site/papers/1297

论文:AlphaGo Zero: Mastering the game of Go without human knowledge

链接:https://www.paperweekly.site/papers/942

项目链接:

https://github.com/junxiaosong/AlphaZero_Gomoku

-09-

gym-extensions

#OpenAI Gym 扩展集

这是一个 OpenAI Gym 库的扩展包,实现了包括:多任务学习、迁移学习、逆增强学习等功能。

项目链接:

https://github.com/Breakend/gym-extensions

-10-

Myia

#Python 深度学习框架

Myia 是一个全新的 Python 深度学习框架,具有使用简单、自动微分和性能优化的特点。

项目链接:

https://github.com/mila-udem/myia

原文发布于微信公众号 - 数据派THU(DatapiTHU)

原文发表时间:2018-01-02

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏数说工作室

训练集是题库,测试集就是高考!| 不能更简单通俗的机器学习名词解释

1. train? valid? or test? 机器学习最明显的一个特点是需要大量的数据。特别对监督学习来说,就是需要大量的带标签数据(labeled da...

4538
来自专栏CVer

CVPR 2018 收录论文名单全公布

本文将介绍 CVPR 2018 所有录用论文的标题, 包括每篇论文属于 oral, spotlight还是 poster的情况. 大家可以根据论文的标题去 go...

1782
来自专栏AI科技大本营的专栏

AI 技术讲座精选:TensorFlow 图像识别功能在树莓派上的应用

【AI100 导读】上周 TensorFlow 1.0 的发布使之成为最有前景的深度学习框架,也在中国 AI 社区中掀起了学习 TensorFlow 的热潮,不...

4628
来自专栏AI科技大本营的专栏

AI 技术讲座精选:条件概率和贝叶斯定理简介

前 言 数据科学专家必须了解概率方面的知识。通常情况下,解决许多数据科学难题的办法与概率的本质息息相关。因此,更好地理解概率能够帮助你更有效率地理解并实现与之相...

3475
来自专栏机器学习人工学weekly

机器学习人工学weekly-2018/3/4

1. RL相关 1.1 inverse RL教程,第一部分就是讲Andrew Ng 20年前的奠基论文(我没读原论文,但是惊讶的发现居然全部是用的LP解的)。这...

4768
来自专栏机器学习人工学weekly

机器学习人工学weekly-2018/8/5

视频列表链接:https://www.youtube.com/playlist?list=PLBgogxgQVM9v0xG0QTFQ5PTbNrj8uGSS-

841
来自专栏AI科技大本营的专栏

快讯 | 玩游戏玩出一篇论文,清华大学团队获信息检索顶会 SIGIR 最佳学生论文奖

作者|周翔 最近几个月,以《王者荣耀》为代表的游戏受到了各方的攻击,其中以家长和老师的反应最为激烈。不过,玩物真的就一定会丧志吗?清华大学的几位学霸告诉你,玩游...

3387
来自专栏AI科技评论

干货 | 不能更通俗易懂的机器学习名词解释

train? valid? or test? 机器学习最明显的一个特点是需要大量的数据。特别对监督学习来说,就是需要大量的带标签数据(labeled dat...

3827
来自专栏AI科技大本营的专栏

推荐 | 机器学习开源项目 Top 10

编译 | AI科技大本营 一直为开发者提供优质学习资源的Mybridge最近又发布了一篇资源性文章:机器学习领域开源项目Top 10,AI科技大本营做了简要编译...

3008
来自专栏量子位

与神经网络相比,你对P图一无所知

从一张照片里取出某个元素,再把它神不知鬼不觉地混入另一张图片里,似乎是一件很有难度的事情。毕竟,分分钟就会产生魔性的拼贴效果,不管是手动操作,还是AI的计算。

952

扫码关注云+社区

领取腾讯云代金券