Github近期最有趣的10款机器学习开源项目

来源:PaperWeekly

本文共900字,建议阅读6分钟。

本文为你罗列近期Github上十大有趣的机器学习开源项目。

-01-

Face Recognition

#世界上最简单的人脸识别库

本项目号称世界上最简单的人脸识别库,可使用 Python 和命令行进行调用。该库使用 dlib 顶尖的深度学习人脸识别技术构建,在户外脸部检测数据库基准(Labeled Faces in the Wild benchmark)上的准确率高达 99.38%。

项目链接:

https://github.com/ageitgey/face_recognition

-02-

MUSE

#多语言词向量 Python 库

由 Facebook 开源的多语言词向量 Python 库,提供了基于 fastText 实现的多语言词向量和大规模高质量的双语词典,包括无监督和有监督两种。其中有监督方法使用双语词典或相同的字符串,无监督的方法不使用任何并行数据。

无监督方法具体可参考 Word Translation without Parallel Data 这篇论文。

论文链接:

https://www.paperweekly.site/papers/1097

项目链接:

https://github.com/facebookresearch/MUSE

-03-

FoolNLTK

#中文处理工具包

本项目特点:

• 可能不是最快的开源中文分词,但很可能是最准的开源中文分词

• 基于 BiLSTM 模型训练而成

• 包含分词,词性标注,实体识别,都有比较高的准确率

• 用户自定义词典

项目链接:

https://github.com/rockyzhengwu/FoolNLTK

-04-

Arnold

#最擅长玩《毁灭战士》的游戏AI

本项目来自卡耐基梅隆大学,是 2017 年 VizDoom《毁灭战士》AI 死亡竞赛冠军 Arnold 的 PyTorch 开源代码。

论文链接:

https://www.paperweekly.site/papers/1440

项目链接:

https://github.com/glample/Arnold

-05-

Bottom-Up Attention VQA

#2017 VQA Challenge 第一名

本项目是 2017 VQA Challenge 第一名团队两篇论文的 PyTorch 复现。

论文:Bottom-Up and Top-Down Attention for Image Captioning and Visual Question Answering

链接:https://www.paperweekly.site/papers/754

论文:Tips and Tricks for Visual Question Answering: Learnings from the 2017 Challenge

链接:https://www.paperweekly.site/papers/1441

项目链接:

https://github.com/hengyuan-hu/bottom-up-attention-vqa

-06-

YOLOv2 - PyTorch

#PyTorch 版 YOLOv2

著名物体检测库 YOLOv2 的 PyTorch 版本,本项目还可以将训练好的 model 转换为适配 Caffe 2。

项目链接:

https://github.com/ruiminshen/yolo2-pytorch

-07-

Simple Railway Captcha Solver

#基于 CNN 的台铁订票验证码辨识

本项目利用简单的 Convolutional Neural Network 来实作辨识台铁订票网站的验证码,训练集的部分以模仿验证码样式的方式来产生、另外验证集的部分则自台铁订票网站撷取,再以手动方式标记约 1000 笔。

目前验证集对于 6 码型态的验证码的单码辨识率达到 98.84%,整体辨识成功率达到 91.13%。

项目链接:

https://github.com/JasonLiTW/simple-railway-captcha-solver

-08-

AlphaZero-Gomoku

#用 AlphaZero 下五子棋

这是一个将 AlphaZero 算法应用在五子棋的实现,由于五子棋相比围棋或国际象棋简单得多,所以只需几个小时就可以训练出一个不错的 AI 模型。

论文:AlphaZero: Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm

链接:https://www.paperweekly.site/papers/1297

论文:AlphaGo Zero: Mastering the game of Go without human knowledge

链接:https://www.paperweekly.site/papers/942

项目链接:

https://github.com/junxiaosong/AlphaZero_Gomoku

-09-

gym-extensions

#OpenAI Gym 扩展集

这是一个 OpenAI Gym 库的扩展包,实现了包括:多任务学习、迁移学习、逆增强学习等功能。

项目链接:

https://github.com/Breakend/gym-extensions

-10-

Myia

#Python 深度学习框架

Myia 是一个全新的 Python 深度学习框架,具有使用简单、自动微分和性能优化的特点。

项目链接:

https://github.com/mila-udem/myia

本文来自企鹅号 - 数据派THU媒体

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏AI科技大本营的专栏

推荐 | 机器学习开源项目 Top 10

编译 | AI科技大本营 一直为开发者提供优质学习资源的Mybridge最近又发布了一篇资源性文章:机器学习领域开源项目Top 10,AI科技大本营做了简要编译...

30780
来自专栏SIGAI学习与实践平台

理解计算:从根号2到AlphaGo番外篇——眼见未必为实--漫谈图像隐写术

传递秘密消息的历史非常悠久,在公元前500年左右的波希战争时期,就有将奴隶的头发剃掉,然后在头皮上刺上字,等奴隶的头发张长后,将这个人派去传递消息,一次消息传递...

25220
来自专栏CVer

CVPR 2018 收录论文名单全公布

本文将介绍 CVPR 2018 所有录用论文的标题, 包括每篇论文属于 oral, spotlight还是 poster的情况. 大家可以根据论文的标题去 go...

20620
来自专栏量子位

谷歌与Verily发布新研究,可通过视网膜图像用AI检测心脏病

安妮 编译整理 量子位 出品 | 公众号 QbitAI 心脏病是一种常见的高发疾病。传统的治疗方法通常依赖于心电图、超声、X射线等大型仪器,可能不久后,会有一种...

31360
来自专栏数据派THU

Github近期最有趣的10款机器学习开源项目

? 来源:PaperWeekly 本文共900字,建议阅读6分钟。 本文为你罗列近期Github上十大有趣的机器学习开源项目。 -01- Face Rec...

36760
来自专栏专知

微软研究院Jianfeng Gao:基于深度学习的自然语言处理导论(课程,附PPT下载链接)

【导读】深度学习近几年在各领域的发展可谓是如火如荼,基于深度学习的自然语言处理方法也大受关注。本文介绍微软研究院Jianfeng Gao的一个暑期课程,课程主要...

56750
来自专栏AI研习社

入门必读的机器学习名词解释,你都懂了吗?

train? valid? or test? 机器学习最明显的一个特点是需要大量的数据。特别对监督学习来说,就是需要大量的带标签数据(labeled dat...

36040
来自专栏AI科技大本营的专栏

快讯 | 玩游戏玩出一篇论文,清华大学团队获信息检索顶会 SIGIR 最佳学生论文奖

作者|周翔 最近几个月,以《王者荣耀》为代表的游戏受到了各方的攻击,其中以家长和老师的反应最为激烈。不过,玩物真的就一定会丧志吗?清华大学的几位学霸告诉你,玩游...

35970
来自专栏机器学习人工学weekly

机器学习人工学weekly-2018/8/5

视频列表链接:https://www.youtube.com/playlist?list=PLBgogxgQVM9v0xG0QTFQ5PTbNrj8uGSS-

9310
来自专栏AI科技评论

干货 | 不能更通俗易懂的机器学习名词解释

train? valid? or test? 机器学习最明显的一个特点是需要大量的数据。特别对监督学习来说,就是需要大量的带标签数据(labeled dat...

40070

扫码关注云+社区

领取腾讯云代金券