GitHub 上最火,最热门的机器学习和人工智能,数据科学项目

最近,普拉纳夫 · 达尔(Pranav Dar)发文总结了 2018 年 2 月份 Github 上最火的 5 个数据科学和机器学习项目。

Pranav Dar,Analytics Vidhya 的编辑。数据可视化和六西格玛从业者喜欢阅读和深入研究数据科学和机器学习艺术。始终在寻找新的方法来改善使用ML和AI的流程。

1.FastPhotoStyle(快速转换照片风格)

FastPhotoStyle 这个项目是英伟达(NVIDIA)开发的一个 Python 库。该模型将内容照片和风格照片作为输入。然后它将风格照片的风格转移到内容照片,即就是将内容照片的风格转换为我们输入的风格照片的风格。

开发人员举出了两个算法示例。首先,第一个是非常简单的迭代算法,只需要下载一张内容图和风格图,重新调整他们尺寸,然后运行图像风格化代码。第二个样例中,需要使用语义标签映射来创建程式化图像。

2.Twitter Scraper(Twitter 爬虫)

如果你在 Twitter 上发过文章,就知道 Twitter 自身的 API 有流速限制,当然,作为国内用户大多数人都没用使用过 Twitter ,这个 Python 库就是考虑到这一点,它没有 API 限流(不需要任何身份验证),也没有限制,并且速度非常快。开发人员可以用这个库爬取任何用户的任意一条 Twitter (推文)。

而且,这个项目可以用于制作马尔科夫链,但是目前它只能适用于 Python 3.6 及以上版本。

3.Handwriting Synthesis(手写体合成)

这个项目来自亚历克斯 · 格雷夫斯(Alex Graves)撰写的论文(Generating Sequences with Recurrent Neural Networks)《用 RNN 生成序列》,正如存储库的名称所示,您可以生成不同风格的手写,是其中手写体合成实验的实现,它可以生成不同风格的手写字迹。模型包括初始化和偏置两个部分,其中初始化控制样例的风格,偏置控制样例的整洁度。

作者在 GitHub 页面上呈现的样本的多样性真的很吸引人。他正在寻找贡献者来加强存储库,所以如果您有兴趣,可以研究去看看。

4.ENAS PyTorch(高效神经网络结构搜索)

该项目是对论文《参数共享的高效神经网络结构搜索(Efficient Neural Architecture Search (ENAS) via Parameters Sharing)》的实现。ENAS做什么?高效神经网络结构搜索,即 ENAS 减少了计算需求,将 NAS 的 GPU 计算时间减少了 1000 倍。他们通过共享大型计算图中的子图模型之间的参数共享来完成此操作。

如何使用它的过程已经在GitHub页面上得到了很好的展示。实现这个库的先决条件是:

  • Python 3.6+
  • 需要 PyTorch
  • tqdm,imageio,graphviz,tqdm,tensorboardX

5.Sign Language(手势语言识别)

这是一个相对简单但又十分吸引人的机器学习项目。在 Python 中使用卷积神经网络构造模型,可以识别手势并将其转换为机器上的文本。

该项目存储库的作者用 Tensorflow 和 Keras 共同搭建了 CNN 模型,他特别详细地说明了他是怎么创建这个项目的,以及每一步是怎么进行的。

是不是感觉非常不错的,如果你对机器学习感兴趣,可以去这些开源项目中去研究和学习一下。另外,通过这几个开源项目,我们又一次了解了 Python 的重要性,所以,对于想学编程的读者或者初入职场的计算机学生,可以往 Python 方向学习一下。

俗话说,一切分享不给开源项目地址的分享,都是伪分享,所以,上述五个开源项目的地址依次如下:

  1. https://github.com/NVIDIA/FastPhotoStyle
  2. https://github.com/kennethreitz/twitter-scraper
  3. https://github.com/sjvasquez/handwriting-synthesis
  4. https://github.com/carpedm20/ENAS-pytorch
  5. https://github.com/EvilPort2/Sign-Language

原文发布于微信公众号 - 非著名程序员(non-famous-coder)

原文发表时间:2018-04-02

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏祝威廉

为什么去开发一个MLSQL

第一个,算法的着眼点是,用最快速的方式清洗一些数据出来,然后接着建模训练,评估预测效果,之后再重复清洗数据,再试验。因为很多算法工程师都是Python系的,对他...

1082
来自专栏AI科技评论

动态 | 谷歌发布机器学习规则 关于机器学习工程的最佳实践(下)

文章介绍了一种机器学习样式,类似于 Google C++ 样式指南和其他常用的实用编程指南。

732
来自专栏目标检测和深度学习

听说了吗?你也可以在18分钟内训练ImageNet了

该团队的主要训练方法是:fast.ai 用于分类任务的渐进式调整大小和矩形图像验证;英伟达的 NCCL 库,该库整合了 PyTorch 的 all-reduce...

1084
来自专栏机器之心

现在,所有人都可以在18分钟内训练ImageNet了

该团队的主要训练方法是:fast.ai 用于分类任务的渐进式调整大小和矩形图像验证;英伟达的 NCCL 库,该库整合了 PyTorch 的 all-reduce...

1031
来自专栏腾讯技术工程官方号的专栏

FPGA异构计算在图片处理上的应用以及HEVC算法原理介绍

作者介绍:chaningwang,2008年毕业于中国科学院研究生院,主攻FPGA高性能计算、FPGA图像处理等方向。 先后在华为、怡化公司从事FPGA开发...

3786
来自专栏ATYUN订阅号

OpenAI开发的分级强化学习算法旨在解决高级操作

我们已经开发了一种分层强化学习算法,它学习用于解决一组任务的高级操作,可以快速解决需要数千个时间步长的任务。我们的算法应用于一组导航问题时,会发现一组用于在不同...

2886
来自专栏AI科技评论

深度 | 为了让iPhone实时运行人脸检测算法,苹果原来做了这么多努力

AI 科技评论按:苹果从iOS11开始正式在系统中带有机器学习API,同步提供了许多基于机器学习/深度学习的手机功能。其实这之前苹果就已经做了很多研究和开发,但...

36410
来自专栏美团技术团队

美团技术团队博客:推荐算法实践

前言 推荐系统并不是新鲜的事物,在很久之前就存在,但是推荐系统真正进入人们的视野,并且作为一个重要的模块存在于各个互联网公司,还是近几年的事情。 随着互联网的深...

46511
来自专栏技术翻译

机器学习如何改变软件开发

让我们把几件事弄清楚。虽然神经网络、深度学习、机器学习和人工智能似乎都是一样的,但它们都有各自的历史、起源和等级制度。

2001
来自专栏PaddlePaddle

AI不思议|说说那些偶尔混淆的概念

但是产品和运营两队小伙伴一不小心就遇到概念混淆的场景,有些时候是自己记模糊了、有些时候自己没记错、却被别人“拐到沟里“了…

1011

扫码关注云+社区