专栏首页深度学习和计算机视觉七大Github机器学习热门项目

七大Github机器学习热门项目

Pytorch-Transformers(NLP)

https://github.com/huggingface/pytorch-transformers

PyTorch-Transformers是最新的一系列最先进的NLP库。它打败了之前各种NLP任务的基准。我真正喜欢pytorch-transformers的是它包含PyTorch实现,预训练模型权重和其他重要组件,可以帮助你快速入门。

你可能会觉得运行复杂的模型需要巨大的计算能力。但是PyTorch-Transformers没有这个问题,使大多数人都可以建立最优秀的NLP模型。

NeuralClassifer(NLP)

https://github.com/Tencent/NeuralNLP-NeuralClassifier

文本数据的多标签分类是一个相当大的挑战。当我们处理早期的NLP问题时,我们通常会处理单一标签任务。该级别在实际数据上增加了几个级别。

在多标签分类问题中,实例或记录可以具有多个标签,并且每个实例的标签数量不固定。

NeuralClassifier使我们能够快速实现分层多标签分类任务的神经模型。NeuralClassifier提供了我们熟悉的各种文本编码器,如FastText,RCNN,Transformer编码器等。

我们可以使用NeuralClassifier执行以下分类任务:

  • 二进制文本分类
  • 多级文本分类
  • 多标签文本分类
  • 分层(多标签)文本分类

TDEngine(大数据)

https://github.com/taosdata/TDengine

TDengine

TDEngine在上个月的星星数超过了GitHub上所有其他的新项目。在不到一个月的时间内收到了将近10000颗星。

TDEngine是一个用于下列领域的开源大数据平台:

  • 物联网(IoT)
  • 联网汽车
  • 工业物联网
  • IT基础设施等等。

TDEngine提供了与数据工程相关的一整套任务。我们可以以超快的速度完成所有这些工作(处理查询速度提高10倍,计算使用率为1/5)。

有一点目前需要注意,TDEngine仅支持在Linux上执行。这个GitHub存储库包含了完整的文档和带有代码的入门指南。

视频对象删除(CV)

https://github.com/zllrunning/video-object-removal

您是否操作过图像数据?用于操作和处理图像的计算机视觉技术非常先进,其中图像物体检测被认为是成为计算机视觉专家的基本步骤。

但是操作视频会怎么样?当我们需要在视频中的对象周围绘制边界框时,难度会提高几个级别。对象的动态特征使整个概念更加复杂。

所以,当我看到这个GitHub存储库时非常高兴。我们只需在视频中的对象周围绘制一个边界框即可将它删除。 真的非常容易!下面是该项目的一个例子:

Python自动补全(编程)

https://github.com/vpj/python_autocomplete

你会喜欢上这个机器学习项目。作为数据科学家,我们的工作大多数就是围绕着算法做实验。这是一个可以自动完成简单的LSTM模型的Python代码的项目。

下面灰色突出显示的代码是LSTM模型填写的内容(结果位于图像的底部):

正如开发人员所说:

我们在python代码中删除注释、字符串和空行后进行训练和预测。在对python代码进行标记化之后训练模型。它似乎比使用字节对编码的字符级预测更有效。

如果你曾经花费或浪费时间写了很差的Python代码,那么你可能需要它。它现在处于在非常早期的阶段,所以还存在一些问题。

tfpyth – TensorFlow to PyTorch to TensorFlow(编程)

https://github.com/BlackHC/tfpyth

TensorFlow和PyTorch都拥有强大的用户社区。但令人难以置信的是PyTorch的使用率可能会在未来一两年内超越TensorFlow。这不是打击TensorFlow,而是相当可靠的。

因此,如果你使用TensorFlow编写了一部分代码并用PyTorch中编写了另一部分代码,并希望将两者结合起来训练模型,那么tfpyth框架非常适合你。tfpyth最好的地方是不需要重写之前的代码。

这个GitHub存储库包含了一个结构良好的示例,说明了如何使用tfpyth。这绝对是TensorFlow与PyTorch之间的一种新的看法,不是吗?

安装tfpyth:

pythonpip install tfpyth

MedicalNet

https://github.com/Tencent/MedicalNet

将迁移学习与NLP联系起来。当我看到这个精彩的MedicalNet项目时,我感到很激动。

这个GitHub存储库包含了“Med3D: Transfer Learning for 3D Medical Image Analysis”论文的PyTorch实现。该机器学习项目将医学数据集与不同的模态,目标器官和病理进行聚合,以构建相对较大的数据集。

众所周知,深度学习模型通常需要大量的训练数据。因此,TenCent发布的MedicalNet是一个出色的开源项目,我希望很多人能够继续在它上面工作。MedicalNet的开发人员已经发布了基于23个数据集的四个预训练模型。

本文分享自微信公众号 - 小白学视觉(NoobCV)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2021-05-03

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 七大Github机器学习热门项目

    来源 | analyticsvidhya.com 【磐创AI导读】:让我们一起来看下近期热门的机器学习Github仓库,包括了自然语言处理(NLP)、计算机视觉...

    磐创AI
  • 近期 github 机器学习热门项目top5

    【磐创AI导读】:GitHub是数据科学家希望从人群中脱颖而出的宝贵平台,拥有来自顶尖技术巨头(如Google、Facebook、IBM、NVIDIA等)的开放...

    磐创AI
  • 近期 github 机器学习热门项目top5

    【磐创AI导读】:Github是全球最大的开源代码社区,本文为大家总结了2108年11月最热门的机器学习项目top5。欢迎大家点击上方蓝字关注我们的公众号:磐创...

    磐创AI
  • 八月Github机器学习热门项目汇总

    【磐创AI 导读】:本月的Github热门项目涵盖机器学习、深度学习和编程类的项目,满满都是干货,欢迎大家转发、留言。想要更多电子杂志的机器学习,深度学习资源,...

    磐创AI
  • 八月Github机器学习热门项目汇总

    这是一个免费的Python库,使用Pyforest可在一行代码中导入所有python数据科学库。Pyforest目前可导入包括pandas、numpy、matp...

    Datawhale
  • 热点 | 近期Github机器学习开源项目...

    对于程序员来说,开源项目是十分有帮助的。希望你能从这篇文章中找到可以激发你灵感的有趣项目。最近磐创AI寻找“深大锦鲤”活动是2018年10月15日准时开奖哦~听...

    磐创AI
  • 盘点当下大热的 7 大 Github 机器学习『创新』项目

    本文将会分享近期发布的七大GitHub机器学习项目。这些项目广泛覆盖了机器学习的各个领域,包括自然语言处理(NLP)、计算机视觉、大数据等。

    昱良
  • Github上的十大机器学习项目

    Github上的十大机器学习项目涵盖了一系列函数库、框架和教学资源。我们来看看别人使用的工具和学习的资源。 开源软件是数据科学很重要的一部分。 根据最近的KDn...

    CSDN技术头条
  • Github上的10大机器学习项目

    大数据文摘
  • 4月份最热门的五大AI机器学习项目

    当谈到数据科学和机器学习时,GitHub和Reddit是两个最受欢迎的平台。前者是代码和项目之间共享和协作的最佳工具,而后者则是与全球数据科学爱好者交流的最佳平...

    顶级程序员
  • GitHub发布年度机器学习榜:TensorFlow最火,PyTorch失踪,Julia第四

    最近,GitHub官方公布了2018年度机器学习排行榜,公布了最受欢迎的十大语言、十大软件包和十大项目。

    量子位
  • GitHub 10大热门顶级 Python 项目

    相当长时间里,世界各地的开发人员在他们的大多数项目中都偏爱用 Python。它的易用性、实时和非实时系统中的效率,以及广泛的包集合,这些只是开发人员喜欢 Pyt...

    McGL
  • Github 5 个机器学习项目

    https://github.com/ageitgey/face_recognition

    昱良
  • 【8月Github爆款Top10】机器学习热门开源项目新鲜出炉!

    Auto-Keras是一个用于自动机器学习(AutoML)的开源软件库。它是由德克萨斯A&M大学的数据实验室和社区贡献者联合开发的。AutoML的最终目标是为那...

    新智元
  • Github 本周最热的 10 款“机器学习”开源项目

    这是 PaperDaily 的第27篇文章 Kubeflow #用于 Kubernetes 的机器学习工具库 Kubeflow 是由 Google 发布的机器学...

    企鹅号小编
  • 2017数据科学领域15大热门GitHub项目

    -欢迎 加入AI技术专家社群>> GitHub现在不再仅仅是一个软件寄存管理器,而是软件工程师通过它来共享他们自己开发的工具/库,甚至这些资源对一些公司都很重要...

    企鹅号小编
  • 业界 | GitHub 年度报告盘点:开发者增至 3100 万,开源项目达 9600 万

    AI 科技评论按:日前,GitHub 发布了一年一度的「Octoverse」报告,其中列出了一些年度(2017 年 10 月 1 日-2018 年 9 月 30...

    AI科技评论
  • GitHub 上最火,最热门的机器学习和人工智能,数据科学项目

    最近,普拉纳夫 · 达尔(Pranav Dar)发文总结了 2018 年 2 月份 Github 上最火的 5 个数据科学和机器学习项目。

    非著名程序员
  • 【爱可可推荐】春节必读10大热门机器学习文章

    新智元编译 来源:medium等 编译:小七 【新智元导读】春节必看十大机器学习热门文章排行榜。本榜单中涉及的主题包括:谷歌大脑、AlphaGo、生成维...

    新智元

扫码关注云+社区

领取腾讯云代金券