专栏首页机器之心15大领域、127个任务,这里有最全的机器学习SOTA模型

15大领域、127个任务,这里有最全的机器学习SOTA模型

机器之心又一产品「SOTA模型」今天上线啦!机器学习 SOTA 研究一网打尽。

想象一下,你是一位从事机器学习的研究者,需要持续了解最前沿研究进展;或者你希望将最前沿的机器学习研究应用于自己从事的领域。为此,当你在浩瀚无边的论文海洋中畅游时,你最需要的找到的是 SOTA 论文。

SOTA,全称「state-of-the-art」,用于描述机器学习中取得某个任务上当前最优效果的模型。例如在图像分类任务上,某个模型在常用的数据集(如 ImageNet)上取得了当前最优的性能表现,我们就可以说这个模型达到了 SOTA。

那么,怎样才能高效找到 SOTA 论文呢?遗憾的是,经过多年的发展,现在依然没有一个平台能够完整地汇总、整理、归档所有 SOTA 论文。在全世界最著名的论文预印发布平台 arXiv 上,搜索 SOTA 的结果也非常杂乱无章。此外,即使有类似于 GLEU leaderboard 之类的网站可以看到一些 SOTA 模型,但也只是机器学习庞杂体系下的一小部分。

在 arXiv 上搜索 state-of-the-art 时,返回的结果会很多,但仍然不够系统。想要知道达到了 SOTA 的论文是关于什么任务、使用了什么数据,需要点进去一一查看。

机器之心作为专业的人工智能信息平台,有着多年的学术资源积累。经过对大量数据的分类与汇总,机器之心再次上线新产品:SOTA模型。你可以根据自己的需要寻找机器学习对应领域和任务下的 SOTA 论文,平台会提供论文、模型、数据集和 benchmark 的相关信息。

访问地址:www.jiqizhixin.com/sota

前沿研究触手可及

在「SOTA模型」首页,你可以直接搜索技术任务,系统会立刻返回任务定义、取得 SOTA 的模型名称、研究中最常用的模型和最热门的数据集。

如果你继续向下浏览网页,就可以看到此技术任务下所有使用过的数据集和模型,并且可以按照数据或模型的类型进行筛选。

想知道历史 SOTA?完整榜单送给你

当然,这还远远不够。SOTA 是随着时间变化的,如果我们想要看到历史上取得过 SOTA 的模型和论文呢?

再往下拉页面,就可以看到历史上在该任务上取得过 SOTA 的榜单了。

你也可以点击「数据集」、「模型」或「Metrics」进行排序。

如果你对某个研究感兴趣,可以展开详情,查看研究的出处论文。

某个 SOTA 研究的详细信息。可以点击「查看详情」阅读论文

这样一来,「SOTA模型」如同一个强大的论文搜索引擎,为你直接寻找机器学习中各种各样的 SOTA 研究。它不仅仅会告诉你是什么研究,还会提供研究使用的数据集、模型、取得的 SOTA 指标数值,以及什么时候取得的 SOTA 结果。

全面系统的知识点归档

当然,你可能是一位刚刚入门机器学习的初学者,对于机器学习中的各项任务不太清楚。这时候,「SOTA模型」会是你很好的入门学习伙伴。如下图所示,「SOTA模型」首页会提供各个机器学习子领域的入口。

以「计算机视觉」为例,你可以点击这一子领域,「SOTA模型」会提供这一领域的定义,并提供这一领域所涉及的基础概念和技术方法。你可以根据需要选择查看。

而在这一页的下方,「SOTA模型」提供了这一领域所有涉及到的任务。如边缘检测、人脸识别等。

这时候,你就可以知道是否有自己需要了解的机器学习任务了。你可以点开其中的任务查看。对于一些非常火热或成熟的研究领域,「SOTA模型」还提供了相关的活动、会议和期刊。

「人脸识别」任务下,提供了相关会议和期刊的信息

海量知识库加持的模型库

能够提供如此丰富的 SOTA 论文信息,得益于机器之心背后强大的信息平台支持。在前几个月,机器之心已上线了机器之心Pro,一个为企业、学者等各方提供专业人工智能信息服务的平台。在 Pro 平台上汇聚了海量机器学习相关信息,为「SOTA模型」提供数据加持,使得「SOTA模型」能够更进一步,提供最为前沿的研究领域 SOTA 资讯和系统的机器学习知识。

目前「SOTA模型」中已涵盖 15 个机器学习领域大类,共计 127 个机器学习任务,共收录 SOTA 论文 1174 篇,归档模型 2031 个,有记录的数据集总数为 561 个。我们也将持续更新数据。

能够囊括如此之多的信息,离不开机器之心在机器学习领域的投入研究。为了提供 SOTA 论文的数据,「SOTA模型」投入了多数据源的自动化爬虫和数据清理工具,使用了机器学习和自动化工具,对特定类型的数据进行结构化处理、数据校验和去重工作。在论文数据方面,使用了论文文本数据分析和信息提取相关技术。

论文爆炸时代,更需要为读者提供精准服务

每年,机器学习领域都会有大量的投稿论文,例如 2019 年的 CVPR 大会投稿数量就超过了 5000 篇,是 2018 年投稿数的两倍。泥沙俱下的研究,增加了业内人士筛选优秀论文的成本。「SOTA 模型」产品的上线,标志着机器之心信息服务进入了新的阶段。

接下来,「SOTA 模型」将会进一步完善内容,增加更多、更为清晰和完善的数据。如果在现有的版本中没能找到自己想要的数据,稍安勿躁,我们近期也将会添加近一倍的数据。假期归来,想要了解某个技术领域或者做项目需要查找资源时,你就能用到。

同时我们也会提供更多的分析项目,并努力和机器之心现有的知识库、新闻库等模块关联。产品也会根据用户的需求提供更为精准完善的数据分类和推荐、数据对比和可视化功能。

如果您在使用「SOTA 模型」过程中,有任何反馈,可以添加微信 lyz147147 沟通交流(请备注「SOTA模型反馈」)。

本文分享自微信公众号 - 机器之心(almosthuman2014),作者:Synced

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-09-27

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 业界 | 从语音到金融:邓力的人工智能30年

    邓力的人工智能之旅已跨越 30 余年。在担任过公司研究员、大学教授并在语音研究领域占有一席之地之后,邓力一头扎进了金融界:2017 年 5 月,他辞去了微软首席...

    机器之心
  • AI界的State of the Art都在这里了

    正如这些学生所言:「我们希望将所有资源都高效地分配到如今迅猛发展的 AI 和 ML 领域。」因此这个项目可以更高效地利用手中的资源,包括将时间、精力和计算资源都...

    机器之心
  • 一门面向所有人的人工智能公开课:MIT 6.S191,深度学习入门

    选自Medium 机器之心编译 参与:黄小天、李泽南 对初学者来说,有没有易于上手,使用流行神经网络框架进行教学的深度学习课程?近日,麻省理工学院(MIT)正式...

    机器之心
  • Scrapy+MongoDB 轻松爬取海量妹子图

    【原文链接】:https://mp.weixin.qq.com/s/WIrepTu-2CGrGifLLRsHjw

    用户2769421
  • Cron运行原理

    本文介绍的是由Paul Vixie开发的运行在SuSE Linux上的Cron。可以通过“man cron”进行确认。

    一见
  • Android so的热升级尝试

    在Android代码中,加载so库是通过调用System.loadLibrary函数实现的。但和Android的许多特性一样,只提供了加载,而没有卸载和更换等功...

    腾讯移动品质中心TMQ
  • [剑指offer] 栈的压入、弹出序列 [剑指offer] 栈的压入、弹出序列

    输入两个整数序列,第一个序列表示栈的压入顺序,请判断第二个序列是否为该栈的弹出顺序。假设压入栈的所有数字均不相等。例如序列1,2,3,4,5是某栈的压入顺序,序...

    尾尾部落
  • 一维高斯混合模型EM算法实现

    版权声明:本文为博主原创文章,转载请注明出处。 https://blog.csdn.net/...

    ke1th
  • APK加固之类抽取分析与修复

    隐藏dex文件:通过对目标DEX文件进行整体加密或压缩方式把整个dex转换为另外一个文件存放在assets文件夹中或者其它地方,然后利用类加载器技术进行内存解密...

    我是小三
  • CSS3的变形transform、过渡transition、动画animation学习

    变形有rotate旋转、scale缩放、translate位移、skew倾斜、matrix矩阵变形、perspective透视几种操作,通过例子来了解各个操作

    书童小二

扫码关注云+社区

领取腾讯云代金券