首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

深度学习中的动手实践:在CIFAR-10上进行图像分类

然而,对其他解决方案的了解确实给我们提供了一个很好的起点。理论知识建立了一种直观的看法,即哪些想法是值得尝试的,哪些想法是不可能改善神经网络的。...一个良好的数据集——用于图像分类的CIFAR-10 许多关于深度学习的图像分类的介绍都是从MNIST开始的,MNIST是一个手写数字的标准数据集。...如果你真的需要使用28×28灰度图像数据集,那么可以看看notMNIST数据集和一个MNIST-like fashion product数据集(一个非常有趣的数据集,也是10分类问题,不过是时尚相关的)...你甚至可以查看错误分类的图片。然而,这个线性模型主要是在图像上寻找颜色和它们的位置。 Neptune通道仪表盘中显示的错误分类的图像 整体得分并不令人印象深刻。...我在训练集上的准确率达到了41%,更重要的是,37%的准确率在验证上。请注意,10%是进行随机猜测的基线。 多层感知器 老式的神经网络由几个密集的层组成。在层之间,我们需要使用一个激活函数。

1.4K60

深度学习中的数据简介 | PyTorch系列(十)

文 |AI_study 机器学习在Fashion-MNIST 介绍 欢迎回到这个关于神经网络编程的系列。在这篇文章中,我们将介绍Fashion-MNIST数据集。...由于这个原因,数据在软件开发中的作用正在发生变化,我们可能也会看到软件开发人员的作用也在发生变化。 数据集中注意事项: 谁创建了数据集? 如何创建数据集? 使用了哪些转换? 数据集有什么用途?...可能的意外后果? 数据集是否有偏差? 数据集是否存在伦理问题? 实际上,获取和访问数据通常是深度学习中最困难的部分,所以在研究这个特定的数据集时要记住这一点。注意我们在这里看到的一般概念和思想。...这就是为什么我们可以在GitHub的URL上看到zalandoresearch,那里有Fashion-MNIST的数据集可供下载。...由于这个原因,Fashion数据集被设计成尽可能地镜像原始MNIST数据集,同时由于拥有比手写图像更复杂的数据,因此在训练中引入了更高的难度。

89240
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    Fashion-MNIST 一周年 | Google NIPS最爱,还登上了Science

    正如我在其README中写到的那样:Fashion-MNIST的目标是要替代经典数字MNIST数据集,帮助研究者更好的评测和理解机器学习算法。在过去的一年里,我看到ML/AI社区朝这个方向不断前进着。...随后的几天里,我一直在玩这个新数据集,利用它做各种实验。同时,我不断改善它的图片质量,并在Tensorflow, Keras中为它提供更通用的API接口。...在我的前同事Kashif Rasul和Lauri Apple的鼓励下,我们最终决定把这个数据集发布到Github和arXiv上。为了在国际上扩大影响力,我也将数据集的说明翻译成了中文和日文。...连续三天内,Fashion-MNIST成为Github上最热门的开源项目之一。几天后,甚至Yann LeCun本人都在他的Facebook主页上发帖鼓励大家尝试这个新数据集。 ?...胶囊网络自从发表以来就收到很多的讨论:有不少人质疑胶囊网络从设计上是否为MNIST做了特别的优化,而这种结构是否在其他数据集上仍然有效。

    68920

    黑人小哥四个月速成全栈机器学习全程解密

    顺便说一句,文章开篇这句“这其实就是线性代数,不是什么高深学问”,意味的是机器学习或深度学习并不简单。 我的学习日程 这段时间,我一直全身心的投入在学习上,每天学习10-14小时。...虽然在之前我已经学习过优达学城和DataCamp的课程,这两个课程都涉及机器学习 - 从不同的角度讲述,但我认为再多学习一门这个领域中最好的课程绝对有利无害。 这门课非常有意思,有趣且具有挑战性。...虽然这门课是一个很棒的经历,但我仍然相信Udacity的数据分析师纳米学位有更实际的用处。 最后一件帮助我完成学习目标的事,是Capstone的端到端深度学习项目。...Kaggle竞赛进行练习(在进行步骤1-4的时候) 另附:这里还有我正在更新的一些“阅读清单”,以记录我在学习过程中做的更重要的事情。...我的最后一件事当然是恢复工作。我会尝试尽可能有选择地去找工作,不是说我以前没有这样做,而是我认为这是一个职业变化,认真审视这个过程的每一方面都是很好的。

    3.4K10

    观点 | 小心训练模型,数据少也可以玩转深度学习

    Leekasso Redux 首先第一件事就是建立一个使用该数据集的深度学习模型,也就是现代版的多层感知机(MLP)和卷积神经网络(CNN)。...而遍历全部的 MNIST 数据集大概相当于 6 万次梯度更新,并且更常见的是遍历数百到数千次(大约百万次梯度更新)。...我猜测可能是和其使用的优化过程有关,其好像使用的是弹性均值 SGD 以计算多个结点而加速训练。我不知道当你仅有少量样本数据时会不会出现故障,但我认为可能性是很大的。...关于深度学习为什么有效的误解 最终,我想要重新回到 Jeff 在文中所提出的观点,尤其是这个声明: 问题在于:实际上仅有少数几个企业有足够数据去做深度学习,[…] 但是我经常思考的是,在更简单的模型上使用深度学习的主要优势是如果你有大量数据就可以拟合大量的参数...在 CNN 中,我们实际上把图像的属性编码进模型本身。例如,当我们指定一个大小为 3x3 的过滤器时,实际上是在直接告诉网络本地连接的像素的小集群将包含有用的信息。

    1.1K50

    四个月速成全栈机器学习?这位黑人小哥三个半月就开始找工作了

    顺便说一句,文章开篇这句“这其实就是线性代数,不是什么高深学问”,意味的是机器学习或深度学习并不简单。 我的学习日程 这段时间,我一直全身心的投入在学习上,每天学习10-14小时。...虽然在之前我已经学习过优达学城和DataCamp的课程,这两个课程都涉及机器学习 - 从不同的角度讲述,但我认为再多学习一门这个领域中最好的课程绝对有利无害。 这门课非常有意思,有趣且具有挑战性。...虽然这门课是一个很棒的经历,但我仍然相信Udacity的数据分析师纳米学位有更实际的用处。 最后一件帮助我完成学习目标的事,是Capstone的端到端深度学习项目。...Kaggle竞赛进行练习(在进行步骤1-4的时候) 另附:这里还有我正在更新的一些“阅读清单”,以记录我在学习过程中做的更重要的事情。...我的最后一件事当然是恢复工作。我会尝试尽可能有选择地去找工作,不是说我以前没有这样做,而是我认为这是一个职业变化,认真审视这个过程的每一方面都是很好的。

    95680

    连LeCun都推荐的Fashion-MNIST数据集,是这位华人博士的成果

    这个数据集里都是衣裤鞋包,但它的目标是替代MNIST。...随后我们发现这个数据集引发了好多研究人员的关注,包括大名鼎鼎的Yann LeCun——他周日在Facebook上推荐了这个数据集,也引发了很多的讨论。 ?...更令我们意外的是,量子位周日收到了Fashion-MNIST数据集作者的来信,而且是一封中文来信!...对于这个数据集的表现,他提到:“我也收到了很多国内AI研究员良好的使用体验,他们表示在MNIST上区分不开的算法(0.1%之差)可以在Fashion-MNIST上很好的区分开来。”...最重要的是,肖涵博士告诉量子位,他已经在GitHub上为这个数据集增加了中文文档(README.zh-CN.md)。本文最后,量子位也会摘录部分其中的内容。

    1.5K50

    小心训练模型,数据少也可以玩转深度学习

    Leekasso Redux 首先第一件事就是建立一个使用该数据集的深度学习模型,也就是现代版的多层感知机(MLP)和卷积神经网络(CNN)。...而遍历全部的 MNIST 数据集大概相当于 6 万次梯度更新,并且更常见的是遍历数百到数千次(大约百万次梯度更新)。...我猜测可能是和其使用的优化过程有关,其好像使用的是弹性均值 SGD 以计算多个结点而加速训练。我不知道当你仅有少量样本数据时会不会出现故障,但我认为可能性是很大的。...关于深度学习为什么有效的误解 最终,我想要重新回到 Jeff 在文中所提出的观点,尤其是这个声明: 问题在于:实际上仅有少数几个企业有足够数据去做深度学习,[…] 但是我经常思考的是,在更简单的模型上使用深度学习的主要优势是如果你有大量数据就可以拟合大量的参数...在 CNN 中,我们实际上把图像的属性编码进模型本身。例如,当我们指定一个大小为 3×3 的过滤器时,实际上是在直接告诉网络本地连接的像素的小集群将包含有用的信息。

    80051

    实战 | 深度学习轻松学:如何用可视化界面来部署深度学习模型

    在 MNIST 数据集上使用 Deep Cognition 和 AutoML  Deep Learning Studio可以自动地为您自定义的数据集设计深度学习模型,这要归功于我们先进的AutoML功能...作为深度学习工作室的一个小教程,我们来研究一下经典的MNIST数据集。  MNIST是一个简单的计算机视觉数据集。...您可以立刻使用这个模型并预测图像中的数字以查看它的表现如何。  黑盒问题  有时候在你会这样想:好吧,我正在深入学习,但我不知道它是如何做到的。  ...这个系统平台建立的初衷是人人都可以轻松使用AI。为了构造一个复杂的模型,你并不需要一定是一个AI专家。但我的建议是,你需要对自己在做什么有了一个清晰的认识。...他拥有墨西哥国立自治大学物理科学硕士学位,现正在从事大数据,数据科学,机器学习和计算宇宙学等相关领域的工作。 自2015年以来,他一直是Apache Spark与Core和MLlib库的合作者。

    87520

    编程进阶之路:用简单的面向对象编程提升深度学习原型

    但最重要的是,为了降低那些年轻而充满干劲的学习者的负担,网络上数百门有关数据科学和 AI/ML 的在线课程或慕课(MOOC)也都没有强调这方面的编码问题。...但我逐渐开始尝试优化代码,通过简单地增强代码风格来使代码对于其他人更加有用。 而且,我还发现在有关数据科学的代码中开始应用 OOP 原则并不难。...核心 ML 任务和更高阶的业务问题 核心的 ML 任务很简单——为 fashion MNIST 数据集构建一个深度学习分类器,该数据集是对于传统的著名的 MNIST 手写数字数据集的有趣变体。...Fashion MNIST 数据集包含 60,000 张像素大小为 28 x 28 的训练图像,图像内容为与时尚相关的物品,比如帽子、鞋子、裤子、T 恤、裙子等等。...Fashion MNIST 数据集 但是,如果围绕此核心 ML 任务存在更高阶的优化或可视化分析问题,那么模型架构的复杂度会如何影响达到目标准确率所需的最小迭代次数(epoch)呢?

    64620

    业界 | Ian Goodfellow专访:我为什么可以在一夜之间创建GAN

    几年来,我和我的同事一直在致力于软件库的开发,我曾用这些软件库来创建第一个 GAN、Theano 和 Pylearn2。...与了解非常前沿的工作相比,大多数前沿研究项目更需要扎实的基础知识和技能。例如,今天我正在解决一个妨碍我运行一个实验的内存泄露问题,同时试图加速一个软件库的单元测试,以更快地尝试更多的研究 idea。...设计一个可以从极端小量数据泛化得很好的新算法可能需要一些资源,但不会像在大规模数据集上训练那么多。...Ian Goodfellow:从 ML 的长期潜力来看,实际上我认为机器学习仍然没被过度炒作。因为从某个角度看来,在技术行业之外的人们谈论机器学习的热度并没有我想象的那么高。...Ian Goodfellow:我确实认为发展专业技能是很重要的,但我不认为博士学位是获得这种专业技能的唯一方式。

    62020

    你用 iPhone 打王者农药,有人却用它来训练神经网络...

    ,值得注意的是,这个 Core ML 模型是在 iOS 设备上直接训练的,而无需提前在其他 ML 框架中进行训练。...LeNet CNN+MNIST 数据集的组合是机器学习「训练」的标准组合,简直相当于深度学习图像分类的「Hello, World」。 ?...这篇文章主要着眼于如何在 iOS 设备上直接为 MNIST 数据集构建和训练一个 LeNet CNN 模型。...在 Swift 中为 Core ML 的训练准备数据 在讨论如何在 Core ML 中创建及训练 LeNet CNN 网络之前,我们可以先看一下如何准备 MNIST 训练数据,以将其正确地 batch...在下列 Swift 代码中,训练数据的 batch 是专门为 MNIST 数据集准备的,只需将每个图像的「像素」值从 0 到 255 的初始范围归一化至 0 到 1 之间的「可理解」范围即可。 ?

    2.7K20

    Core ML 2有什么新功能

    在本教程中,我将了解Core ML 2.0中引入的所有新功能以及如何将其应用到您的机器学习应用程序中!如果您是Core ML的新手,我建议您通过本教程熟悉Core ML 。...注意:要尝试这些技术,您需要在Mac上安装macOS Mojave。此外,您应该安装coremltools beta。如果没有,不要担心。我将在本教程后面解释如何下载它。...机器学习模型有3个主要部分: 型号数量 重量的数量 重量的大小 当我们量化模型时,我们正在减小重量的大小!在iOS 11中,Core ML模型存储在32位模型中。...实际上,它的准确度为0%是完全不准确的。通过量化来尝试找到快乐的媒介。永远记得测试量化模型,以确保它们准确执行! 性能 苹果专注于核心ML 2的下一点是性能。...由于我们在设备上运行ML计算,我们希望它快速准确。这可能非常复杂。幸运的是,Apple为我们提供了一种提高CoreML模型性能的方法。让我们来看一个例子。

    71420

    【机器学习面试终极通关指南】从打造性感履历到跨越面试三大关卡

    用户_Julia提问:我是一名数据科学工程师,想专注于这个领域好好发展职业生涯。我做了一些小的分析数据集的开源项目,还发表过一些论文。...但我的问题更多是关乎博客、研究论文和开源项目,以及如何在工业界建立Data Science/ML的职业生涯。对此,_Julia介绍了自己的情况,进一步描述了问题: 我打算写博客。...作为一名工程师,(应用数据科学)论文对我的职业有帮助吗(论文中不包含新颖的ML思想,而是新颖的ML应用方法)? 如果你是经理、招聘人员或面试官,你想从数据科学工程师的简历中看到什么?...很多人都从这个问题开始实践机器学习,我也一样。这是一个二元分类问题:根据泰坦尼克乘客的信息,预测他们是否存活。一般说明和数据可在Kaggle上找到。泰坦尼克号数据集为特征工程提供了有趣的机会。...最近, 我收到了许多关于机器学习面试的问题。长久以来,我一直没法很好地回答这些问题,因为从大学开始,我并没有接受过一场标准的面试。所以,我开始接受一些面试的邀请。

    81660

    【译】2019,跟上 AI 的脚步:AI 和 ML 接下来会发生什么重要的事?

    这篇文章的目的正在于此:我将尝试提取过去一年在 AI 领域里一些共通的模式。如果幸运的话,我们将看到一些(AI 的)趋势是如何延伸到不久的将来。...就是说,在大量公开可用的数据上来训练一个模型,然后在您使用的特定数据集上“微调”它。在计算机视觉中,使用在著名的 ImageNet 数据集上发现的模式来解决特定的问题通常是解决方案的一部分。...开放的高质量数据集,如 MNIST、ImageNet、COCO、Netflix prize 和 IMDB eviews 是令人难以置信的创新的来源。但是许多问题没有相对应的数据集来处理。...虽然对于研究人员来说,建立数据集并不是一个很好的职业发展方向,但能够赞助或发布数据集的大公司并不着急:他们正在建立庞大的数据集,并且把这些数据私密保存。...在谷歌建立了 ML 系统,Airbnb 和多家创业公司。

    13210

    欲取代CNN的Capsule Network究竟是什么来头?它能为AI界带来革命性转折么?

    我们很容易就能发现,这些特征的空间位置明显是错误的,不符合“脸”的特征,然而CNN在处理这一概念上却十分笨拙。 除了被图像的错误位置所迷惑,CNN在查看不同方向的图像时也很容易混淆。...这个数据集经过了精心设计,是一个纯粹的形状识别任务,即从不同的角度来看也能识别物体。CapsNet在该数据集上打败了最先进的CNN,将错误数量减少了45%。...训练CapsNet 要想使用胶囊网络,首先你得训练它——于是,我根据Hinton 的论文建立了一个Repo(非常感谢naturomics). 以下指南将为你提供在MNIST数据集上训练的模型。...(MNIST是手写数字的数据集,很适合用作测试机器学习算法的基准线) 1....在训练庞大的数据集时,我们可能会遇到问题。但总体来说,我还是对胶囊网络的未来发展充满信心的。

    95950

    【技巧】应赛技巧,教你如何在Kaggle比赛中排在前1%

    网友Akira Sosa最近参加了Kaggle比赛,并在medium上分享了他的参赛经验,以下是全文。 最近,我参加了Kaggle比赛。虽然这是我第一次参赛,但我的成绩相当不错。...虽然这种技术听起来有点棘手,但探索性数据分析技术使它成为可能,并且它是我们最重要的技术之一。 因为这是我的第一个挑战,我花了相当多的时间写代码。我在Github上公开了我的代码。...成功的方法 在我参加这次比赛之前,我并不太熟悉这些技术,比如堆叠和混合。幸运的是,我在比赛的前收到了Coursera的邮件。这是《如何赢得数据科学竞赛:从顶端开始学习》课程的邀请。...其中一些模式在没有数据强化的情况下不能很好地融合,所以我最后从36个模式里选择了24个。 基本模型 我意识到在早期找到一个基本模型是很重要的。CNN 4L是这个案例的基础模型。...虽然他们在计算机视觉上的表现很好,但在公共LB上却不是很好,我猜可能是用错误的方法解读了inc_angle的漏洞。 没有采用的成功的方法 现在,让我们来看看其他顶级的选手的方法。

    1.3K80

    去年发的论文已经配不上今天的你了!NIPS准备办场论文反思会

    论文被一个顶级NLP会议—ACL接收了,并获得了一项杰出论文奖,在很多方面,我为这篇论文感到自豪,我至今仍觉得对话评估是一个研究不足的问题,而这篇论文是解决该问题的一次有趣的尝试。...但是我仍有一丝内疚,在论文发表后的一年里,我和其他尝试用ADEM进行对话评估的研究人员进行过几次交流,发现在他们的数据集上效果并不是很好。...摘录自一名用ADEM进行数据健全性检查的学生的谷歌表格 尽管这些结果对我来说是全新的,但我之前就隐隐觉得ADEM可能无法很好地推广到其他数据集,在首次训练ADEM之后,我注意到它更倾向于较短的回答,我们发现这是由于我们收集的数据集...我没有提及的是我也在一个不同项目的数据集上尝试了ADEM,发现效果并不是很好,我为论文的披露不足负全责,当时我认为这是由于数据收集程序的差异而导致的,因此并没有重视。...毕竟,真正重要的是ADEM在测试集上得以推广,不是吗? 通过这些交流,我发现我对这项研究有了全新的看法,“哦,是的,这个想法很酷,但我实际上不会用它来评估对话系统。”

    38010
    领券