本篇干货整理自清华大学自动化系教授张长水于2018年4月27日在清华大学数据科学研究院第二届“大数据在清华”高峰论坛主论坛所做的题为《机器学习和图像识别》的演讲。
作者 | 王清 目录 图像识别的经典课题 计算机视觉 图像识别课题 卷积神经网络原理 前深度学习时代 卷积操作Convolution 池化Pooling ReLURectified Linear Units 多层卷积 Dropout 经典模型介绍及TensorFlow代码解析 AlexNet 震惊世界的突破 VGGNet更深的结构更优秀 GoogLeNet Inception 更全面的结构更优秀 GoogLeNet Inception-V2加入Batch Normalization Inception-V3
【新智元导读】上周举行的Spark Summit 2016大会,吴恩达受邀发表演讲,再谈深度学习的两大推动力——计算力和数据。他认为,数据的获取和组织将成为大公司构筑行业壁垒的一个方式,“现在发布的一
深度学习最早兴起于图像识别,但在短短几年时间内,深度学习推广到了机器学习的各个领域,如:图像识别、语音识别、自然语言处理、机器人等等。 📷 计算机视觉是深度学习技术最早实现突破行成就的领域。在2012年,AlexNet赢得了图像分类比赛ILSVRC的冠军,至此深度学习开始收到广泛关注。这只是一个开始,在2013年的比赛中,前20名的算法都使用的是深度学习。在2013年后,ILSVRC大赛就只有深度学习算法参赛了。 深度学习算法在图像分类上的错误率小于4%,已经完全超越了人类标注的错误率。 📷 图像分类 物体
【新智元导读】深度学习火热不是假象,以下的十个指数级增长趋势证明:深度学习在过去的一年内获得了极快的发展,已经成为当下人工智能的“顶梁柱”。本文从 ImageNet、NIPS和CVPR等顶级学术会议,
Chapter 33、Why we compare to human-level performance(为什么我们要比较人类水平的表现)
1 新智元推荐1 来源:微软研究院AI头条 【新智元导读】继 9月13日微软将对话语音识别错误率降至6.3%的记录后,前天再次宣布进一步将错误率降至 5.9%,首次达成与专业速记员持平且优于绝大多数人的表现。该成功归功于他们采用了一种神经语言模型,该模型在空间中被表现为连续的向量,计算机能通过该模型得知比如“fast”和“quick”是具有紧密联系的近义词。 一个月前,2016年9月14日,微软的对话语音识别技术在产业标准Switchboard语音识别基准测试中实现了词错率(word error rate
摘自:腾讯科技 6月4日,百度公司最近宣称在ImageNet(图像识别最大数据库)的图像识别人工智能基准测试中击败了谷歌(微博)和微软。但是周二,ImageNet宣称百度在测试中存在违规行为,百度已经为自己“误导公众”而道歉。 百度的行为凸显了人工智能领域竞争中存在的高度风险。目前,全球顶级科技公司都在争相研发人工智能技术,包括允许计算机识别图像、控制机器人、理解口语以及执行其他任务等。而积累起巨大计算资源的互联网巨头承受着巨大压力,它们需要竭力维持自己的领先地位,无论是声望还是潜在商业利益方面。 除了百度
本文共9876字,阅读约需14分钟,有兴趣的朋友请耐心阅读,谢谢! 近期许良在公司内部做了一个关于人工智能/深度学习相关的主题分享讲座,为了准备这个演讲,花了100个小时左右,接下来就把精心准备的内容分享给大家。 有一个好消息是,考虑文章比较长和文字本身表达的局限性,同时为了解答大家的疑问,近期会完全免费开一个视频直播,具体内容如下。 1. 深度学习入门到晋级 2. 深度学习模型解析和代码实现展示 3. 答疑环节 具体直播时间和链接获取方法最后和大家说。 ---- 内容正式开始。 一提到人工智能和深度学
【新智元导读】 现在的AI发展到什么水平了?我们总说“超越人类水平”,有没有一个量化的标准,来让我们理性的认识AI发展水平,刺破火热AI的迷雾?电子前沿基金会 EFF正在致力于这一方向研究。从近期微软宣布语音识别错误率降至5.1%,与人类水平相当谈起,这篇文章将介绍目前AI领域最为知名的发展水平衡量标准,涉及计算机视觉、文本理解、语音识别、翻译、游戏等多个方向。包括ImageNet、CIFAR-10、COCO等多个近年来受到广泛关注的数据集以及取得最好成绩的模型的介绍。 微软上周宣布,在语音转文字上,他们的
近日,NEC宣布开发了更易于提高识别精度的深度学习自动优化技术。 以往进行深度学习时,很难基于神经网络构造(注1)进行调整,所以无法在整个网络进行最优化的学习,因而无法充分发挥其识别性。此次开发的技术, 可以基于其结构自动优化神经网络学习的进度,从而轻松实现比以往更加精准的识别。 此技术的出现,使得应用了图像识别及声音识别等深度学习技术的各个领域,均有望实现识别精度的进一步提高。例如,人脸识别和行为分析等视频监控识别精度的提高、基础设施等点检工作效率的提高,实现自动检测灾害、事故和灾难等。 一、背景 近年来
图像识别技术是信息时代的一门重要的技术,其产生目的是为了让计算机代替人类去处理大量的物理信息。随着计算机技术的发展,人类对图像识别技术的认识越来越深刻。图像识别技术的过程分为信息的获取、预处理、特征抽取和选择、分类器设计和分类决策。简单分析了图像识别技术的引入、其技术原理以及模式识别等,之后介绍了神经网络的图像识别技术和非线性降维的图像识别技术及图像识别技术的应用。从中可以总结出图像处理技术的应用广泛,人类的生活将无法离开图像识别技术,研究图像识别技术具有重大意义。 1、图像识别技术的引入 图像识别是人
大数据文摘字幕组作品,转载要求见文末 制作团队 | 蒋晔 苏国睿 过倩霏 takeshi luan 没错!大数据文摘字幕组成立啦!!! 我们专注一切炫酷的科技、技术前沿类视频 如果你热爱和志同道合的小伙伴一起做一些有趣的事 如果你的英文不错,又懂一点视频 快加入我们吧~ 在大数据文摘后台回复“志愿者” 了解如何加入大数据文摘字幕组! 前几天《大数据文摘》为大家介绍了Youtube科技网红Siraj的《Tensorflow+40行代码识别手写数字图像》的视频,得到一致好评。今天,我们继续推介风趣幽默的Sir
人工智能从幕后走向实用离不开人工智能技术取得的突破和发展。在互联网时代背景下,大数据、新型高性能计算架构以及深度学习帮助人工智能技术实现了从量变到质变的转变。其中,计算机视觉、语音识别技术均已能够规模
然而,这些并非新概念。第一个人工神经网络(ANN)是在 40 年代引入的。那么为什么最近的热点话题都是关于神经网络和深度学习的呢?我们将在 GPU 和机器学习的一系列博客文章中探讨这些概念。
自 2015 年 11 月首次发布以来,TensorFlow 凭借谷歌的强力支持,快速的更新和迭代,齐全的文档和教程,以及上手快且简单易用等诸多的优点,已经在图像识别、语音识别、自然语言处理、数据挖掘和预测等 AI 场景中得到了十分广泛的应用。 在所有这些 AI 应用场景中,或许是源于视觉对人类的直观性和重要性,图像识别成为其中发展速度最快的一个。目前,该技术已经逐渐趋于成熟,并在人脸和情绪识别、安防、医疗筛查和汽车壁障等诸多领域都取得了重大成功。 在这种情况下,对于绝大多数的 AI 开发者而言,利用 Te
神经网络是一种由多个神经元按照一定的拓扑结构相互连接而成的计算模型。其灵感来自于人类大脑中神经元之间的相互作用。
人工智能在经过了5年突破性的发展,2015年是人工智能发展的一个里程碑。计算机已经变得更加的精巧并且学习速度比以前更快。 谷歌的高级研究员Jeff Dean说,AI领域可以说确实处于加速发展中。为了庆祝他们的成就和制定关于人工智能领域的发展计划,这周Dean和许多其他AI领域的顶级人物聚集在蒙特利尔召开的神经信息处理系统会议。这个会议开始于1987年,并且由于其对AI领域不断进行探索研究,最近几年其已经发展成硅谷众多公司必须参加的重大会议。Facebook的首席执行官马克扎克伯格在NIPS上宣布要成立一个
先来一首《好久不见》,给大家说一声抱歉,最近因为种种的原因,没有通过“计算机视觉战队”给打开带来好的文章和知识的分享,在此,代表“计算机视觉战队”向所有关注我们的您敬个礼,也非常感谢大家的支持,谢谢! 注:希望大家看这篇文章的时候,可以听着音乐来阅读,因为这是一篇简单易懂,并且可以给大家带来一丝放松的内容吧,希望能给有需要的您带来一些帮助,谢谢支持。 那我们就回归正题,来开始和您来聊聊已经占领了半片天的人工智能,作为学习者的我,也不敢说的太深入,更希望得到大家的指正与批评,来增加平台文章的质量。进一步
像Google和Microsoft这样的大公司在图像识别方面已经超越了人类基准[1,2]。平均而言,人类大约有5%的时间在图像识别任务上犯了错误。截至2015年,微软的图像识别软件的错误率达到4.94%,与此同时,谷歌宣布其软件的错误率降低到4.8%[3]
视频AI不仅需要建模图像的空间域信息,还需要建模视频帧之间的时间域信息。
有一种职业叫做:鉴黄师,这是一个令很多人羡慕嫉妒恨的职业,直白来说就是判断图片是不是色情图片。今天我们交给大家如何使用 Python 来做识别裸体图片。
深度学习如今应用领域愈发广泛。从语言翻译、预测蛋白质的折叠结构、以及到下围棋、写作文,几乎无处不在。
说起人工智能,孕育了卷积神经网络和深度学习算法的 ImageNet 挑战赛恐怕是世界上最著名的 AI 数据集。8 年来,在 ImageNet 数据集的训练下,人工智能对于图像识别的准确度整整提高了 10 倍,甚至超越了人类视觉本身。
几乎所有的机器学习程序可能会有50个不同的方向可以前进,并且每个方向都是相对合理的,可以改善你的系统?如何集中精力
导语 JavaScript 适合做机器学习吗?这是一个问号。但每一位开发者都应该了解机器学习解决问题的思维和方法,并思考:它将会给我们的工作带来什么?同样,算法能力可能会是下一阶段工程师的标配。 本文旨在通过讲解识别手写字的处理过程,带读者了解机器学习解决问题的一般过程。本文适合以下背景的读者阅读: 你不需要具备 Python、C++ 的编程能力:全文使用 JavaScript 作为编程语言,且不依赖任何第三方库实现机器学习算法。 你不需要具备算法能力和高数的背景,本文机器学习算法的实现不过 20 行代
本文提出了一种基于局部二值模式的图像检索方法,首先提取图像的局部二值模式特征,然后使用相似性度量方法将提取的特征与数据库中的特征进行比较,最后使用基于距离的排序算法对图像进行排序。实验结果表明,该方法能够有效地检索出具有相似特征和模式的图像,具有较好的检索效果。
探索网络对底层任务的理解层次,通过对抗训练减少原有独立同分布的测试集的错误率——在对抗扰动的训练集上训练网络
计算机视觉已经是日常生活的一部分。借助这种技术,Facebook可以识别你上传到社交网络的照片上的人物;Google Photo能够自动在收藏行列中找出特定的图片,以及识别出各种各样的东西……这样的
图像识别的深度残差学习————联合编译:李尊,陈圳、章敏 摘要 在现有基础下,想要进一步训练更深层次的神经网络是非常困难的。我们提出了一种减轻网络训练负担的残差学习框架,这种网络比以前使用过的网络本质上层次更深。我们明确地将这层作为输入层相关的学习残差函数,而不是学习未知的函数。同时,我们提供了全面实验数据,这些数据证明残差网络更容易优化,并且可以从深度增加中大大提高精度。我们在ImageNet数据集用152 层--比VGG网络深8倍的深度来评估残差网络,但它仍具有较低的复杂度。在ImageNet测试集中,
2017年,CapsuleNet的出现是Hinton大佬对于卷积神经网络等的思考,想去构建一种新的网络结构, 如何克服CNN存在的问题的,那CN网络又存在什么问题:
也不知道为什么,也许纯粹是突然奇想吧,出一个习题给学徒,拿到这个热图里面的基因名字。我给出3个提示,看看大家属于哪一种人!
大数据文摘作品,转载要求见文末 作者 | Thimira Amaratunga 编译 | 宁云州、吴双、张伯楠 【深度学习】这个几年前还鲜为人知的术语,近期迅速蹿红,成为人尽皆知的大IP。不过在火起来之前,这个技术已经发展了十几年。人尽皆知前,深度学习是如何一步一步自我演化并走进公众视野的? 1998年,Yann LeCun 发表Gradient-Based Learning Applied to Document Recognition,至今,深度学习已经发展了十几年了。以大家熟知的CNNs为代表的技术在
基于传统的图像局部二值特征的图像识别与匹配,有没有更简单的特征融合方法?
「clean code」是机器学习的基础,在公开的数据集取得更好的效果也是发表论文的基础。
日前,微软发布了第三代微软小冰产品,宣布进一步解锁了包括视觉、听觉在内的人工智能感官系统,结合情感计算技术,让小冰能够用更加逼近人类的方式,通过自然语言和用户进行交流。 微软集团全球执行副总裁陆奇和微软(亚洲)互联网工程院院长王永东出场,表明了微软对小冰的重视程度。陆奇强调说,人工智能已迎来拐点,而小冰是微软人工智能战略的重要组成部分。 小冰动向 陆奇宣布了微软小冰的如下进展: 微软小冰的全球人工智能战略计划正式启动。其中,在日本,与LINE共同宣布战略合作,日本版小冰 Rinna 在短短两周内已覆盖日本全
深度学习在物体识别中的应用 ImageNet图像分类 深度学习在物体识别中最重要的进展体现在ImageNet ILSVRC3挑战中的图像分类任务。传统计算机视觉方法在此测试集上最低的错误率是26.172%。2012年,欣顿的研究小组利用卷积网络把错误率降到了15.315%。此网络结构被称为Alex Net,与传统的卷积网络相比,它有三点与众不同之处:首先,Alex Net采用了dropout的训练策略,在训练过程中将输入层和中间层的一些神经元随机置零。这模拟了噪音对输入数据的各种干扰使一些神经元对
1 图像识别是什么? 2 图像识别的应用场景有哪些? 什么是图像识别 图像识别,是指利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对像的技术。根据观测到的图像,对其中的物体分辨其类别
本文介绍了机器学习中模型性能评价的基本概念、常用评价指标、评价方法的分类以及具体案例。包括准确率、精确率、召回率、F1分数、ROC曲线、AUC值、混淆矩阵、损失函数、准确率与混淆矩阵、召回率与F1分数、ROC与AUC等。在评价方法中,介绍了交叉验证、留一法、时间序列法等具体方法。最后介绍了如何通过human-level performance和bayes optimal error来评价模型性能以及提高模型性能的常见方法。
当我们最初得到一个深度神经网络模型时,我们可能希望从很多方面来对它进行优化,例如:
---- 新智元报道 编辑:编辑部 【新智元导读】6月14日凌晨,旷视首席科学家、旷视研究院院长孙剑博士突发疾病去世,享年45岁。 6月14日凌晨,一位AI巨星陨落。 刚刚,旷视研究院发文,旷视首席科学家、旷视研究院院长孙剑博士去世。 我们万分难过,旷视首席科学家、旷视研究院院长孙剑博士因突发疾病抢救无效,于2022年6月14日凌晨,永远离开了我们。 孙剑博士一生专注于科研工作。他的不幸离世,让旷视失去了一位在人工智能技术领域探索和创新的领路人。每一位和他共事过的旷视同学,失去了一位智慧谦和
多层神经网络出来以后,只火了一小会。上世纪90年代到2006年,叫人工神经网络的沉寂期。原因如下:
【新智元导读】美国2018年二季度GDP增速达4.1%,为4年来最高水平,但这更多的是临时政策刺激下的结果,可持续性不高。本文认为,AI和机器学习技术的大发展才是推动世界范围内生产力和经济增长的强劲、可持续的引擎。企业、工人和决策者都应及时调整策略,凭借这一引擎达到“共享式”的繁荣。
导语:Pedro Gusmão 等人对于英伟达的四种 GPU 在四种不同深度学习框架下的性能进行了评测。本次评测共使用了 7 种用于图像识别的深度学习模型。 第一个评测对比不同 GPU 在不同神经网络和深度学习框架下的表现。这是一个标准测试,可以在给定 GPU 和架构的情况下帮助我们选择合适的框架。 第二个测试则对比每个 GPU 在不同深度学习框架训练时的 mini-batch 效率。根据以往经验,更大的 mini-batch 意味着更高的模型训练效率,尽管有时会出现例外。在本文的最后我们会对整个评测进行简
AI 科技评论按:谷歌大脑近期的一篇新论文对对抗性样本做了多方面的理论性研究,不仅首次发现了简单数据分布下对抗性样本的分布特性,而且得出了「分类误差为零的模型不存在对抗性样本」这样的大家此前不曾想象过
现在,我打开Google Photos,输入“海滩”,就能查看我过去10年里去过的所有海滩的照片。我从来没有浏览过我的照片,也没有一张张给它们贴标签;相反,谷歌是根据照片本身的内容来识别海滩的。
来源:Deephub Imba本文约3500字,建议阅读14分钟本文文章简要介绍了研究人员在图像识别算法和图像数据方面的演变,并总结了现在的一些热门话题。 三十多年来,许多研究人员在图像识别算法和图像数据方面积累了丰富的知识。如果你对图像训练感兴趣但不知道从哪里开始,这篇文章会是一个很好的开始。这篇文章简要介绍了过去的演变,并总结了现在的一些热门话题。 ImageNet 预训练模型 迁移学习(热门话题) 使用预训练模型识别未知图像 PyTorch ImageNet 的起源 在 2000 年代初期,大多数
【新智元导读】 谷歌官方博客今天发布了一篇文章,介绍如何使用神经网络压缩图片。在论文中,谷歌证明了神经网络可以获得比现在普遍使用的压缩方法质量更好、大小更小的图片,理论上会小25%。谷歌这次要解决图片占用内存过多的问题。用户可以去 TensorFlow使用该模型压缩自己的图片。 作者: Nick Johnston and David Minnen, Software Engineers 数据压缩几乎发生在互联网的任何角落,你观看的视频、分享的突破、听的音乐,甚至你现在在看的文章,都是经过压缩的。压缩技术使得
MachineLearning YearningSharing 是北京科技大学“机器学习研讨小组”旗下的文献翻译项目,其原文由Deep Learning.ai 公司的吴恩达博士进行撰写。本部分文献翻译工作旨在研讨小组内部交流,内容原创为吴恩达博士,学习小组成员只对文献内容进行翻译,对于翻译有误的部分,欢迎大家提出。欢迎大家一起努力学习、提高,共同进步!
今天,我们介绍的机器学习算法叫逻辑回归。它英语名称是Logistic Regression,简称LR.
领取专属 10元无门槛券
手把手带您无忧上云