首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

2017年深度学习领域阅读量最高11篇文章

转移学习以及在深度学习中使用预先训练模型 使用工具:Keras 级别:高级 在当今世界,用于机器RAM非常便宜,易于使用,而且投入又少。...如果你需要数百GBRAM来解决超级复杂监督机器学习问题,完全可以考虑自己购买。另一方面,GPU并不便宜。如果你想使用GPU上100 GB VRAM,还得配套其他设备,要付出很高成本。...本文介绍了如何使用预先训练模型提出解决方案,如何使用VGG16等预先训练模型进行图像分类。...人类可以高效完成一项任务,但对计算机来说,很难。当然,计算机可以匹配两个字符串并告诉你是否相同。但是,当你在寻找梅西时,如何让电脑告诉你关于足球或罗纳尔多事?...答案是单词创建一个表示形式,捕捉它们含义,语义关系以及它们所应用不同类型上下文。 所有这些都是通过使用“Word嵌入”或“文本数字表示”来实现

1K80

英伟达发布迁移学习工具包,现在可以申请早期试用

英伟达说,开发者不用费时费力自己去搭建深度神经网络 (DNN) ,直接对预训练模型做些修改,就可以做出自己应用。 并且,工具包里许多模型,都是某一领域定制。...所谓迁移学习,是指预训练模型已经学习到一些特征,我们要把它学到东西,通过权重,迁移给另外一个神经网络。 用户还可以在工具包提供原有神经网络上,增加数据,或者增加特征。...英伟达官方总结了六大关键功能: 许多预训练优化过领域特定DNN,预先打包在里面; 计算机视觉中,物体分类、检测应用示例; 在异构多GPU环境中,易于做模型适应 (Model Adaptation...两种主要应用 英伟达介绍两种应用,一是智能视频分析 (IVA) 。 比如,停车管理、物流管理、零售分析等方面都有这样应用。 工具包里模型,都是专门用来做IVA推理、并经过透彻训练。 ?...工具包里模型,依然是专为这类应用训练。 ? 比如,AI辅助人类进行数据标注SDK,可以加速医学影像标注过程。 还有,英伟达团队曾经开发过一个3D脑瘤分割模型,叫做BraTS。

59010
您找到你想要的搜索结果了吗?
是的
没有找到

英伟达发布迁移学习工具包,现在可以申请早期试用

英伟达说,开发者不用费时费力自己去搭建深度神经网络 (DNN) ,直接对预训练模型做些修改,就可以做出自己应用。 并且,工具包里许多模型,都是某一领域定制。...所谓迁移学习,是指预训练模型已经学习到一些特征,我们要把它学到东西,通过权重,迁移给另外一个神经网络。 用户还可以在工具包提供原有神经网络上,增加数据,或者增加特征。...英伟达官方总结了六大关键功能: 许多预训练优化过领域特定DNN,预先打包在里面; 计算机视觉中,物体分类、检测应用示例; 在异构多GPU环境中,易于做模型适应 (Model Adaptation...两种主要应用 英伟达介绍两种应用,一是智能视频分析 (IVA) 。 比如,停车管理、物流管理、零售分析等方面都有这样应用。 工具包里模型,都是专门用来做IVA推理、并经过透彻训练。 ?...工具包里模型,依然是专为这类应用训练。 ? 比如,AI辅助人类进行数据标注SDK,可以加速医学影像标注过程。 还有,英伟达团队曾经开发过一个3D脑瘤分割模型,叫做BraTS。

65320

Transformer本可以深谋远虑,但就是不做

这项研究得出结论是:Transformer 能力这样做,但在实践中不会这样做。 我们都知道,人类会思而后言。数十年语言学研究表明:人类在使用语言时,内心会预测即将出现语言输入、词或句子。...不同于人类,现在语言模型在「说话」时会为每个 token 分配固定计算量。那么我们不禁要问:语言模型会和人类一样预先性地思考吗?...论文地址:https://arxiv.org/pdf/2404.00859.pdf 研究概览 他们观察到,在训练期间梯度既会为当前 token 位置损失优化权重,也会为该序列后面的 token...他们又进一步问:当前 transformer 权重会以怎样比例当前 token 和未来 token 分配资源?...他们配置了一种任务,其中模型必须下一 token 预先计算信息,否则就无法在一次单向通过中准确计算出正确答案。 该团队构建合成数据集定义。

9310

深度神经网络发展历程全回顾:如何加速DNN运算?

这些DNN方法被大量应用在无人驾驶汽车,癌症检测,游戏AI等方面。在许多领域中,DNN目前准确性已经超过人类。...这意味着创建一个程序,这个程序可以被训练去学习如何去做一些智能行为,然后这个程序就可以自己完成任务。传统的人工启发式方法,需要对每个新问题重新设计程序。 高效机器学习算法优点是显而易见。...注意,学习过程是学习刺激导致权重调整,大脑组织(可以被认为是程序)并不改变。大脑这个特征对机器学习算法很好启示。...用于确定权重另一种常用方法是fine-tune,使用预先训练模型权重用作初始化,然后针对新数据集(例如,传递学习)或新约束(例如,降低精度)调整权重。...每个ALU自己控制逻辑和本地内存,称为暂存器或注册文件。空间架构主要使用在为DNN专门设计ASIC中。 ?

2.7K60

Facebook用10亿无标注数据预训练实现SOTA:提出自监督CV新模型

这一步被认为对有朝一日实现人类机器智能至关重要。 研究人员认为,AI 未来在于做出一种自动化系统:其可以从任何给定信息中进行推断,不依赖于标注数据集。...SEER 是 SElf-supERvised 缩写,包含 13 亿个参数,可以从互联网上任何一组随机图像中学习,不需要标记数据。 SEER何创新之处?...SwAV 使用了一种聚类技术,可以快速地对来自相似视觉概念图像进行分组,并利用它们相似性,与以前最先进自监督学习相比了改进,同时所需训练时间缩短原来1/6。 ?...Facebook 在博客中写道:自监督学习一直是 Facebook AI 关注焦点,因为它使机器能够直接从大量可用信息中学习,不仅仅是从专门 AI 研究创建训练数据中学习。...自监督学习还可以帮助我们在图像或元数据有限领域(如医学成像)进行专门研究。而且,无需预先进行标记,就可以更快地创建和部署模型,从而能够更快、更准确地响应快速变化情况。

59830

狗盲不存在!印度小哥实战搭建狗品种识别算法,只要7步

具体步骤分为七步: 第 1 步:检测人类 第 2 步:检测狗 第 3 步:创建一个CNN 来对狗品种进行分类 第 4 步:使用 CNN 对狗品种进行分类(使用迁移学习) 第 5 步:创建一个CNN来对狗品种进行分类...第3步 创建一个 CNN 来对狗品种进行分类 现在有了在图像中检测人类和狗功能,必须设计出一种从图像中预测品种方法。...模型概述 模型编译 模型训练 当前,研究者已经对模型进行了 25 次训练,批量大小 20。使用优化器是rmsprop。使用该模型获得准确度和精密度分别为15.5%和14%。...因为只需要训练最后几层并利用已经训练 CNN 模型权重,在这种情况下是VGG-16。...此外,通过增加训练数据可以使提取瓶颈特征更完整,并且创建更丰富图像表示,从而提高准确性。 制作一个狗狗检测器,你学废了吗?

96560

赫尔辛基大学AI基础教程:先进神经网络技术(5.3节)

它们几乎所有现代神经网络应用提供动力 它们很多有趣而有力变种,导致深度学习许多领域取得了巨大进展。 卷积神经网络(CNN) 图像处理是深度学习取得惊人成功一个领域。...幸运是,对于过多权重问题,一个非常优雅解决方案:一种特殊神经网络,或者更确切地说,是一种可以包含在深度神经网络中特殊类型层。这种特殊层是一个所谓卷积层。...所以,例如,只有当训练数据包含图像右上角停车标志时,才会检测图像右上角停车标志。CNN可以识别图像中任何位置物体,无论它在训练图像中处在什么位置。...这点非常重要,因为它很容易获得几乎无限量无标签训练数据(无标签图像)用于训练底层。顶层则是通过监督机器学习技术(例如反向传播)进行训练。 ? 神经网络是否梦见电子羊?...一个专门训练检测停车信号网络对于检测手写数字或猫是没有用。 通过对训练底层进行研究,也就是说研究他们学到特征是什么样,我们得到了一个有趣结果。

38320

13亿参数,无标注预训练实现SOTA:Facebook提出自监督CV新模型

这一步被认为对有朝一日实现人类机器智能至关重要。 研究人员认为,AI 未来在于做出一种自动化系统:其可以从任何给定信息中进行推断,不依赖于标注数据集。...经过研究,Facebook 研究人员发现,扩展 AI 系统以处理复杂图像数据至少需要两个核心部分: 第一算法,其需要从大量随机图像中学习,不需要任何元数据或注释; 第二卷积网络,ConvNet...SwAV 使用了一种聚类技术,可以快速地对来自相似视觉概念图像进行分组,并利用它们相似性,与以前最先进自监督学习相比了改进,同时所需训练时间缩短原来1/6。 ?...Facebook 在博客中写道:自监督学习一直是 Facebook AI 关注焦点,因为它使机器能够直接从大量可用信息中学习,不仅仅是从专门 AI 研究创建训练数据中学习。...自监督学习还可以帮助我们在图像或元数据有限领域(如医学成像)进行专门研究。而且,无需预先进行标记,就可以更快地创建和部署模型,从而能够更快、更准确地响应快速变化情况。

78330

DAN改进视觉参考分辨率,DRLIH实现图像复刻 | AI一周学术

潜在应用与效果 自动驾驶汽车研究人员和工程师可以实施角落案例框架,自动驾驶系统开发更集中训练,因为它有助于解决代表性不足关键训练数据问题。...潜在应用与效果 多车辆轨迹生成器是自动驾驶开发中一大进步。不仅是自动驾驶技术能因此获益加速发展,这一方法同样可以扩展到类似数据短缺问题深度学习其他研究领域。...潜在应用与效果 研究人员和开发人员可以将HRNet应用于高级对象检测,动态识别,语义分割,人机交互(HCI),虚拟现实,增强现实,人脸识别及比对,图像识别及分类,翻译以及其他依赖跟踪和识别人类活动实现服务应用...我很期待一天我智能手机可以告诉我我举重姿势是否正确。...通过查询图像是否原始图像构造或副本,它可用于图像有效性验证。DRLIH还可用于本地存储或缓存有效性验证,防止照片重新传输或重复存储,以及目前通过水印实现版权保护等。

46710

深度学习与神经科学相遇:不同脑区优化成本函数程序化实现分析

为了支持这些假设,我们认为通过多层神经元对可信度分配(Credit Assignment)一系列实现是与我们当前神经电路知识相兼容,并且大脑一些专门系统可以被解释对特定问题实现有效优化。...例如,识别面部区域可以首先使用简单heuristic来训练以来检测面部,这种heuristic就比如是在直线之上存在两个点,然后进一步训练以使用来自无监督学习表示结合来自其他与社交奖励处理相关大脑区域错误信号来区分显著面部表情...(C)内部生成成本函数和错误驱动神经皮质深层网络经过训练形成包含几个专门系统较大架构一部分。...大量信息可用于无人监督学习,但没有理由假设会存在一个通用无监督算法,无论多么强大,将按人们需要知道顺序精确学习人类需要知道事情。...这段读起来非常吃力,但值得注意是其中提到只对输出层进行无监督训练方式,是否一定能使优化变得简单呢?可以尝试做实验验证一下。

1.1K100

综述:AI系统安全实用方法介绍

1)OOD检测 OOD数据检测指的是识别不代表训练数据分布数据样本。不确定性评估与该领域密切相关,模型自我评估是 OOD 检测活跃研究领域之一。...两种数据增强方法,第一种是data warping增强,专注于获取现有数据并以不影响标签方式对其进行转换。另一种是oversampling增强,创建可用于增加数据集大小合成数据。...5)极端情况 Corner Case 检测 虽然手动创建极端案例(例如,构建或重新制定场景)可能更可控,但扩展性方法还是需要系统地自动化搜索极端案例。...自动Corner Case 检测一种方法是基于输入数据转换。另一个研究方向是调查是否构建AI功能输入空间可以支持Corner Case检测。 备注:感谢微信公众号「3D视觉工坊」整理。...DNNs 专门视频预测设计。从头开始训练,要求序列中训练数据可用。2. 从单步图像预测 DNN 到视频预测 DNN 转变。通常不需要训练,即模型现有权重可以不加改变地使用。

39610

TPU新秘密武器!谷歌Jeff Dean团队推「AI造芯」,自主设计芯片仅需6小时

为了训练这个监督模型,就需要一个大型芯片放置数据集以及相应奖励标签。 因此,研究人员创建了一个包含10000个芯片位置数据集,其中输入是与给定位置相关联状态,标签是该位置奖励。...研究人员首先选择了5个不同芯片净网表,并用AI算法每个网表创建2000个不同布局位置。...结果显示,系统和人类专家均生成符合时间和阻塞要求可行位置,AI系统在面积、功率和电线长度方面优于或媲美手动布局,同时满足设计标准所需时间要少得多。...这说明预训练所学到权重和专家设计经验起了很关键作用——看不见块生成更高质量放置方案。...Ariane RISC-V CPU30 从零开始训练与从预先训练策略网络开始训练收敛图 接下来,研究人员在三个不同训练数据集上对策略网络进行了预训练(小数据集是中型数据集一个子集,中型数据集是大型数据集一个子集

35810

深度神经网络发展历程全回顾:如何加速 DNN 运算?

这些DNN方法被大量应用在无人驾驶汽车,癌症检测,游戏AI等方面。在许多领域中,DNN目前准确性已经超过人类。...这意味着创建一个程序,这个程序可以被训练去学习如何去做一些智能行为,然后这个程序就可以自己完成任务。传统的人工启发式方法,需要对每个新问题重新设计程序。 高效机器学习算法优点是显而易见。...注意,学习过程是学习刺激导致权重调整,大脑组织(可以被认为是程序)并不改变。大脑这个特征对机器学习算法很好启示。...用于确定权重另一种常用方法是fine-tune,使用预先训练模型权重用作初始化,然后针对新数据集(例如,传递学习)或新约束(例如,降低精度)调整权重。...每个ALU自己控制逻辑和本地内存,称为暂存器或注册文件。空间架构主要使用在为DNN专门设计ASIC中。 ?

1.5K60

【综述】NLP领域迁移学习现状

在当前自然语言处理领域中,也同样普遍存在着不同类型迁移学习。这大致可以从三个维度进行分类:a)源设置和目标设置是否处理相同任务;b)源域和目标域是否相同属性;c)task学习顺序是否相同。...例如,句子表达对于单词级别的预测并没有用,基于词组训练对于词组级预测是重要。总的来说,为了获得最佳目标性能,选择类似的预训练任务是有益。...当目标任务需要预训练嵌入一些交互作用但目前训练模型执行不了时,这通常是帮助,例如以 BERT 训练模型但需要词汇表征或建立跨句子关系模型。...1、要更新哪些权重 对于权重更新,我们可以选择微调或者不微调(预训练权重): a)不要改变预训练权重(特征提取) 在实际应用中,很多人会在预训练表征基础上训练一个线性分类器。...此外,修改预训练模型架构内部结构可能会很困难。 研究者发布检查点模型 检查点文件通常包含了预训练模型所有权重。与 Hub 相比,仍然需要创建模型图,需要单独加载模型权重

50820

机器学习策略(2)

所以这里考虑是否做 一个项目专门处理狗,这个项目可能花几个月时间才能将分类狗算法做好,在狗图片上犯更少错误,与其做这个项目花几个月时间而且结果未知。...现在把这个神经网络拿出来,将其适应(迁移)到不同任务中所学到知识,比如放射科诊断: 把神经网络最后输出层删除 进入到最后一层并将其权重删除 最后一层重新赋予随机权重 然后将神经网络放在放射诊断数据上训练...所以这种情况下,你需要预先学到很多人类声音特征,人类语言组成部分等等知识,可以帮你建立一个很好唤醒字检测器(wake word detector).即使你数据集相对较小....,不是引入人类成见....key question 是否使用端到端算法取决于问题:你是否大量数据能够使系统直接学到从x到y足够复杂函数.

28420

ChatGPT是如何工作?ChatGPT团队给出解释

创建嵌入: 我们将每个标记转换为数字向量。这些称为嵌入。 将嵌入乘以模型权重: 然后,我们将这些嵌入乘以数千亿模型权重。 对预测进行采样: 在此乘法结束时,数字向量表示下一个最可能标记概率。...嵌入 是大型语言模型 (LLM) 核心,我们在下一步中从标记创建它们: 当您向 ChatGPT 提问时发生情况第 3 步 。嵌入将标记表示向量。上述嵌入中值是示例 嵌入是令牌多维表示。...我们最终得到下一个最可能标记(大约是一个单词)概率。我们 根据预先训练数据、提示和迄今为止生成文本对下一个最可能单词进行采样。图片来源: ChatGPT 正在做什么以及它为何有效?...预训练和推理 我们如何生成这组复杂模型权重,其值编码了大部分人类知识?我们通过一个称为 预训练过程来做到这一点。...它也擅长解决与编程相关问题,一次我质疑 ChatGPT 是否人类更有能力 ,即使是在编程等人类迄今为止做得更好领域? 要了解 ChatGPT 局限性,您需要了解它工作原理。

8710

用网络摄像头制作艺术品

在这里真正需要是通过卷积层捕获信息。 在预先训练CNN(例如VGG19网络)中,前16层是卷积层,捕获特征。 ?...这意味着计算网络输出向量与地面实况向量之间距离非常简单。可以从预先训练网络中检索此功能图。根据从中获取特征图网络部分,输出图像看起来会有所不同。...Johnson等人论文提出了一个非常聪明解决方案。创建了一个直接输出风格化图像神经网络,不是获取图像并将其优化为风格化。这种流程在两个方面有所不同。...这会产生与输入大小相同输出。该网络训练特征重建感知损失,不是每像素丢失。等等......什么是感性损失?...与更传统每像素损失相比,它基于从预训练网络提取高级图像特征表示之间差异,不是图像中个体像素差异。

79610

Google芯片自动布局论文解读

尽管对此问题进行了数十年研究,人类专家仍然必要使用现有的放置工具进行数周迭代,以产生满足多方面设计标准解决方案。...在训练中,采用了5个block,每个2000种布局,创建了一个10,000个芯片位置数据集,其中输入是与给定位置相关状态,标签是该位置(线长和拥塞)奖励。...论文将没有经过精细调优、经过预先训练策略网络生成布局位置称为zero-shot布局。这样布局可以在不到一秒钟时间内生成,因为它只需要预先训练策略网络单个推理步骤即可。...这样能够灵活地使用预先训练权重或进一步微调这些权重以针对特定芯片网表属性进行优化。...通过上述实验结果可以看到,从头开始训练策略网络需要花费更长时间才能收敛,即使在24小时之后,结果也要比经过精调策略网络在12小时之后达到结果更差,这表明训练形成网络权重能够实现在较短时间内新设计提供高质量布局目标

1.1K11

NLP领域中迁移学习现状

在当前自然语言处理领域中,也同样普遍存在着不同类型迁移学习。这大致可以从三个维度进行分类:a)源设置和目标设置是否处理相同任务;b)源域和目标域是否相同属性;c)task学习顺序是否相同。...例如,句子表达对于单词级别的预测并没有用,基于词组训练对于词组级预测是重要。总的来说,为了获得最佳目标性能,选择类似的预训练任务是有益。...当目标任务需要预训练嵌入一些交互作用但目前训练模型执行不了时,这通常是帮助,例如以 BERT 训练模型但需要词汇表征或建立跨句子关系模型。...1、要更新哪些权重 对于权重更新,我们可以选择微调或者不微调(预训练权重): a)不要改变预训练权重(特征提取) 在实际应用中,很多人会在预训练表征基础上训练一个线性分类器。...此外,修改预训练模型架构内部结构可能会很困难。 研究者发布检查点模型 检查点文件通常包含了预训练模型所有权重。与 Hub 相比,仍然需要创建模型图,需要单独加载模型权重

82341
领券