神经网络体系搭建_解释卷积神经网络体系结构中的全连接层_搭建神经网络专业显卡 - 腾讯云开发者社区

本篇是神经网络体系搭建的第二篇，解决体系搭建的深度学习网络相关问题，详见神经网络体系搭建(序) 深度学习是一个已经被说烂了的词，几乎说起人工智能，非专业人士也会说出深度学习这个词，甚至有时候觉得神经网络，low爆了，深度学习才流行。我也一度以为深度学习是多么神奇的一个技术，其实说到底，还是神经网络，没啥高大上的，只不过深了很多层，注意，是“深”，而不是“宽”。但是呢，就是深了很多层，确实让它的表现好了很多，所以它才有了一个专有名字，叫做深度学习。深入了解深度学习，先从多层感知器说起。多层感知器（M

010

您找到你想要的搜索结果了吗？

是的

没有找到

归一化技术比较研究：Batch Norm, Layer Norm, Group Norm

谷歌研究：通过自动增强来提高深度学习性能

计算机视觉深度学习的成功可部分归功于大量标记训练数据，随着质量提高，多样性和训练数据量，模型的性能通常会提高。但是，收集足够的高质量数据来训练模型以实现良好性能通常是非常困难的。解决这个问题的一种方法是将图像的对称性硬编码到神经网络体系结构中，这样它们就能更好地运行，或者让专家手动设计数据增强方法，比如旋转和翻转，这些方法通常用于训练表现良好的视觉模型。然而最近人们很少关注如何通过机器学习来自动增加现有的数据。在我们的自动化设计的结果中，我们设计了神经网络体系结构和优化器来取代以前的系统组件，我们是否也可以自动化数据扩增的过程？

今日 Paper | 3D手势估计；自学习机器人；鲁棒语义分割；卷积神经网络；混合高斯过程等

为了帮助各位学术青年更好地学习前沿研究成果和技术，AI科技评论联合Paper 研习社（paper.yanxishe.com），重磅推出【今日 Paper】栏目，每天都为你精选关于人工智能的前沿学术论文供你学习参考。以下是今日的精选内容——

最完整的PyTorch数据科学家指南（1）

PyTorch 已经成为现在创建神经网络的事实上的标准之一，我喜欢它的界面。但是，对于初学者来说，要获得它有些困难。

2018年最佳深度学习书单

摘要： AI人才缺口巨大？如果你想成为AI革命中的一员，那么你就必须要学习深度学习，看看这12本书，它们将成为你的利器！我相信你应该知道人工智能，尤其是深度学习在过去5年左右取得了不错的进步。深度学习是由少数研究人员开始的一个相对较小的领域，现在已经变得如此主流，以至于我们现在每天使用的应用程序和服务，现在都在使用深度学习来执行不久前难以想象的任务。但深度学习并不新鲜，从20世纪40年代开始，Warren McCulloch和Walter Pitts就基于数学和算法创建了神经网络的计算模型。然而，

TensorFlow实现神经网络入门篇

如果你一直关注数据科学/机器学习，你就不能错过深度学习和神经网络的热潮。互联网公司正在寻找这方面的人，而且从竞赛到开源项目，都有巨额奖金。如果你对深度学习所提供的前景感到兴奋，但是还没有开始，在这里或许是你开始的第一步。在这篇文章中，我将介绍TensorFlow。阅读本文后，你将能够理解神经网络的应用，并使用TensorFlow解决现实生活中的问题，本文中的代码是用Python编写的，Python最近的火爆也和深度学习有关。何时使用神经网络？有关神经网络和深度学习的更详细的解释，请看这里（ht

APQ：联合搜索网络架构、剪枝和量化策略

本文提出APQ，以便在资源受限的硬件上进行有效的深度学习推理。与以前分别搜索神经体系结构，修剪策略和量化策略的方法不同，本文以联合方式优化它们。为了应对它带来的更大的设计空间问题，一种有前途的方法是训练量化感知的准确性预测器，以快速获得量化模型的准确性，并将其提供给搜索引擎以选择最佳拟合。但是，训练此量化感知精度预测器需要收集大量量化的<model，precision>对，这涉及量化感知的微调，因此非常耗时。为了解决这一挑战，本文建议将知识从全精度（即fp32）精度预测器转移到量化感知（即int8）精度预测器，这将大大提高采样效率。此外，为fp32精度预测器收集数据集只需要通过从预训练的 once-for-all 网络中采样就可以评估神经网络，而无需任何训练成本。ImageNet 上的大量实验证明了联合优化方法的好处。与MobileNetV2 + HAQ 相比，APQ 以相同的精度将延迟降低2倍，能耗降低1.3倍。与单独的优化方法（ProxylessNAS + AMC + HAQ ）相比，APQ可提高ImageNet精度2.3％，同时减少GPU数量级和CO2排放量，从而推动了绿色AI在环保方面的前沿。

NVIDIA 发布新版本Deepstream SDK，支持Tesla和Jetson产品

NVIDIA DeepStream SDK非常适合正在创建和部署基于AI的大规模视频分析应用程序的开发者们。 DeepStream SDK提供完整的框架和所有基本的构建块。它可以让开发者专注于自己的核

神经架构搜索研究指南，只看这一篇就够了

导读：从训练到用不同的参数做实验，设计神经网络的过程是劳力密集型的，非常具有挑战性，而且常常很麻烦。但是想象一下，如果能够将这个过程实现自动化呢？将这种想象转变为现实，就是本指南的核心内容。我们将探索一系列的研究论文，这些论文试图解决具有挑战性的自动化神经网络设计任务。在本指南中，我们假设读者尝试过使用 Keras 或 TensorFlow 等框架从头开始设计神经网络。

11 个Javascript机器学习库

Brain.js是一个Javascript库，用于替代（现在已弃用的）“ 脑 ”库的神经网络，该库可与Node.js一起使用或在浏览器中使用（注释计算），并为不同任务提供不同类型的网络。以下是训练网络以识别色彩对比的演示。

大佬新番：吴恩达送出深度学习新手大礼包

整理 | 寇雪芹头图 | 下载于ICphoto 出品 | AI科技大本营（ID：rgznai100）昨天， Coursera 网站上更新了《深度学习》专项课程。这是一套很受欢迎的新手的入门级课程，根据 Coursera 网站上的实时显示，这门课程已经有近60万人报名。而就在 4月1号，这个由人工智能领域大佬级人物吴恩达（Andrew Ng）创建的在线教育平台才刚刚上市。吴恩达在昨日发布的推特中表示，更新的内容主要与Transformer相关，编程作业使用的是TensorFlow 2。实际上，《

用R语言中的神经网络预测时间序列：多层感知器和极限学习机

对于此示例，我将对R中的时间序列进行建模。我将最后24个观察值保留为测试集，并将使用其余的观察值来拟合神经网络。当前有两种类型的神经网络可用，多层感知器；和极限学习机。

Tensorflow入门教程（四十九）——UXNet

今天将分享Unet的改进模型UXNet，改进模型来自2020年的论文《UXNet: Searching Multi-level Feature Aggregationfor 3D Medical Image Segmentation》，简单明了给大家分析理解该模型思想。

OpenAI概念学习新模型：学会概念仅需5次示范，实现跨领域概念迁移

衡量是否达到人类智能，涉及由有限的经验，通过抽象推理和规划、类比推理、创造性问题解决和语言能力的概括，从而将经验整合到概念中，将概念作为理解和推理的基本架构。

基于转移学习的图像识别

算法该如何分辨这只狗可能属于哪个品种？当然小伙伴们可以训练自己的卷积神经网络来对这张图片进行分类，但是通常情况下我们既没有GPU的计算能力，也没有时间去训练自己的神经网络。但是，全世界的各个研究团队（例如牛津，谷歌，微软）都拥有足够的计算能力，时间和金钱，而且以前可能已经解决过一些类似的问题。我们该如何利用他们已经完成的工作呢？现在来让我们了解一个重要的概念——转移学习。

用R语言中的神经网络预测时间序列：多层感知器和极限学习机

关于Kinetics-700人类行为数据集的简短说明

作者：Joao Carreira,Eric Noland,Chloe Hillier,Andrew Zisserman

【干货】深度学习中的数学理解— 教你深度学习背后的故事

【导读】如今，深度学习在各项任务中所向披靡，比如图像识别，语音处理和自然语言处理。但是，深度学习的理论探讨却比应用滞后好几个数量级，一方面是做应用马上能见效，然后会有很多人尝试，另一个方面是做理论研究门槛相对比较高。本文是ICCV 2017上《深度学习中的数学理解》（Tutorial on the Mathematics of Deep Learning）教程的论文总结，从网络架构、正则化技术和优化算法三个方面解释深度学习成功背后的数学理论支撑，并详细讲解全局最优性、几何稳定性、学习表征不变性等网络特性的数

从“几何深度学习”看深度学习江湖的统一

通过对称性和的变换，可以提炼出覆盖CNNs, GNNs, LSTMs, Transformers, DeepSets, mesh CNN等一切你所需构建的架构吗？

AutoML入侵强化学习！Google用「元学习」来强化学习，ICLR2021已接收

近年来，AutoML在自动化机器学习的设计方面已经取得了巨大的成功，例如设计神经网络体系结构和模型更新规则。

追根溯源！一图看尽深度学习架构谱系

机器之心整理参与：蒋思源、李泽南、李亚洲近几年，深度学习高速发展，出现了大量的新模型与架构，以至于我们无法理清网络类型之间的关系。在这篇文章中，中国香港科技大学（HKUST）助理教授金成勳总结了深度网络类型之间的谱系图，以便于我们索引不同类型网络的杰出研究成果。金成勳在 GitHub 上梳理出的谱系图如下（点击图片放大查看），最后的蓝色字体部分是各分支内的杰出研究成果（附所有论文链接）。机器之心在此基础上对各个分支网络做了介绍、补充，希望对读者了解网络体系间的关联有所帮助。如有缺陷，欢迎

015

使用激光雷达数据进行自动驾驶汽车的3D对象检测

两者之间的区别在于，在两个阶段的检测器中，第一阶段使用区域提议网络来生成关注区域，第二阶段使用这些关注区域进行对象分类和边界框回归。另一方面，单级检测器使用输入图像直接学习分类概率和边界框坐标。因此，这些架构将对象检测视为简单的回归问题，因此速度更快但准确性较低。

【Keras教程】用Encoder-Decoder模型自动撰写文本摘要

【导读】这篇博文介绍了如何在深度学习框架Keras上实现文本摘要问题，探讨了如何使用编码器-解码器递归神经网络体系结构来解决文本摘要问题，如何实现文本摘要问题的不同的编码器和解码器，博文通俗易懂，专知内容组整理出来，希望大家喜欢。 Encoder-DecoderModels for Text Summarization in Keras 用Keras实现基于Encoder-Decoder的文本自动摘要作者：Jason Brownlee 译者：专知内容组 ▌文本摘要概述 ---- 文本摘要是从一个源文档中

当AI试图成为黑客，画风竟然完全不同于人类？丨科技云·视角

网络安全一直以来是人类智慧和经验高度凝结的领域，也是很多科幻电影中人类对抗外星种族或邪恶机器最后的防线。当有一天人工智能开始获得了人类黑客的行为方式后会发生什么？

动态 | 再无需从头训练迁移学习模型！亚马逊开源迁移学习数据库 Xfer

Xfer 是一款针对 MXNet 的迁移学习，为适那些希望达到以下目的的从业者与研究人员而设计：

在图上发送消息的神经网络MPNN简介和代码实现

欢迎来到图神经网络的世界，在这里我们在图上构建深度学习模型。你可以认为这很简单。毕竟，我们难道不能重用使用正常数据的模型吗? 其实不是。在图中所有的数据点(节点)是相互连接的。这意味着数据不再是独立的

DeepMind强化学习大佬推出PonderNet，可以像人一样「思考」的神经网络

但在人工构建的标准的神经网络中，所使用的计算量随着输入的大小而增长，与所学习问题的复杂性无关。

受人脑功能启发的新型人工智能

近年来，人工智能（AI）推动了高性能自动学习技术的发展。但是，这些技术通常是逐个任务应用的，这意味着为一个任务训练的智能代理在其他任务（甚至非常相似的任务）上的执行效果会很差。为了克服这个问题，列日大学（ULiège）的研究人员开发了一种基于生物学机制的新算法，称为神经调节。该算法可以创建能够执行训练期间未遇到的任务的智能代理。这个新颖而卓越的结果将在本周的《PLOS ONE》杂志上发表。

连不上 GitHub 的朝鲜，也开发出了人脸识别技术

场景描述：近日，朝鲜媒体《统一的回声》发布刊文，介绍了新开发的自研智能蓝天手机。文章中称，该款手机处理速度快，支持人脸识别和指纹解锁等功能。据朝鲜媒体早前报道，该智能手机的人脸识别功能，是由朝鲜的顶级学府金日成综合大学开发而来的。那么这项技术究竟是什么水准？此外，朝鲜国内的 AI 发展又是怎样一个局面？

DeepProbLog: Neural Probabilistic Logic Programming

本论文介绍的DeepProlog是一种概率逻辑编程语言，通过神经谓词和深度学习结合起来。我们将展示现有的推理和正在学习的技术将如何适应新的语言。我们的实验表明，DeepProblog支持符号和子符号的表示和推理，程序的归结，概率逻辑规划，从样例中学习。据我们所知，这项工作首先提出了一个能把通用神经网络和表达概率逻辑建模和推理以某种方式结合的框架，从而有更强的表达能力和两种框架的优点，并且可以基于样例进行端到端的训练。

学界 | 手动调参慢，随机搜索浪费资源？DeepMind异步优化算法PBT解决神经网络痛点

AI科技评论按：在围棋和Atari游戏、图像识别与语言翻译等领域，神经网络都取得了巨大的成功。但经常被忽视的一点是，神经网络在这些特定应用中的成功往往取决于研究开始时做出的一系列选择，包括：使用何种类型的网络、用于训练的数据和方法等。目前，这些选择（又称为超参数）是通过经验，随机搜索或计算密集型搜索过程来选择的。如何选择参数和调参往往成为训练神经网络的关键问题。 AI科技评论发现，在DeepMind最近一篇名为《Population Based Training of Neural Network》的论文中

关于AutoML和神经结构搜索，你需要知道这些

AutoML和神经结构搜索(NAS)是深度学习城堡的新国王。它们是一种快速的方法，可以在不需要太多工作的情况下为机器学习任务获得很高的准确性。

使用TensorFlow动手实现的简单的股价预测模型

本文是一个通过模拟预测股票，教会大家如何动手操作TensorFlow的教程，结果不具有权威性。因为股票价格的实际预测是一项非常复杂的任务，尤其是像本文这种按分钟的预测。导入并预处理数据我们的团队从我们的抓取服务器中的数据并csv格式的保存。数据集包含n = 41266分钟的数据，从2017年4月到8月，500只股票，以及标准普尔500指数成份股。指数和股票以宽格式排列。数据集：http://files.statworx.com/sp500.zip # Import data data= pd.read

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐