开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

将VOCBboxDataset应用于我的数据集时，会返回错误的数据集大小

VOCBboxDataset是一个用于处理目标检测任务中的数据集的类。它通常用于加载和处理包含边界框注释的图像数据集，如PASCAL VOC数据集。

当将VOCBboxDataset应用于自定义数据集时，可能会出现返回错误的数据集大小的问题。这个问题通常是由以下几个原因引起的：

数据集路径错误：首先，需要确保提供给VOCBboxDataset的数据集路径是正确的。请检查路径是否包含正确的文件夹和文件名，并且文件格式符合要求。
数据集格式不匹配：VOCBboxDataset期望的数据集格式是符合PASCAL VOC数据集格式的。确保自定义数据集的注释文件（通常是XML格式）与VOC数据集的注释文件格式相匹配，并且包含正确的边界框注释信息。
数据集标签错误：VOCBboxDataset依赖于正确的标签信息来加载和处理数据集。请确保自定义数据集的标签与VOC数据集的标签相匹配，并且标签名称和类别数量都正确。
数据集预处理错误：在使用VOCBboxDataset之前，通常需要对数据集进行预处理，如图像大小调整、归一化等。确保预处理步骤正确，并且没有导致数据集大小错误的问题。

如果以上步骤都没有解决问题，可以尝试以下方法：

检查数据集样本：检查自定义数据集中的样本，确保图像和注释文件之间的对应关系正确，并且边界框注释的格式正确。
调试代码：检查加载和处理数据集的代码，确保没有逻辑错误或者数据处理错误导致数据集大小错误。
查阅文档和示例：查阅VOCBboxDataset的文档和示例代码，了解如何正确使用该类，并且可以参考示例代码中的数据集处理部分，以确保自定义数据集的处理方式正确。

腾讯云相关产品和产品介绍链接地址：

腾讯云对象存储（COS）：https://cloud.tencent.com/product/cos
腾讯云人工智能（AI）：https://cloud.tencent.com/product/ai
腾讯云物联网（IoT）：https://cloud.tencent.com/product/iotexplorer
腾讯云移动开发（移动推送、移动分析等）：https://cloud.tencent.com/product/mobile
腾讯云数据库（云数据库MySQL、云数据库MongoDB等）：https://cloud.tencent.com/product/cdb
腾讯云服务器（云服务器CVM）：https://cloud.tencent.com/product/cvm
腾讯云音视频处理（云点播、云直播等）：https://cloud.tencent.com/product/vod
腾讯云区块链（腾讯云区块链服务）：https://cloud.tencent.com/product/tbaas
腾讯云元宇宙（腾讯云元宇宙服务）：https://cloud.tencent.com/product/tmu

相关搜索:cifar10数据集“超过允许的最大大小”错误 Data Studio中的数据集配置错误 Redis -获取集群中的总数据集大小 Reportbuilder数据集错误与良好的SQL？Tensorflow数据集，仅调整训练数据的大小为什么数据集为零的XGBoost会返回非零预测？在R中返回数据集的函数大小增加的数据集的历史平均值如何找到tensorflow数据集对象的大小？如何更改Pytorch数据集的大小？

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

如何使用 Google 的 AutoAugment 改进图像分类器

通过使用优化的数据增强方法，在CIFAR-10、CIFAR-100、SVHN和ImageNet上得到了目前最好的结果。您可以从这里找到和使用它们。

02

房价会崩盘吗？教你用 Keras 预测房价！（附代码）

书中其中一个应用例子就是用于预测波士顿的房价，这是一个有趣的问题，因为房屋的价值变化非常大。这是一个机器学习的问题，可能最适用于经典方法，如 XGBoost，因为数据集是结构化的而不是感知的。然而，这也是一个数据集，深度学习提供了一个非常有用的功能，就是编写一个新的损失函数，有可能提高预测模型的性能。这篇文章的目的是来展示深度学习如何通过使用自定义损失函数来改善浅层学习问题。

02

干货|深度学习中的正则化技术概述（附Python+keras实现代码）

数据科学研究者们最常遇见的问题之一就是怎样避免过拟合。你也许在训练模型的时候也遇到过同样的问题--在训练数据上表现非同一般的好，却在测试集上表现很一般。或者是你曾在公开排行榜上名列前茅，却在最终的榜单排名中下降数百个名次这种情况。那这篇文章会很适合你。

02

自动数据增强论文及算法解读（附代码）

数据增强是提高图像分类器精度的有效技术。但是当前的数据增强实现是手工设计的。在本论文中，我们提出了AutoAugment来自动搜索改进数据增强策略。我们设计了一个搜索空间，其中一个策略由许多子策略组成，每个小批量的每个图像随机选择一个子策略。子策略由两个操作组成，每个操作都是图像处理功能，例如平移，旋转或剪切，以及应用这些功能的概率。我们使用搜索算法来找到最佳策略，使得神经网络在目标数据集上产生最高的验证准确度。我们的方法在ImageNet上获得了83.5％的top1准确度，比之前83.1％的记录好0.4％。在CIFAR-10上，我们实现了1.5％的错误率，比之前的记录好了0.6％。扩充策略在数据集之间是可以相互转换的。在ImageNet上学到的策略也能在其他数据集上实现显著的提升。

02

深度学习中的正则化技术概述（附Python+keras实现代码）

来源 | Analytics Vidhya 编译 | 磐石出品 | 磐创AI技术团队【磐创AI导读】：本文介绍了四种正则化方法，用以优化神经网络模型的训练。并附python+keras实战。关注公众号并发送关键字"正则化数据集"获取数据集下载指引，发送关键字"正则化代码"获取完整代码。欢迎大家点击上方蓝字关注我们的公众号：磐创AI。介绍数据科学研究者们最常遇见的问题之一就是怎样避免过拟合。你也许在训练模型的时候也遇到过同样的问题--在训练数据上表现非同一般的好，却在测试集上表现很一般。或者是你曾在公

01

FastAI 之书（面向程序员的 FastAI）（三）

现在您了解了深度学习是什么、它的用途以及如何创建和部署模型，现在是时候深入了！在理想的世界中，深度学习从业者不必了解每个细节是如何在底层工作的。但事实上，我们还没有生活在理想的世界中。事实是，要使您的模型真正起作用并可靠地工作，您必须正确处理很多细节，并检查很多细节。这个过程需要能够在训练神经网络时查看内部情况，找到可能的问题，并知道如何解决它们。

01

Kaggle 竞赛第五名分享经验给你

这篇文章记录了我参加 Kaggle 植物幼苗分类比赛所采用的方法。我曾连续几个月占据榜首，并最终名列第五。这些方法通用性很好，可以应用到其他的图片分类任务中。（戳链接：https://www.kaggle.com/c/plant-seedlings-classification））

03

译：Tensorflow实现的CNN文本分类

翻译自博客：IMPLEMENTING A CNN FOR TEXT CLASSIFICATION IN TENSORFLOW 原博文：http://www.wildml.com/2015/12/implementing-a-cnn-for-text-classification-in-tensorflow/ github：https://github.com/dennybritz/cnn-text-classification-tf 在这篇文章中，我们将实现一个类似于Kim Yoon的卷积神经网络语句分类

05

Maxout Networks

我们考虑的问题是如何设计模型来利用最近引入的近似模型平均技术(dropout)。我们定义了一个简单的新模型maxout(之所以这样命名，是因为它的输出是一组输入的最大值，而且它是dropout的一个自然伙伴)，旨在促进dropout优化和提高dropout的快速近似模型平均技术的准确性。我们通过经验验证模型成功地完成了这两个任务。我们使用maxout和dropout来演示在四个基准数据集上的最新分类性能:MNIST、CIFAR-10、CIFAR-100和SVHN。

01

nlp-with-transformers系列-02-从头构建文本分类器

文本分类是 NLP 中最常见的任务之一，它可用于广泛的应用或者开发成程序，例如将用户反馈文本标记为某种类别，或者根据客户文本语言自动归类。另外向我们平时见到的邮件垃圾过滤器也是文本分类最熟悉的应用场景之一。

02

Python OpenCV 蓝图：6~7

先前我们已经研究了如何通过关键点和特征来描述对象，以及如何在同一物理对象的两个不同图像中找到对应点。但是，在识别现实环境中的对象并将其分配给概念类别时，我们以前的方法相当有限。例如，在第 2 章“使用 Kinect 深度传感器进行手势识别”，图像中所需的对象是手，必须将屏幕很好地放置在手掌的中央。如果我们可以取消这些限制，那岂不是很好吗？

01

【长文详解】T5: Text-to-Text Transfer Transformer 阅读笔记

谷歌用一篇诚意满满(财大气粗)的基于实验的综述，试图帮助研究者们「拨开云雾见光明」。论文十分适合该领域的初学者通读，写的十分友好，不过由于涉及到的模型/技术很多，所以遇到不熟悉的部分还是需要自行了解。

01

【重磅】Facebook 推出深度学习引擎 DeepText，挑战谷歌智能系统！

【新智元导读】Facebook 昨天推出了基于深度学习的文本理解引擎 DeepText，使用多个深度神经网络构架，结合监督学习与无监督学习，可以从零开始，在词和字符的水平上进行学习。官方称 DeepText 准确率已达到人类水平，该技术有望革新新闻订阅和广告推送模式。将来 DeepText 变得更加智能，再与 Facebook 虚拟助理 M 整合，Facebook 就能更好地连接商家与消费者，在平台上形成一个闭环。当用户的资讯、社交、消费和娱乐等需求都能在 Facebook 得到满足时，还会有人使用谷歌搜索

训练神经网络的技巧总结

以下技巧旨在让您更轻松。这不是必须做的清单，但应该被视为一种参考。您了解手头的任务，因此可以从以下技术中进行最佳选择。它们涵盖了广泛的领域：从数据增强到选择超参数；涉及到很多话题。使用此选择作为未来研究的起点。

02

数据增强：数据有限时如何使用深度学习？（续）

这篇文章是对深度学习数据增强技术的全面回顾，具体到图像领域。这是《在有限的数据下如何使用深度学习》的第2部分。

04

ControlNet 1.1重磅发布，14个模型全部开源！

从 ControlNet 1.1 开始，我们开始使用标准 ControlNet 命名规则 (SCNNRs) 来命名所有模型，作者希望这个命名规则能够提升用户体验。

04

干货 | 三分钟重新学习交叉验证

AI 科技评论按：文章的作者 Georgios Drakos 是一名数据科学家，通过本文作者向我们介绍了交叉验证的基本概念、作用以及如何使用。AI 科技评论根据原文进行了编译。

01

ICCV2023 基准测试：MS-COCO数据集的可靠吗？

论文标题：Benchmarking a Benchmark: How Reliable is MS-COCO?

03

Procedural Noise Adversarial Examples for Black-Box Attacks on Deep Neural Networks 论文笔记(2)

该文章提出一种利用程序化噪声来生成对抗样本的方法, 所提出的方法和那些通过梯度不断修改以至于到达分类器的边界的方法不一样, 上述方法需要对目标的模型有一定的了解.

01

深度学习有什么问题？

在本文中，我想将经典数学建模和机器学习之间建立联系，它们以完全不同的方式模拟身边的对象和过程。虽然数学家基于他们的专业知识和对世界的理解来创建模型，而机器学习算法以某种隐蔽的不完全理解的方式描述世界，但是在大多数情况下甚至比专家开提出的数学模型更准确。然而，在许多应用程序（如医疗保健，金融，军事）中，我们需要清晰可解释的决策，而机器学习算法，特别是深度学习模型并不是这样设计的。

03

“GANs”与“ODEs”：数学建模的终结？

在本文中，我想将经典数学建模和机器学习之间建立联系，它们以完全不同的方式模拟身边的对象和过程。虽然数学家基于他们的专业知识和对世界的理解来创建模型，而机器学习算法以某种隐蔽的不完全理解的方式描述世界，但是在大多数情况下甚至比专家开提出的数学模型更准确。然而，在许多应用程序（如医疗保健，金融，军事）中，我们需要清晰可解释的决策，而机器学习算法，特别是深度学习模型并不是这样设计的。

02

手动特征工程已经OUT了！自动特征工程才是改进机器学习的方式

【导读】近年来，我们在自动模型选择和超参数调优方面取得了进展，但机器学习流程中最重要的方面-- 特征工程，在很大程度上被我们所忽略。在本文中，我们将使用 Featuretools 库来了解自动化特征工程如何改变并优化机器学习的工作方式。

03

爆火！CodiumAI | 提出LLM代码生成新方法: AlphaCodium，可让GPT-4提升2.3倍！

代码生成问题与常见的自然语言处理问题不同，代码生成需要匹配目标语言的确切语法，关注代码规范的众多细节，所以适用于常见自然语言生成的优化方法和技巧并不一定对代码生成产生同样好的效果。

01

NanoNets：数据有限如何应用深度学习？

我觉得人工智能就像是去建造一艘火箭飞船。你需要一个巨大的引擎和许多燃料。如果你有了一个大引擎，但燃料不够，那么肯定不能把火箭送上轨道；如果你有一个小引擎，但燃料充足，那么说不定根本就无法成功起飞。所以，构建火箭船，你必须要一个巨大的引擎和许多燃料。深度学习（创建人工智能的关键流程之一）也是同样的道理，火箭引擎就是深度学习模型，而燃料就是海量数据，这样我们的算法才能应用上。——吴恩达使用深度学习解决问题的一个常见障碍是训练模型所需的数据量。对大数据的需求是因为模型中有大量参数需要学习。以下是几个例子展

06

Python 自然语言处理实用指南：第三部分

在本节中，我们将使用 PyTorch 中可用的各种自然语言处理（NLP）技术来构建各种实际 -使用 PyTorch 的世界应用。情感分析，文本摘要，文本分类以及使用 PyTorch 构建聊天机器人应用是本节将介绍的一些任务。

01

【DS】Keras深度学习介绍

现在让我们继续解决一个真正的业务问题。一家保险公司向你提供了他们客户先前索赔的数据。保险公司希望你开发一个模型来帮助他们预测哪些索赔看起来是欺诈的。通过这样做，你希望每年为公司节省数百万美元。这是一个分类问题。这些是数据集中的列。

02

EEGNet：一个小型的卷积神经网络，用于基于脑电的脑机接口

脑机接口(BCI)利用神经活动作为控制信号，可以与计算机直接通信。这种神经信号通常从各种研究充分的脑电图(EEG)信号中选择。对于给定的脑机接口(BCI)范式，特征提取器和分类器是针对其所期望的脑电图控制信号的不同特征而定制的，这限制了其对特定信号的应用。卷积神经网络(Convolutional neural networks， CNNs)已被用于计算机视觉和语音识别中进行自动特征提取和分类，并成功地应用于脑电信号识别中；然而，它们主要应用于单个BCI范例，因此尚不清楚这些架构如何推广到其他范例。在这里，我们想问的是，我们是否可以设计一个单一的CNN架构来准确地分类来自不同BCI范式的脑电图信号，同时尽可能小型的方法。在这项工作中，我们介绍了EEGNet，一个小型的卷积神经网络为基于脑电图的BCI。我们介绍了深度卷积和可分离卷积的使用来构建脑电图特定模型，该模型封装了众所周知的脑机接口脑电图特征提取概念。我们比较了EEGNet，包括被试内和跨被试分类，以及目前最先进的四种BCI范式：P300视觉诱发电位、错误相关负波(ERN)、运动相关皮层电位(MRCP)和感觉运动节律(SMR)。我们表明，当在所有测试范例中只有有限的训练数据可用时，EEGNet比参考算法更好地泛化，并取得了相当高的性能。此外，我们还演示了三种不同的方法来可视化训练过的EEGNet模型的内容，以支持对学习到的特征的解释。意义：我们的结果表明，EEGNet足够鲁棒，可以在一系列BCI任务中学习各种各样的可解释特征。本文发表在Journal of Neural Engineering杂志。

03

NeurIPS 2021 Spotlight | 针对有缺失坐标的聚类问题的核心集

本文是《针对有缺失坐标的聚类问题的核心集（Coresets for Clustering with Missing Values）》的解读。该工作为带有多个缺失坐标的 k-聚类问题，特别是 k-means，设计第一个有理论保证的、可在近线性时间构造的核心集（coreset)。我们的核心集可以用来加速一个最近的 SODA 2021 结果，从而得到第一个带缺失坐标k-means问题的近线性时间近似方案。本工作还提供相应的实验来证明算法的实用性。

02

只使用Numpy手动实现多层卷积神经网络（详解）

AiTechYun 编辑：yuxiangyu 在过去，我曾写过一篇关于“理解在最大池化层和转置卷积的反向传播”的文章。现在我想要使用这些知识做一个多层（或者说多通道）的卷积神经网络。在阅读本文之前我建议你可以看一下下面两个链接的内容（都是探讨舍弃反向传播给人工智能找到新方向的）：链接1：https://www.quora.com/Why-is-Geoffrey-Hinton-suspicious-of-backpropagation-and-wants-AI-to-start-over 链接2：ht

08

学界 | 超越ImageNet：谷歌内建300M图像数据集揭露精度与数据的线性增长关系

F选自Google Research 机器之心编译参与：蒋思源、路雪自残差网络以来，深度模型拥有了极大的容量，同时 GPU、TPU 等硬件为深度学习提供了巨大的计算力。但计算机视觉最主要的数据集还是仅拥有 1M 图片的 ImageNet，因此谷歌希望利用 300M 的大数据集进一步检验模型的能力和提升空间。过去十年，计算视觉领域取得了巨大成就，其中许多成果应归功于深度学习模型在该领域的应用。自 2012 年起，这些系统的能力取得了极大的进步，这应归功于（a）模型复杂度更高，（b）持续增强的计算力，（c

09

ImageNet Classification with Deep Convolutional Neural Networks

我们训练了一个大型的深度卷积神经网络，将ImageNet lsvprc -2010竞赛中的120万幅高分辨率图像分成1000个不同的类。在测试数据上，我们实现了top-1名的错误率为37.5%，top-5名的错误率为17.0%，大大优于之前的水平。该神经网络有6000万个参数和65万个神经元，由5个卷积层和3个完全连接的层组成，其中一些卷积层之后是最大汇聚层，最后是1000路softmax。为了使训练更快，我们使用了非饱和神经元和一个非常高效的GPU实现卷积运算。为了减少全连通层的过拟合，我们采用了最近开发的正则化方法“dropout”，该方法被证明是非常有效的。在ILSVRC-2012比赛中，我们也加入了该模型的一个变体，并获得了15.3%的前5名测试错误率，而第二名获得了26.2%的错误率。

04

手把手教你从零起步构建自己的图像搜索模型

很多的产品是基于我们的感知来吸引我们的。比如在浏览服装网站上的服装，寻找 Airbnb 上的假期租房，或者领养宠物时，物品的颜值往往是我们做决定的重要因素。想要预测我们喜欢什么样的东西，看看我们对于事物的感知方法大概就能知道了，因此，这也是一个非常有价值的考量。

03

从头开始构建图像搜索服务

一张图片胜过千言万语，甚至N行代码。网友们经常使用的一句留言是，no picture, you say nothing。随着生活节奏的加快，人们越来越没有耐心和时间去看大段的文字，更喜欢具有视觉冲击性的内容，比如，图片，视频等，因为其所含的内容更加生动直观。许多产品是在外观上吸引到我们的目光，比如在浏览购物网站上的商品、寻找民宿上的房间租赁等，看起来怎么样往往是我们决定购买的重要因素。感知事物的方式能强有力预测出我们想要的东西是什么，因此，这对于评测而言是一个有价值的因素。然而，让计算机以人类的方式理解图像已经成为计算机科学的挑战，且已持续一段时间了。自2012年以来，深度学习在图像分类或物体检测等感知任务中的效果慢慢开始超越或碾压经典方法，如直方梯度图（HOG）。导致这种转变的主要原因之一是，深度学习在足够大的数据集上训练时，能够自动地提取有意义的特征表示。

03

dreamcoder-arc：用于抽象和推理的神经网络 ARC-AGI

Neural networks for abstraction and reasoning:Towards broad generalization in machines用于抽象和推理的神经网络:机器的广义泛化

01

pytorch view(): argument 'size' (position 1) must be tuple of ints, not Tensor

在使用PyTorch进行深度学习任务时，我们经常会使用view()函数来改变张量的形状。然而，有时候在使用view()函数时可能会遇到如下错误：

02

100+数据科学面试问题和答案总结 - 机器学习和深度学习

来自Amazon，谷歌，Meta, Microsoft等的面试问题，本文接着昨天的文章整理了机器学习和深度学习的问题

02

PyTorch 深度学习（GPT 重译）（三）

到目前为止，我们已经仔细研究了线性模型如何学习以及如何在 PyTorch 中实现这一点。我们专注于一个非常简单的回归问题，使用了一个只有一个输入和一个输出的线性模型。这样一个简单的例子使我们能够剖析一个学习模型的机制，而不会过于分散注意力于模型本身的实现。正如我们在第五章概述图中看到的，图 5.2（这里重复为图 6.1），了解训练模型的高级过程并不需要模型的确切细节。通过将错误反向传播到参数，然后通过对损失的梯度更新这些参数，无论底层模型是什么，这个过程都是相同的。

01

Integrated Recognition, Localization and Detection using Convolutional Networks

我们提出了一个使用卷积网络进行分类、定位和检测的集成框架。我们认为在一个卷积网络中可以有效地实现多尺度和滑动窗口方法。我们还介绍了一种新的深度学习方法，通过学习预测目标的边界来定位。然后，为了增加检测的置信度，对边界框进行累积而不是抑制。我们证明了使用一个共享网络可以同时学习不同的任务。该集成框架是ImageNet Large scale evisual Recognition Challenge 2013 (ILSVRC2013)定位任务的获胜者，在检测和分类任务上获得了非常有竞争力的结果。在比赛后的工作中，我们为检测任务建立了一个新的技术状态。最后，我们从我们最好的模型中发布了一个名为OverFeat的特性提取器。

03

TPAMI 2022｜3D语义分割中域适应的跨模态学习

域适应是在标签稀缺时实现学习的一项重要任务。虽然大多数工作只关注图像模态，但存在许多重要的多模态数据集。为了利用多模态进行域适应，我们提出了跨模态学习，我们通过相互模仿来加强两种模态的预测之间的一致性。我们限定网络对标记的数据做出正确的预测，并对未标记的目标域数据进行跨模态的一致性预测。无监督和半监督的域适应 settings 的实验证明了这种新颖的域适应策略的有效性。具体来说，我们评估来自 2D 图像、3D 点云或两者都有的 3D 语义分割任务。我们利用最近的自动驾驶数据集来产生各种各样的域适应场景，包括场景布局上、光照上、传感器设置上、天气上的变化，以及 synthetic-to-real 的设置。在所有域适应场景中，我们的方法显著地改进了以前的单模态域适应的 baseline 。

01

Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition

现有的深度卷积神经网络(CNNs)需要一个固定大小的输入图像(如224×224)。这一要求是“人为的”，可能会降低对任意大小/尺度的图像或子图像的识别精度。在这项工作中，我们为网络配备了另一种池化策略，“空间金字塔池”，以消除上述要求。这种新的网络结构称为SPP-net，可以生成固定长度的表示，而不受图像大小/比例的影响。金字塔池对物体变形也有很强的鲁棒性。基于这些优点，SPP-net一般应改进所有基于cnn的图像分类方法。在ImageNet 2012数据集中，我们证明了SPP-net提高了各种CNN架构的准确性，尽管它们的设计不同。在Pascal VOC 2007和Caltech101数据集中，SPP-net实现了最先进的分类结果使用单一的全图像表示和没有微调。在目标检测中，spp网络的能力也很重要。利用SPP-net算法，只对整个图像进行一次特征映射计算，然后将特征集合到任意区域(子图像)，生成固定长度的表示形式，用于训练检测器。该方法避免了卷积特征的重复计算。在处理测试图像时，我们的方法比R-CNN方法快24-102×，而在Pascal VOC 2007上达到了更好或相近的精度。在2014年的ImageNet Large Scale Visual Recognition Challenge (ILSVRC)中，我们的方法在所有38个团队中目标检测排名第二，图像分类排名第三。本文还介绍了本次比赛的改进情况。

02

Spark——RDD

全称为Resilient Distributed Datasets,弹性分布式数据集，是Spark中最基本的数据抽象，它代表一个不可变，可分区,里面的元素可并行计算的集合。RDD在逻辑上是一个数据集，在物理上则可以分块分布在不同的机器上并发运行。RDD允许用户在执行多个查询时显示的将工作缓存在内存中，后续的查询能够重用工作集，这极大的提升了查询速度。在Spark 中，对数据的所有操作不外乎创建RDD,转换已有RDD以及调用RDD操作进行求值，每个RDD都被分为多个分区，这些分区运行在集群的不同节点上，RDD可以包含Python,Java,Scala中任意类型的对象，甚至可以是用户自定义对象。 RDD是Spark的核心，也是整个Spark的架构基础。它的特性可以总结如下：

04

VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION(VGG)

在这项工作中，我们研究了卷积网络深度对其在大规模图像识别设置中的准确性的影响。我们的主要贡献是使用一个非常小的(3×3)卷积滤波器的架构对增加深度的网络进行了全面的评估，这表明通过将深度提升到16-19个权重层，可以显著改善先前的配置。这些发现是我们提交的ImageNet挑战赛的基础，我们的团队在定位和分类方面分别获得了第一名和第二名。我们还表明，我们的表现可以很好地推广到其他数据集，在这些数据集上，他们可以获得最先进的结果。我们已经公开了两个性能最好的ConvNet模型，以便进一步研究如何在计算机视觉中使用深度视觉表示。

00

学界 | 发美照时打上「#」，还能帮Facebook提升图片识别率哟

AI 科技评论按：近日 Facebook 科学家团队发布基于主题标签的深度学习方法，使用已有的拥有主题标签的图片作为训练数据，从而大幅提升了训练数据集的大小。数据集的增大必然会引起图片错误率的提升，他们同时发布了处理图片噪音的方法。他们团队的这项工作对于现今的图片识别领域有着广泛而深远的影响。AI科技评论对全文翻译如下。

02

在Python中使用LSTM和PyTorch进行时间序列预测

顾名思义，时间序列数据是一种随时间变化的数据类型。例如，24小时内的温度，一个月内各种产品的价格，一年中特定公司的股票价格。诸如长期短期记忆网络（LSTM）之类的高级深度学习模型能够捕获时间序列数据中的模式，因此可用于对数据的未来趋势进行预测。在本文中，您将看到如何使用LSTM算法使用时间序列数据进行将来的预测。

01

：too many indices for tensor of dimension 3

在使用深度学习框架进行模型训练或推理时，我们经常会遇到处理多维数据的情况。然而，当我们尝试使用维度为3的张量进行操作时，有时会遇到"too many indices for tensor of dimension 3"（维度为3的张量有太多的索引）的错误信息。本文将介绍这个错误的原因以及如何解决它。

02

深度学习基础之 Dropout

我们知道，将具有不同配置的卷积神经网络模型组合可以减少过拟合，但代价是需要额外的训练和维护多个模型。

02

如何在Python中从零开始实现随机森林

决策树可能会受到高度变异的影响，使得结果对所使用的特定测试数据而言变得脆弱。

08

AI技术讲座精选：用端到端训练模型进行语法智能纠错

现有的拼写检查系统可以识别拼写错误，但无法识别出语法错误，本文的亮点在于使用流行的 seq2seq + attention 模型，在大规模拼写检查数据集上进行训练，用以简单的语法错误识别任务。对上下文敏感的拼写检查系统（例如 Autocorrect）虽然可以纠正大量的来自于即时消息、电子邮件和短消息中的输入错误，但却对即便是最最简单的语法错误无能为力。举个例子，信息“ I’m going to store ”将不会被自动纠错系统报错，但人们通常更倾向于说“ I’m going to the store ”

09

使用CNN和Deep Learning Studio进行自然语言处理

当我们听说卷积神经网络（CNN）时，我们通常会想到计算机视觉。从Facebook的自动标记照片到自驾车，CNN使图像分类领域发生重大突破，它是当今大多数计算机视觉系统的核心。

04

PyTorch 深度学习（GPT 重译）（五）

上一章的结束让我们陷入了困境。虽然我们能够将深度学习项目的机制放置好，但实际上没有任何结果是有用的；网络只是将一切都分类为非结节！更糟糕的是，结果表面看起来很好，因为我们正在查看训练和验证集中被正确分类的整体百分比。由于我们的数据严重倾向于负样本，盲目地将一切都视为负面是我们的模型快速得分的一种简单而快速的方法。太糟糕了，这样做基本上使模型无用！

01

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭