开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

对象检测API -评估在训练前结束(给出部分步长精度)

对象检测API是一种基于人工智能技术的图像处理服务，它可以自动识别和定位图像中的各种对象。对象检测是计算机视觉领域的重要任务，它在许多应用场景中都有广泛的应用，如智能监控、自动驾驶、图像搜索等。

对象检测API的主要步骤包括图像预处理、特征提取、目标定位和分类。在训练前结束时，可以通过调整步长来控制检测的精度。步长越小，检测的精度越高，但计算量也会增加。

腾讯云提供了一系列与对象检测相关的产品和服务，其中包括：

人工智能图像分析（AI Image Analysis）：提供了丰富的图像分析能力，包括对象检测、场景识别、图像标签等功能。详情请参考：人工智能图像分析
视觉智能（Intelligent Vision）：提供了一站式的视觉智能解决方案，包括图像识别、人脸识别、OCR文字识别等功能。详情请参考：视觉智能
云服务器（CVM）：提供了高性能、可扩展的云服务器实例，可以用于搭建对象检测的训练和推理环境。详情请参考：云服务器
云存储（COS）：提供了安全可靠的对象存储服务，可以用于存储和管理对象检测的训练数据和模型。详情请参考：云存储

通过使用腾讯云的对象检测API和相关产品，开发者可以快速构建和部署对象检测应用，提高图像处理的效率和准确性。

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

基于系统日志分析进行异常检测

日志解析：https://github.com/logpai/logparser 异常检测：https://github.com/logpai/loglizer 预备知识：需要对逻辑回归、决策树、SVM、PCA、聚类等有一些了解论文原文： https://github.com/AmateurEvents/article/blob/master/System-Log-Analysis-for-Anomaly-Detection.pdf

02

快到没朋友的YOLO v3有了PaddlePaddle实现

YOLO作为目标检测领域的创新技术，一经推出就受到开发者的广泛关注。值得一提的是，基于百度自研的开源深度学习平台PaddlePaddle的YOLO v3实现，参考了论文【Bag of Tricks for Image Classification with Convolutional NeuralNetworks】，增加了mixup，label_smooth等处理，精度(mAP(0.5：0.95))相比于原作者的实现提高了4.7个绝对百分点，在此基础上加入synchronize batchnormalization, 最终精度相比原作者提高5.9个绝对百分点。我们将在下文中为大家详解实现的具体过程。

04

快到没朋友的YOLO v3有了PaddlePaddle 预训练模型

YOLO作为目标检测领域的创新技术，一经推出就受到开发者的广泛关注。值得一提的是，基于百度自研的开源深度学习平台PaddlePaddle的YOLO v3实现，参考了论文【Bag of Tricks for Image Classification with Convolutional NeuralNetworks】，增加了mixup，label_smooth等处理，精度(mAP(0.5：0.95))相比于原作者的实现提高了4.7个绝对百分点，在此基础上加入synchronize batchnormalization, 最终精度相比原作者提高5.9个绝对百分点。我们将在下文中为大家详解实现的具体过程。

03

用 Java 实现梯度下降

梯度下降是一种优化算法，用于查找给定函数的局部最小值。它被广泛用于高级机器学习算法中，最小化损失函数。

01

Deep Residual Learning for Image Recognition

更深层次的神经网络更难训练。我们提出了一个残差学习框架来简化网络的训练，这些网络比以前使用的网络要深入得多。我们显式地将层重新表示为参考层输入的学习剩余函数，而不是学习未引用的函数。我们提供了全面的经验证据表明，这些剩余网络更容易优化，并可以从大幅增加的深度获得精度。在ImageNet数据集上，我们评估了高达152层的剩余网—比VGG网[41]深8×，但仍然具有较低的复杂性。这些残差网的集合在ImageNet测试集上的误差达到3.57%，该结果在ILSVRC 2015年分类任务中获得第一名。我们还对CIFAR-10进行了100层和1000层的分析。在许多视觉识别任务中，表征的深度是至关重要的。仅仅由于我们的深度表示，我们获得了28%的相对改进的COCO对象检测数据集。深度残差网是我们参加ILSVRC & COCO 2015竞赛s1的基础，并在ImageNet检测、ImageNet定位、COCO检测、COCO分割等方面获得第一名。

01

学界 | NIPS2018最佳论文解读：Neural Ordinary Differential Equations

AI 科技评论按：不久前，NeurIPS 2018 在加拿大蒙特利尔召开，在这次著名会议上获得最佳论文奖之一的论文是《Neural Ordinary Differential Equations》，论文地址：https://arxiv.org/abs/1806.07366。Branislav Holländer 在 towards data science 上对这篇论文进行了解读， AI 科技评论编译整理如下：

02

TensorFlow 强化学习：11~15

到目前为止，我们已经看到了强化学习在 AlphaGo，自动驾驶，项目组合管理等方面的进步。研究表明，强化学习可以提供认知特征，例如动物行为。

02

目标检测的中的指标的含义及其实现

IoU测量两个区域之间的重叠程度，在目标检测中衡量预测结果和标签(真实的目标边界)之间的重叠程度。

02

Keras中创建LSTM模型的步骤[通俗易懂]

本文是对The 5 Step Life-Cycle for Long Short-Term Memory Models in Keras的复现与解读，新手博主，边学边记，以便后续温习，或者对他人有所帮助

01

自定义对象检测问题：使用TensorFlow追踪星球大战中的千年隼号宇宙飞船

大多数的大型科技公司(如IBM,谷歌,微软,亚马逊)都有易于使用的视觉识别API。一些规模较小的公司也提供类似的产品,如Clarifai。但没有公司能够提供对象检测。千年隼号宇宙飞船的检测以下图

05

机器学习中时间序列预测的一些常见陷阱

时间序列预测是机器学习的一个重要领域。说它重要是因为有很多预测问题都涉及时间成分。然而，虽然时间成分补充了额外的信息，但与其他预测任务相比，时间序列问题更难以处理。

04

Feature Pyramid Networks for Object Detection

特征金字塔是不同尺度目标识别系统的基本组成部分。但最近的深度学习对象检测器已经避免了金字塔表示，部分原因是它们需要大量的计算和内存。本文利用深卷积网络固有的多尺度金字塔结构构造了具有边际额外成本的特征金字塔。提出了一种具有横向连接的自顶向下体系结构，用于在所有尺度上构建高级语义特征图。该体系结构称为特征金字塔网络(FPN)，作为一种通用的特征提取器，它在几个应用程序中得到了显著的改进。在一个基本的Fasater R-CNN系统中使用FPN，我们的方法在COCO检测基准上实现了最先进的单模型结果，没有任何附加条件，超过了所有现有的单模型条目，包括来自COCO 2016挑战赛冠军的条目。此外，我们的方法可以在GPU上以每秒6帧的速度运行，因此是一种实用而准确的多尺度目标检测解决方案。

02

R-FCN: Object Detection via Region-based Fully Convolutional Networks

我们提出了基于区域的全卷积网络，用于精确和有效的目标检测。与之前的基于区域的检测器(如Fast/Faster R-CNN)相比，我们的基于区域的检测器是全卷积的，几乎所有计算都在整个图像上共享。为了实现这一目标，我们提出了位置敏感的分数映射来解决图像分类中的平移不变性与目标检测中的平移方差之间的矛盾。因此，我们的方法可以很自然地采用完全卷积的图像分类器骨干网络，如最新的残差网络(ResNets)，用于目标检测。我们使用101层ResNet在PASCAL VOC数据集上显示了很有竞争的结果(例如，在2007年的集上显示了83.6%的mAP)。同时，我们的结果在测试时的速度为每张图像170ms，比Faster R-CNN对应图像快2.5-20倍。

02

当Swin Transformer遇上DCN，清华可变形注意力Transformer模型优于多数ViT

Transformer 近来在各种视觉任务上表现出卓越的性能，感受野赋予 Transformer 比 CNN 更强的表征能力。然而，简单地扩大感受野会引起一些问题。一方面，使用密集注意力（例如 ViT）会导致过多的内存和计算成本，并且特征可能会受到超出兴趣区域的无关部分的影响；另一方面，PVT 或 Swin Transformer 中采用的稀疏注意力与数据无关，可能会限制对远程（long range）关系建模的能力。

02

如何在图数据库中训练图卷积网络模型

典型的前馈神经网络将每个数据点的特征作为输入并输出预测。利用训练数据集中每个数据点的特征和标签来训练神经网络。这种框架已被证明在多种应用中非常有效，例如面部识别，手写识别，对象检测，在这些应用中数据点之间不存在明确的关系。但是，在某些使用情况下，当v（i）与v（i）之间的关系不仅仅可以由数据点v（i）的特征确定，还可以由其他数据点v（j）的特征确定。j）给出。例如，期刊论文的主题（例如计算机科学，物理学或生物学）可以根据论文中出现的单词的频率来推断。另一方面，在预测论文主题时，论文中的参考文献也可以提供参考。在此示例中，我们不仅知道每个单独数据点的特征（词频），而且还知道数据点之间的关系（引文关系）。那么，如何将它们结合起来以提高预测的准确性呢？

01

Training Region-based Object Detectors with Online Hard Example Mining

在基于区域的卷积神经网络的浪潮中，目标检测领域已经取得了显著的进展，但是它们的训练过程仍然包含许多尝试和超参数，这些参数的调优代价很高。我们提出了一种简单而有效的在线难样本挖掘(OHEM)算法，用于训练基于区域的ConvNet检测器。我们的动机和以往一样——检测数据集包含大量简单示例和少量困难示例。自动选择这些困难的例子可以使训练更加有效。OHEM是一个简单直观的算法，它消除了几种常见的启发式和超参数。但更重要的是，它在基准测试(如PASCAL VOC2007和2012)上产生了一致且显著的检测性能提升。在MS COCO数据集上的结果表明，当数据集变得更大、更困难时，它的效率会提高。此外，结合该领域的互补进展，OHEM在PASCAL VOC 2007和2012年的mAP上分别取得了78.9%和76.3%的最新成果。

02

使用Facebook的FastText简化文本分类

本博客提供了详细的分步教程，以便使用FastText进行文本分类。为此，我们选择在Amazon.com上对客户评论进行情绪分析，并详细说明如何抓取特定产品的评论以便对他们进行情绪分析。

02

使用Facebook的FastText简化文本分类

本博客提供了详细的分步教程，以便使用FastText进行文本分类。为此，我们选择在Amazon.com上对客户评论进行情绪分析，并详细说明如何抓取特定产品的评论以便对他们进行情绪分析。

03

Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition

现有的深度卷积神经网络(CNNs)需要一个固定大小的输入图像(如224×224)。这一要求是“人为的”，可能会降低对任意大小/尺度的图像或子图像的识别精度。在这项工作中，我们为网络配备了另一种池化策略，“空间金字塔池”，以消除上述要求。这种新的网络结构称为SPP-net，可以生成固定长度的表示，而不受图像大小/比例的影响。金字塔池对物体变形也有很强的鲁棒性。基于这些优点，SPP-net一般应改进所有基于cnn的图像分类方法。在ImageNet 2012数据集中，我们证明了SPP-net提高了各种CNN架构的准确性，尽管它们的设计不同。在Pascal VOC 2007和Caltech101数据集中，SPP-net实现了最先进的分类结果使用单一的全图像表示和没有微调。在目标检测中，spp网络的能力也很重要。利用SPP-net算法，只对整个图像进行一次特征映射计算，然后将特征集合到任意区域(子图像)，生成固定长度的表示形式，用于训练检测器。该方法避免了卷积特征的重复计算。在处理测试图像时，我们的方法比R-CNN方法快24-102×，而在Pascal VOC 2007上达到了更好或相近的精度。在2014年的ImageNet Large Scale Visual Recognition Challenge (ILSVRC)中，我们的方法在所有38个团队中目标检测排名第二，图像分类排名第三。本文还介绍了本次比赛的改进情况。

02

强化学习的自然环境基准

虽然当前的基准强化学习（RL）任务对于推动这一领域的进展大有裨益，但在许多方面还不能很好地替代真实数据的学习。在低复杂度的仿真环境中测试日益复杂的RL算法，获得的RL策略难以推广。

03

TOOP联合上交大推出QoT组件，打造智慧光网络

数据中心光网络智能管控近年来，全球移动用户数量迅速扩增，数据中心业务快速增长，这些趋势对目前的数据中心互联光网络提出了更大需求。在降低部署与运营成本的同时如何保证系统稳定运行是一个重要挑战。一方面，随着相干器件的发展，器件具备多种调制模式选择，链路与信号的配置逐渐多样化，配合OPC-4的Flex-grid应用，这让弹性光网络（elastic optical networks， EON）成为了可能，链路性能优则采用更高的单波速率，链路性能差则降低单波速率换取更高的传送性能。这就像新能源汽车的续航里程一样

02

独家 | 基于癌症生存数据建立神经网络（附链接）

一种方法是先对数据集进行探查，然后思考什么模型适用于这个数据集，先尝试一些简单的模型，最后再开发并调优一个稳健的模型。

02

YOLO-TLA也来了 | 重新设计C3模块为Backbone引入轻量化注意力，诞生高效的小目标检测YOLO模型

近年来深度学习的快速发展导致了计算机视觉各个方面的重要突破，尤其是在目标检测领域。这个计算机视觉的关键方面旨在识别和分类图像中的目标（例如，行人、动物、车辆），这对于目标追踪和目标分割等任务是一个基础性的要素。其在工业应用中非常广泛，范围从缺陷检测到自动驾驶。

01

【深度学习】图像语义分割

语义分割(Semantic Segmentation)是图像处理和机器视觉一个重要分支，其目标是精确理解图像场景与内容。语义分割是在像素级别上的分类，属于同一类的像素都要被归为一类，因此语义分割是从像素级别来理解图像的。如下如所示的照片，属于人的像素部分划分成一类，属于摩托车的像素划分成一类，背景像素划分为一类。

04

揭开神经网络的神秘面纱

未经训练的神经网络模型很像新生儿: 他们被创造出来的时候对世界一无所知(如果考虑到认识论理论的话)，而且只有通过接触这个世界，也就是后天的知识，才会慢慢提高它们的认知程度。算法通过数据体验世界——我们试图通过在相关数据集上训练神经网络，来提高其认知程度。衡量进度的方法是通过监测网络产生的误差。

00

DiffusionDet：用于对象检测的扩散模型

Shoufa Chen1, Peize Sun1, Yibing Song2, Ping Luo1 1The University of Hong Kong 2Tencent AI Lab {sfchen, pzsun, pluo}@cs.hku.hk yibingsong.cv@gmail.com

02

RepVGG-GELAN | 融合 VGG、ShuffleNet 与 YOLO 图像检测的准确性及效率再上一层！

鉴于高发病率和死亡率，脑肿瘤是全球健康关注的重点问题。通过利用深度学习算法等最先进技术，自动化检测技术可以有效解决脑肿瘤识别的挑战。将自动化检测融入医疗流程，有望通过革新脑肿瘤的管理方式显著提高患者疗效和医疗服务，尤其是随着技术的发展。最先进的目标检测方法YOLO在估算每个网格单元的类别概率和边界框时，将输入图像划分为网格。

01

如何用神经网络“寻找威利”

本文介绍了一种使用TensorFlow物体检测API寻找特定人物位置的方法。首先，作者通过创建一个包含目标人物位置信息的二维图像，然后使用TensorFlow物体检测API训练一个CNN模型，将图像中的目标人物识别出来。该模型可以用于在其它图像中定位和识别特定人物，具有较好的精度和实时性。

06

Kaggle大赛：债务违约预测冠军作品解析

翻译 | MOLLY 选文&校对整理 | 寒小阳 ◆ ◆ ◆ 债务违约预测债务违约预测是Kaggle中的一个比赛，本文将介绍取得第一名成绩的方法，本次比赛的目标包括两个方面。其一是建立一个模型，债务人可以通过它来更好地进行财务方面的决策。其二是债权人可以预测这个债务人何时会陷入到财务方面的困境。最终目的是，通过预测未来两年内债务违约的概率，来改进现有的信用评分制度。这是一个极度复杂和困难的Kaggle挑战，因为银行和各种借贷机构一直都在不断地寻找和优化信用评分的算法。这个模型是银行用来判定是否准许某

03

深度、卷积、和递归三种模型中，哪个将是人类行为识别方面的佼佼者？

导读：2016国际人工智能联合会议（IJCAI2016）于7月9日至7月15日举行，今年会议聚焦于人类意识的人工智能。本文是IJCAI2016接收论文之一，除了论文详解之外，我们另外邀请到哈尔滨工业大学李衍杰副教授进行点评。深度、卷积、递归模型对人类行为进行识别（可穿戴设备数据）摘要普适计算领域中人类活动识别已经开始使用深度学习来取代以前的依靠手工提取分类的分析技术。但是由于这些深度技术都是基于不同的应用层面，从识别手势到区分跑步、爬楼梯等一系列活动，所以很难对这些问题提出一个普遍适用的方案。在本文中

09

AAAI 2021 | 时序动作提名生成网络

本文主要介绍商汤科技城市计算研发组发表在AAAI2021上工作，提出了基于互补边界回归和尺度平衡交互建模的时序动作提名生成网络（BSN++），针对现有方法存在大量边界噪声、缺乏提名之间的关系建模以及动作持续长度不平衡等问题进行了改进，能够高效地给大量密集分布的候选提名生成高精度的边界预测和可靠的置信度分数。实验结果表明，BSN++在两个著名的公开数据集上均有显著的性能和效率提升。基于该方法，我们在CVPR19 - ActivityNet Challenge的时序动作检测任务榜单上排名第一。

03

学界 | CMU提出对抗生成网络：可实现对人脸识别模型的神经网络攻击

选自arXiv 作者：Mahmood Sharif等机器之心编译参与：Panda 生成对抗网络（GAN）已经是人工智能领域内的一个常用词了，但你听说过对抗生成网络（AGN）吗？近日，卡内基梅隆大学和北卡罗来纳大学教堂山分校的研究者在 arXiv 上发布的一篇论文提出了这种网络，可实现对当前最佳的人脸识别模型的神经网络攻击。深度神经网络（DNN）已经在人脸验证（即确定两张人脸图像是否属于同一个人）方面超越了人类的水平。不幸的是，研究还表明使用对抗样本（adversarial example）就可以轻易

07

自动驾驶中基于光流的运动物体检测

文章：Optical Flow Based Motion Detection for Autonomous Driving

03

Nature | 基于深度神经网络和改进的片段测序方法从头预测蛋白质结构

Nature子刊 Machine Intelligence发布了八月份最新接收论文，共4 篇。一篇是清华生命学院龚海鹏和澳大利亚格里菲斯大学周耀旗等人用神经网络进行蛋白质结构预测方面的工作。

07

Nat. Mach. Intell. | 基于深度神经网络和改进的片段测序方法从头预测蛋白质结构

Nature子刊 Machine Intelligence发布了八月份最新接收论文，共4 篇。一篇是清华生命学院龚海鹏和澳大利亚格里菲斯大学周耀旗等人用神经网络进行蛋白质结构预测方面的工作。

04

ThinkNet：迄今为止最简单的语言建模网络

这篇短论文介绍了一种名为Think Again Network（ThinkNet）的抽象概念，它可以用于任何状态依赖的函数（如循环神经网络）。本文中展示了该网络在语言建模任务中的简单应用，它在Penn Treebank上达到了当前最低的困惑度。

03

近几年，关于基于Imagenet数据集图像分类的模型总结

在过去的几年里，许多深度学习模型涌现出来，例如层的类型、超参数等。在本系列中，我将回顾几个最显着的 deeplearn 图像分类的模型。

03

CVPR大规模行为识别竞赛连续两年夺冠，上交大详细技术分享

【新智元导读】近日，视频行为理解领域的ImageNet竞赛——ActivityNet Challenge 2018在CVPR 会议上落下了帷幕。来自上海交通大学计算机视觉实验室的团队（自动化系研究生林天威、苏海昇，导师赵旭副教授），获得了未修剪视频中的时序动作定位任务的冠军，以及时序动作提名任务的亚军。本文将分享该团队在两项竞赛任务中所采用的算法思路和方案。

00

TOIS'21 | 第一个基于多关系图的任务驱动GNN框架

北京航空航天大学、美国伊利诺伊大学芝加哥分校和英国利兹大学联合提出了一个全新的强化、递归且可扩展的由邻域选择引导的多关系图神经网络架构 RioGNN。与最先进的 GNN 以及专用异构模型相比，RioGNN 的各种下游任务显着提高了 0.70%–32.78%。

02

浣熊检测器实例, 如何用TensorFlow的Object Detector API来训练你的物体检测器

这篇文章是“用Tensorflow和OpenCV构建实时对象识别应用”的后续文章。具体来说，我在自己收集和标记的数据集上训练了我的浣熊检测器。完整的数据集可以在我的Github repo上看到。看一

07

目标检测综述

这篇综述是我统计信号处理的作业，在这里分享一下，将介绍计算机视觉中的目标检测任务，论述自深度学习以来目标检测的常见方法，着重讲yolo算法，并且将yolo算法与其他的one-stage以及two-stage方法进行比较。

03

【一统江湖的大前端（9）】TensorFlow.js 开箱即用的深度学习工具

TensorFlow是Google推出的开源机器学习框架，并针对浏览器、移动端、IOT设备及大型生产环境均提供了相应的扩展解决方案，TensorFlow.js就是JavaScript语言版本的扩展，在它的支持下，前端开发者就可以直接在浏览器环境中来实现深度学习的功能，尝试过配置环境的读者都知道这意味着什么。浏览器环境在构建交互型应用方面有着天然优势，而端侧机器学习不仅可以分担部分云端的计算压力，也具有更好的隐私性，同时还可以借助Node.js在服务端继续使用JavaScript进行开发，这对于前端开发者而言非常友好。除了提供统一风格的术语和API，TensorFlow的不同扩展版本之间还可以通过迁移学习来实现模型的复用（许多知名的深度学习模型都可以找到python版本的源代码），或者在预训练模型的基础上来定制自己的深度神经网络，为了能够让开发者尽快熟悉相关知识，TensorFlow官方网站还提供了一系列有关JavaScript版本的教程、使用指南以及开箱即用的预训练模型，它们都可以帮助你更好地了解深度学习的相关知识。对深度学习感兴趣的读者推荐阅读美国量子物理学家Michael Nielsen编写的《神经网络与深度学习》（英文原版名为《Neural Networks and Deep Learning》），它对于深度学习基本过程和原理的讲解非常清晰。

02

Integrated Recognition, Localization and Detection using Convolutional Networks

ICLR2014 OverFeat: Integrated Recognition, Localization and Detection using Convolutional Networks ILSVRC2013 winner

02

【AI有识境】如何掌握好图像分割算法？值得你看的技术综述

进入到有识境界，可以大胆地说自己是一个非常合格的深度学习算法工程师了，能够敏锐地把握自己研究的领域，跟踪前沿和能落地的技术，对自己暂时不熟悉的领域也能快速地触类旁通。

02

学生课堂行为识别教学质量评估算法

学生课堂行为识别教学质量评估算法利用教室安装的摄像头，学生课堂行为识别教学质量评估算法对学生的表情状态、课堂表现和互动行为进行全面监测。对学生的参与度、专注度、互动质量等进行评估，为教师提供有关教学效果的实时反馈。可以为教师提供个性化的教学建议和资源，使教学更加针对性和有效性。学生课堂行为识别教学质量评估算法使用到的YOLO框架模型，其全称是You Only Look Once: Unified, Real-Time Object Detection，其实个人觉得这个题目取得非常好，基本上把Yolo算法的特点概括全了：You Only Look Once说的是只需要一次CNN运算，Unified指的是这是一个统一的框架，提供end-to-end的预测，而Real-Time体现是Yolo算法速度快。这里我们谈的是Yolo-v1版本算法，其性能是差于后来的SSD算法的，但是Yolo后来也继续进行改进，产生了Yolo9000算法。本文主要讲述Yolo-v1算法的原理，特别是算法的训练与预测中详细细节，最后将给出如何使用TensorFlow实现Yolo算法。

02

结合语义和多层特征融合的行人检测

行人检测是目标检测领域研究最广泛的任务之一，也一直是计算机视觉任务中的热点和难点。行人检测任务是给出图像或视频中所有行人的位置和大小，一般用矩形框标注。行人检测技术可以与目标跟踪、行人重识别等技术结合，应用于汽车无人驾驶系统、智能视频监控、人体行为分析等领域。在实际场景中, 由于行人与物体、行人间互相遮挡以及交通标志、橱窗中的模特等相似信息的干扰，行人检测任务仍然存在很大的挑战。

02

Inception-V3论文翻译——中文版

本文介绍了深度学习在计算机视觉领域中的发展及挑战，并总结了一些重要的技术、算法和论文。

01

训练目标检测模型只需要这 6 行代码

原标题 | Train Object Detection AI with 6 lines of code

06

X射线图像中的目标检测

每天有数百万人乘坐地铁、民航飞机等公共交通工具，因此行李的安全检测将保护公共场所免受恐怖主义等影响，在安全防范中扮演着重要角色。但随着城市人口的增长，使用公共交通工具的人数逐渐增多，在获得便利的同时带来很大的不安全性，因此设计一种可以帮助加快安全检查过程并提高其效率的系统非常重要。卷积神经网络等深度学习算法不断发展，也在各种不同领域（例如机器翻译和图像处理）发挥了很大作用，而目标检测作为一项基本的计算机视觉问题，能为图像和视频理解提供有价值的信息，并与图像分类、机器人技术、人脸识别和自动驾驶等相关。在本项目中，我们将一起探索几个基于深度学习的目标检测模型，以对X射线图像中的违禁物体进行定位和分类为基础，并比较这几个模型在不同指标上的表现。

02

类GPT模型训练提速26.5%，清华朱军等人用INT4算法加速神经网络训练

神经网络训练需要一定计算量，使用低精度算法（全量化训练或 FQT 训练）有望提升计算和内存的效率。FQT 在原始的全精度计算图中增加了量化器和去量化器，并将昂贵的浮点运算替换为廉价的低精度浮点运算。

02

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭