机器学习、深度学习-腾讯云开发者社区

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

机器学习、深度学习

专栏成员

382

文章

450561

阅读量

79

订阅数

透视投影的原理和实现

摘要：透视投影是3D渲染的基本概念，也是3D程序设计的基础。掌握透视投影的原理对于深入理解其他3D渲染管线具有重要作用。本文详细介绍了透视投影的原理和算法实现，包括透视投影的标准模型、一般模型和屏幕坐标变换等，并通过VC实现了一个演示程序。

2019-06-11

4.9K0

A Coarse-to-fine Many-Task Network for joint 2D and 3D vehicle analysis

图像处理 https 网络安全

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/zhangjunhit/article/details/76169499

2019-05-28

4940

相机标定--A Flexible New Technique for Camera Calibration

编程算法 http html 图像处理

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/zhangjunhit/article/details/89087012

2019-05-26

1.3K0

CNN光流计算2

FlowNet 2.0: Evolution of Optical Flow Estimation with Deep Networks CVPR2017 Code: https://github.com/lmb-freiburg/flownet2

2019-05-26

9960

3D人体姿态估计

Coarse-to-Fine Volumetric Prediction for Single-Image 3D Human Pose

2019-05-26

1.9K0

人群密度估计--Structured Inhomogeneous Density Map Learning for Crowd Counting

机器学习神经网络深度学习人工智能图像处理

Structured Inhomogeneous Density Map Learning for Crowd Counting https://arxiv.org/abs/1801.06642

2019-05-26

5390

目标检测中的尺度--An Analysis of Scale Invariance in Object Detection – SNIP

机器学习人脸识别图像处理深度学习

本文提出了一种用于目标检测的多尺度特征融合网络，该网络能够同时学习不同尺度的特征，并且能够在任意图像分辨率上进行预测。该网络采用了一种新颖的采样策略，可以有效地利用不同尺度的特征，并在测试时自动调整特征图大小。实验结果表明，该方法能够有效地提高目标检测的准确率和召回率，同时保持较高的运行效率。

2018-01-03

2K0

快速人群密度估计--Multi-scale Convolutional Neural Networks for Crowd Counting

本文提出了一种用于人群密度估计的 Multi-scale Convolutional Neural Networks (MSCNN) 方法，该方法利用了 multi-scale 卷积神经网络来学习尺度相关的密度图。该方法包括三个模块：feature remapping, multi-scale feature extraction, 和密度图回归。实验结果表明，该方法在两个公共数据集上的表现优于现有的方法。

2018-01-03

1.1K0

人群分析--Beyond Counting: Comparisons of Density Maps for Crowd Analysis Tasks

图像处理编程算法

本文提出了一种基于人群密度图估计的人群分析技术，并将其应用于人群计数、人群检测和人群跟踪等任务中。实验证明，在多种指标上，CNN-pixel都表现出了较好的效果，优于传统的基于图像处理的方法。然而，密集预测的计算量较大，需要更多的计算资源，因此需要继续研究如何提高其效率和实时性。

2018-01-03

7640

级联人脸检测--A Convolutional Neural Network Cascade for Face Detection

人脸识别图像处理

本文提出了一种级联卷积神经网络用于人脸检测的方法，通过使用三个不同尺度的卷积神经网络进行人脸检测，取得了较好的效果。同时，该方法还可以在速度和精度之间取得平衡，具有较好的实用性。

2018-01-03

1.7K0

快速去阴影--Fast Shadow Detection from a Single Image Using a Patched Convolutional Neural Network

编程算法图像处理

本文主要研究快速去阴影问题，采用SVM+CNN策略，利用mean shift算法对图像进行过分割，提取segment的颜色和纹理特征输入SVM得到shadow prior，再使用patched-CNN预测shadow，并对edge pixels进行细化处理。实验结果表明，该方法在去阴影方面具有较高的准确性和实时性。

2018-01-03

1K0

人群分割--Fully Convolutional Neural Networks for Crowd Segmentation

编程算法图像处理

本文提出了一种用于人群分割的全卷积神经网络（FCNN），该网络基于卷积神经网络（CNN）和快速卷积神经网络（FCNN）模型。该网络包含三个卷积层和三个池化层，以及一个全连接层。通过将三个卷积层和三个池化层的输出进行连接，并将所有三个网络的输出进行连接，可以增强网络的表达能力。该网络在多个数据集上进行了测试，并在一个包含视频数据集的人群分割任务上获得了较好的结果。该网络可以用于静态和动态人群的分割，并且具有较好的可扩展性和灵活性。

2018-01-03

1K0

行人属性--HydraPlus-Net: Attentive Deep Features for Pedestrian Analysis

编程算法图像处理

本文提出了一种名为HydraPlus-Net的深度学习模型，用于行人属性分析。该模型结合了多尺度、多方向注意力机制，可以同时关注全局和局部信息，提高行人属性分析的准确率。实验表明，HydraPlus-Net在行人重识别和行人属性分析任务上均取得了显著的效果，相比现有的方法具有明显的优势。

2018-01-03

1.5K0

人群分析综述--Crowd Scene Understanding from Video: A Survey

编程算法图像处理

本文主要综述了人群分析的研究现状，包括关键技术和方法，分析了各种方法的优缺点，并展望了未来的研究方向。

2018-01-03

1.3K0

越线人群计数--Crossing-line Crowd Counting with Two-phase Deep Neural Networks

编程算法图像处理

本文提出了一种基于深度学习的越线人群计数方法，该方法通过分析视频序列中的像素级监督信息，利用卷积神经网络来学习人群密度和速度特征，并生成密度图、速度图，最终通过像素级监督信息计算得到人群计数结果。实验结果表明，该方法在越线人群计数任务上取得了较好的效果，能够准确地对人群进行计数，为视频监控领域提供了有效的技术手段。

2018-01-03

1.2K0

弱监督语义分割--Object Region Mining with Adversarial Erasing

机器学习数据库图像处理

本文提出了一种弱监督语义分割算法，通过使用对抗性擦除和在线禁止分割学习来提高语义分割的准确性。该算法主要包括两个部分：对抗性擦除和在线禁止分割学习。对抗性擦除通过分类网络找出图像中最具特征的区域，然后将这些区域擦除，再重新训练分类网络找出物体的另一个区域。在线禁止分割学习则使用平方损失作为优化目标，将分类置信度用于调整对应类别的分割分数图。

2018-01-03

1.5K0

卫星图像中的车辆分析--A Large Contextual Dataset for Classification, Detection and Counting of Cars

图像处理机器学习

本文针对卫星图像中的车辆分析建立了一个新的数据库，并设计了一个基于CNN的分类、检测和计数系统。该系统利用新的数据库对车辆进行识别，判断图像块中有无车辆、检测车辆并计数。实验结果表明，该系统在卫星图像中的车辆识别、检测和计数方面具有较高的准确性和效率。

2018-01-03

9550

车牌检测识别--Towards End-to-End Car License Plates Detection and Recognition with Deep Neural Networks

编程算法图像处理

本文提出了一种端到端的深度神经网络，用于车牌检测和识别。该网络使用VGG-16卷积层进行特征提取，并使用RPN网络来提取车牌候选区域。在识别阶段，使用BRNNs和CTC损失来对序列特征进行标注。在PKU数据集上的性能评估表明，该方法在车牌检测和识别方面具有优越的性能。

2018-01-03

1.5K0

视频插值--Video Frame Interpolation via Adaptive Separable Convolution

本文将视频插帧问题看作局部分离卷积，采用自适应分离卷积的方法，大大减少了计算量。首先，本文提出了一种用于视频插帧的轻量级神经网络，该网络采用自适应卷积滤波器，具有2n的参数量，比传统方法减少了n^2个参数。其次，本文提出了一种用于视频插帧的优化算法，该算法采用随机梯度下降方法，在接近200个迭代中保持误差最小化。最后，本文对标准测试集进行了广泛的实验，通过比较各种插帧方法，证实了本文方法的有效性。

2018-01-03

2K0

人群密度估计--Generating High-Quality Crowd Density Maps using Contextual Pyramid CNNs

机器学习图像处理

针对人群密度估计问题，本文提出了一种基于多尺度CNN的密度图生成方法，该方法包括三个模块：全局上下文估计模块、局部上下文估计模块和密度图生成模块。全局上下文估计模块采用VGG-16网络对图像进行分类，将图像分为五类；局部上下文估计模块采用多个卷积层和池化层来提取不同尺度的上下文信息；密度图生成模块采用多列卷积层和池化层来生成最终的高维特征图。通过最小化像素级欧氏损失和对抗性损失来优化网络，最终生成高分辨率、高质量的密度图。实验结果表明，该方法在两个公开数据集上均获得了领先的性能，证明了其在高密度估计问题中的有效性和优越性。

2018-01-03

1.5K0

点击加载更多

社区活动

【纪录片】中国数据库前世今生

穿越半个世纪，探寻中国数据库50年的发展历程

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态