首页
学习
活动
专区
工具
TVP
发布

机器学习、深度学习

专栏作者
382
文章
431312
阅读量
79
订阅数
车牌识别--Towards End-to-End License Plate Detection and Recognition
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/zhangjunhit/article/details/82627163
用户1148525
2019-05-28
1.4K0
犯罪分子检测--Eye in the Sky: Real-time DDS for Violent Individuals
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/zhangjunhit/article/details/81481498
用户1148525
2019-05-28
1.1K0
场景解析--Scene Parsing through ADE20K Dataset
Scene Parsing through ADE20K Dataset CVPR2017 https://github.com/CSAILVision/sceneparsing http://sceneparsing.csail.mit.edu/
用户1148525
2019-05-27
1.6K0
深度抠图--Deep Image Matting
CVPR2017 https://arxiv.org/abs/1703.03872
用户1148525
2019-05-26
1.7K0
目标检测 - YOLO9000 : Better, Faster, Stronger
本文主要有两点: 1)改进YOLO,提出了 YOLOv2,速度快,效果好。67 FPS, YOLOv2 gets 76.8 mAP on VOC 2007; 40 FPS, YOLOv2 gets 78.6mAP 2)将检测和分类训练融合到一起,可以检测没有学习到的类别。
用户1148525
2019-05-26
3790
AlexNet- ImageNet Classification with Deep Convolutional Neural Networks
ImageNet Classification with Deep Convolutional Neural Networks
用户1148525
2019-05-26
7120
多人部件解析
Towards Real World Human Parsing: Multiple-Human Parsing in the Wild https://arxiv.org/abs/1705.07206
用户1148525
2019-05-26
5450
人体解析--Look into Person: Self-supervised Structure-sensitive Learning
Look into Person: Self-supervised Structure-sensitive Learning and A New Benchmark for Human Parsing CVPR2017
用户1148525
2019-05-26
1K0
场景解析--Pyramid Scene Parsing Network
Pyramid Scene Parsing Network CVPR2017 语义分割 https://github.com/hszhao/PSPNet
用户1148525
2019-05-26
9050
CNN光流计算--FlowNet: Learning Optical Flow with Convolutional Networks
FlowNet: Learning Optical Flow with Convolutional Networks ICCV2015 Code: https://lmb.informatik.uni-freiburg.de/Publications/2015/DFIB15/
用户1148525
2019-05-26
1.3K0
语义分割
Learning Object Interactions and Descriptions for Semantic Image Segmentation CVPR2017
用户1148525
2019-05-26
4840
人群密度估计--Leveraging Unlabeled Data for Crowd Counting by Learning to Rank
Leveraging Unlabeled Data for Crowd Counting by Learning to Rank CVPR2018 https://github.com/xialeiliu/CrowdCountingCVPR18
用户1148525
2019-05-26
8890
人群行为分类数据库--Crowd-11: A Dataset for Fine Grained Crowd Behaviour Analysis
本文主要介绍了一种人群行为分类数据库 Crowd-11,它包含 6000 多个视频序列,每个序列平均包含 100 帧。该数据库旨在对细粒度人群行为进行分析。研究人员开发了三种学习方法:1)Group Profiling Descriptors,通过分析人群组成和运动模式进行人群行为分类;2)Two-stream architecture,通过结合运动和外观信息进行人群行为分类;3)C3D,利用 3D 卷积神经网络进行人群行为分类。这些方法在 Crowd-11 数据库上进行测试,并在多种指标上取得了良好的性能。
用户1148525
2018-01-03
8350
人群行为分类数据库--Novel Dataset for Fine-grained Abnormal Behavior Understanding in Crowd
本文针对人群行为分类建立了一个数据库,包含5类异常行为:Panic、Fight、Congestion、Obstacle和Neutral。该数据库包含31个视频序列,共计44,000个正常和异常视频片段,视频帧率为30帧/秒,使用固定摄像头的视频拍摄高度,俯瞰人群通道,视频分辨率为554x235。数据库中人群密度变化大,从稀疏到非常拥挤。另外,本文还测试了两类算法:Dense trajectories适用于动作识别,Histogram of Oriented Tracklet(HOT)适用于异常检测。
用户1148525
2018-01-03
1.3K0
弱监督语义分割--Object Region Mining with Adversarial Erasing
本文提出了一种弱监督语义分割算法,通过使用对抗性擦除和在线禁止分割学习来提高语义分割的准确性。该算法主要包括两个部分:对抗性擦除和在线禁止分割学习。对抗性擦除通过分类网络找出图像中最具特征的区域,然后将这些区域擦除,再重新训练分类网络找出物体的另一个区域。在线禁止分割学习则使用平方损失作为优化目标,将分类置信度用于调整对应类别的分割分数图。
用户1148525
2018-01-03
1.4K0
视频中的运动特征--Learning Motion Patterns in Videos
本文提出了一种名为MP-Net的深度学习网络,用于解决视频中的运动目标分割问题。MP-Net具有一个大的感受野,能够捕捉到不同的运动模式,并且能够将不同运动模式的物体进行区分。在合成数据集上进行训练,并利用全连接条件随机场对分割结果进行后续处理,最终在DAVIS数据集上进行了比拼测试,取得了较好的效果。
用户1148525
2018-01-03
9840
CNN阴影去除--DeshadowNet: A Multi-context Embedding Deep Network for Shadow Removal
本文提出了一种用于阴影去除的多上下文嵌入深度网络DeshadowNet,可以全自动地端到端地实现阴影去除。该网络由三个子网络组成:全局定位网络(G-Net)、外观建模网络(A-Net)和语义建模网络(S-Net)。G-Net提取阴影特征表示以描述场景中的全局结构和高级语义上下文;A-Net获得G-Net的浅层外观信息;S-Net提取G-Net的深层语义信息。实验结果表明,该网络在阴影去除方面取得了显著的效果,可以有效地利用多上下文信息来提高图像的质量。
用户1148525
2018-01-03
1.5K0
没有更多了
社区活动
RAG七天入门训练营
鹅厂大牛手把手带你上手实战,赢鹅厂证书、公仔好礼!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档