深度识别 - 腾讯云开发者社区 - 腾讯云

开发者社区

文档建议反馈控制台

文章/答案/技术大牛

发布

【深度学习】OCR文本识别

---- 以美团的OCR识别为例基于深度学习的OCR 文字是不可或缺的视觉信息来源。相对于图像/视频中的其他内容，文字往往包含更强的语义信息，因此对图像中的文字提取和识别具有重大意义。...传统单字识别引擎→基于深度学习的单字识别引擎由于单字识别引擎的训练是一个典型的图像分类问题，而卷积神经网络在描述图像的高层语义方面优势明显，所以主流方法是基于卷积神经网络的图像分类模型。...动态合并模块将相邻的笔划根据识别结果组合成可能的字符区域，最优组合方式即对应最佳切分路径和识别结果。直观来看，寻找最优组合方式可转换为路径搜索问题，对应有深度优先和广度优先两种搜索策略。...基于现有技术和美团业务涉及的OCR场景，我们在文字检测和文字行识别采用如图所示的深度学习框架。...基于上述试验，与传统OCR相比，我们在多种场景的文字识别上都有较大幅度的性能提升，如图19所示：与传统OCR相比，基于深度学习的OCR在识别率方面有了大幅上升。

9.5K2 0

ZLG深度解析——语音识别技术

近年来，语音识别技术的不断成熟，已广泛应用于我们的生活当中。语音识别技术是如何让机器“听懂”人类语言？本文将为大家从语音前端处理、基于统计学语音识别和基于深度学习语音识别等方面阐述语音识别的原理。...混响消除方法主要包括：基于逆滤波方法、基于波束形成方法和基于深度学习方法等。...此外，基于大数据和深度学习的端到端（End-to-End）方法也在不断发展，它直接计算，即将声学模型和语言模型作为整体处理。本文主要对前者进行介绍。...其中，初始状态概率和状态转移概率可用通过常规统计的方法计算得出，发射概率 )可以通过混合高斯模型GMM或深度神经网络DNN求解。...语音识别的声学模型和语言模型是我司训练的用于测试智能家居控制的相关模型demo，在支持65个常用命令词的离线识别测试中（数量越大识别所需时间越长），使用读取本地音频文件的方式进行语音识别“打开空调”所需时间

2.9K2 0

您找到你想要的搜索结果了吗？

是的

没有找到

识别自动驾驶的深度

但是，对于日常驾驶员而言，LiDAR传感器是负担不起的，那么还能如何测量深度？将描述的最新方法是无监督的深度学习方法，该方法使用一帧到下一帧的像素差异或差异来测量深度。...[1]的主要贡献是：一种自动遮罩技术，可消除对不重要像素的聚焦用深度图修改光度重建误差多尺度深度估计建筑本文的方法使用深度网络和姿势网络。...深度网络是经典的U-Net [2]编码器-解码器体系结构。编码器是经过预训练的ResNet模型。深度解码器类似于先前的工作，在该工作中，它将S型输出转换为深度值。 ?...图片来自[5] 学习对象量表虽然Monodepth2通过其自动遮罩技术解决了静态物体或以与照相机相同速度移动的物体的问题，但这些作者还是建议对模型进行实际训练，以识别物体的比例，从而改善物体运动的建模...损失是图像中对象的输出深度图与通过使用相机的焦距，基于对象类别的先验高度和图像中分割后的对象的实际高度计算出的近似深度图之间的差，两者均按目标图片的平均深度进行缩放： ?

1.4K1 0

深度学习实战-CNN猫狗识别

深度学习实战：基于卷积神经网络的猫狗识别本文记录了第一个基于卷积神经网络在图像识别领域的应用：猫狗图像识别。...主要内容包含：数据处理神经网络模型搭建数据增强实现本文中使用的深度学习框架是Keras；图像数据来自kaggle官网：https://www.kaggle.com/c/dogs-vs-cats...这样做的好处：增大网络容量减少特征图的尺寸需要注意的是：猫狗分类是二分类问题，所以网络的最后一层是使用sigmoid激活的单一单元（大小为1的Dense层）在网络中特征图的深度在逐渐增大（从32...到128），但是特征图的尺寸在逐渐减小（从150-150到7-7）深度增加：原始图像更复杂，需要更多的过滤器尺寸减小：更多的卷积和池化层对图像在不断地压缩和抽象网络搭建 In [15]: import

1.4K1 0

【深度学习】人脸检测与人脸识别

人脸图像处理包括人脸检测、人脸识别、人脸检索等。...人脸检测是在输入图像中检测人脸的位置、大小；人脸识别是对人脸图像身份进行确认，人脸识别通常会先对人脸进行检测定位，再进行识别；人脸检索是根据输入的人脸图像，从图像库或视频库中检索包含该人脸的其它图像或视频...传统人脸检测、识别在特征提取、精确度、可扩展性方面均有诸多不足，进入深度学习时代后，逐渐被深度学习技术所取代。二、人脸数据集介绍 1....Multi-task Cascaded Convolutional Networks（基于多任务级联卷积网络的联合人脸检测与对准，MTCNN），是一个优秀的人脸检测模型，该模型通过三个阶段精心设计的深度卷积网络...DeepFace（2014） 1）概述 DeepFace是Facebook研究人员推出的人脸验证模型，是深度学习技术应用于人脸识别的先驱。模型深度9层，超过1.2亿个参数。

14.3K3 0

基于深度学习的视频内容识别

今天给您讲讲视频大数据和视频内容的识别（部分内容来自复旦大学-计算机科学技术学院薛向阳、姜育刚，谢谢参考阅读）。视频大数据 ? 作为目前最火热的词汇之一，大数据在各个领域都已有了较为成熟的应用。...可以预见在未来的“智慧城市”建设中，视频的数据量会爆炸性增长，对海量视频数据处理系统的要求会越来越高，对视频数据挖掘的能力要求越来越强，视频大数据平台将引入越来越多的AI机器学习，深度学习、智能图算法等尖端技术来提高整个系统的智能化水平...大规模动作识别比赛的数据 THUMOSChallenge 101类别；分别与ICCV2013、ECCV2014、CVPR2015合办 ?...深度视频学习 Video Classification with Regularized DNN ? Z. Wu, Y.-G.

3.7K8 0

深度学习之人脸识别模型--FaceNet

：https://pan.baidu.com/s/1aiSq7wGpdHIe6MUKPnXgrA 密码：4dcn 20170512-110547（MS-Celeb-1M数据集训练的模型文件，微软人脸识别数据库...mtcnn进行人脸检测并对齐与裁剪 ② 对裁剪的人脸使用facenet进行embedding ③ 对embedding的特征向量使用欧式距离进行聚类 2）、基于mtcnn与facenet的人脸识别...contributed/predict.py 主要功能： ① 使用mtcnn进行人脸检测并对齐与裁剪 ② 对裁剪的人脸使用facenet进行embedding ③ 执行predict.py进行人脸识别

6.3K2 1

【深度学习】光学字符识别（OCR）

，当成不能识别的文字误识率：不应该作为文字的作为文字来识别识别速度：一般可接受范围在50~500ms 稳定性：识别结果稳定性 6）应用文档/书籍扫描、车牌识别、证件识别、卡识别、票据识别教育场景文字识别...4）序列标注一个深度双向循环神经网络是建立在卷积层的顶部，作为循环层。...（b）我们论文中使用的深度双向LSTM结构。合并前向（从左到右）和后向（从右到左）LSTM的结果到双向LSTM中。在深度双向LSTM中堆叠多个双向LSTM结果。...网络详细结构 7）结论该模型在4个公共测试数据集上取得了较好的成绩，跟其它基于深度学习模型相比，具有明显提升。...每个音符不仅自身被识别，而且被附近的音符识别。因此，通过将一些音符与附近的音符进行比较可以识别它们，例如对比他们的垂直位置。

7.9K1 0

深度学习|tensorflow识别手写字体

我们依旧以MNIST手写字体数据集，来看看我们如何使用tensorflow来实现MLP。

4.5K2 0

【模式识别】解锁降维奥秘：深度剖析PCA人脸识别技术

以下是一些常见的模式识别技术：图像识别：计算机视觉：使用计算机和算法模拟人类视觉，使机器能够理解和解释图像内容。常见的应用包括人脸识别、物体检测、图像分类等。...卷积神经网络（CNN）：一种专门用于图像识别的深度学习模型，通过卷积层、池化层等结构提取图像中的特征。语音识别：自然语言处理（NLP）：涉及对人类语言进行处理和理解的技术。...模式识别在生物医学领域的应用：生物特征识别：包括指纹识别、虹膜识别、基因序列分析等，用于生物医学研究和安全身份验证。...深度学习：通过多层神经网络学习数据的表示，适用于处理大规模和复杂的数据。模式识别在安全领域的应用：行为分析：监测和识别异常行为，如入侵检测系统。...这种深度思考不仅提升了编程技能，还让对算法实现的可扩展性有了更深刻的认识。总结模式匹配领域就像一片未被勘探的信息大海，引领你勇敢踏入数据科学的神秘领域。

9011 0

深度学习|Keras识别MNIST手写数字（一）

MNIST数据集是收集的手写字体，为单色图像，共有训练集60000项，测试数据集10000项。建模方法我们使用最简单的神经网络模型，多层感知器（MLP）。

1.3K3 0

深度学习角度 | 图像识别将何去何从？

整理 | 专知本文主要介绍了一些经典的用于图像识别的深度学习模型，包括AlexNet、VGGNet、GoogLeNet、ResNet、DenseNet的网络结构及创新之处，并展示了其在ImageNet...这些经典的模型其实在很多博文中早已被介绍过，作者的创新之处在于透过这些经典的模型，讨论未来图像识别的新方向，并提出图像识别无监督学习的趋势，并引出生成对抗网络，以及讨论了加速网络训练的新挑战。...文章梳理了用于图像识别的深度学习方法的脉络，并对将来的挑战和方法做了分析，非常值得一读！专知内容组编辑整理。在过去的几年中，深度学习绝对主导了计算机视觉，在许多任务和相关竞赛中取得了最好效果。...自2015年在“图像识别的深度残差学习”一文中发布以来，ResNet已经在很多计算机视觉任务中提高了准确性。...这在现实世界的应用中可能是非常危险的：如果你的自动驾驶汽车不能识别行人，而是将其运行过来呢？部分问题可能源于我们对深度网络内部没有充分理解。无论如何，研究人员正在积极研究这个具有挑战性的问题。

2.1K5 0

·深度学习中人脸识别开发解析

深度学习中人脸识别开发解析目录人脸识别介绍人脸识别算法实战解析参考文献 ---- 人脸识别介绍人脸识别是什么人脸识别问题宏观上分为两类：1. 人脸验证（又叫人脸比对）2. 人脸识别。...这便是深度学习（深度神经网络）发挥作用的地方。它通过在千万甚至亿级别的人脸数据库上学习训练后，会自动总结出最适合于计算机理解和区分的人脸特征。...深度学习的另一任务和挑战便是在各种极端复杂的环境条件下，精确的识别各个特征。 ?...这是现代人脸识别系统的局限，一定程度上也是深度学习（深度神经网络）的局限。面对这种局限，通常采取三种应对措施，使人脸识别系统能正常运作： 1....算法角度：提升人脸识别模型性能，在训练数据里添加更多复杂场景和质量的照片，以增强模型的抗干扰能力。总而言之，人脸识别/深度学习还远未达到人们想象的那般智能。

1.8K3 0

【征文计划】Rokid手势识别技术深度剖析

目录1 -> 概述2 -> 技术架构概览2.1 -> 底层算法层2.2 -> 引擎服务层2.3 -> Unity SDK层3 -> 核心算法深度解析3.1 -> 手部检测算法3.2 -> 手骨关键点检测...2 -> 技术架构概览Rokid 手势识别系统采用分层架构设计，从下至上包括：2.1 -> 底层算法层手部检测与追踪：基于深度学习的手部边界框检测 26点手骨关键点检测：精确识别手部关节位置手势分类算法...：实时识别预定义手势状态位姿估计算法：计算手部的3D空间位置和朝向 2.2 -> 引擎服务层手势识别引擎：C++ 核心处理模块数据预处理管道：图像标准化、数据增强模型推理优化：针对移动端的神经网络加速...：支持手指微动作、双手复杂交互语义理解：结合上下文理解手势意图跨设备协同：多设备间手势交互无缝切换个性化适配：基于用户习惯的自适应识别 10 -> 结语Rokid 手势识别技术通过深度学习算法与精心设计的...从底层的21点关键点检测到上层的多模态输入管理，整个技术栈体现了工程优化与用户体验的深度结合。随着 AR/VR 技术的不断发展，手势交互必将成为人机交互的重要方式。

3480 0

命名实体识别的深度学习综述

3 NER中的深度学习技术深度学习大热。我们将介绍什么是深度学习，为什么深度学习适合NER，之后我们会调查基于深度学习的方法。 3.1 为什么NER使用深度学习深度学习的定义。深度学习工作过程。...NER使用深度学习的三个原因：1.NER适用于非线性转化2.深度学习节省了设计NER功能的大量精力3.深度学习能通过梯度传播来训练，这样可以构建更复杂的网络。...[188]利用远距离监督所产生的数据在新领域中进行新型的实体识别。实例选择器基于强化学习，并从NE标记器获得反馈奖励，旨在选择肯定的句子以减少嘈杂注释的影响。...评估NER系统的健壮性和有效性可以同识别不寻常，以前未见过的实体的能力。对于WUT-17数据集的这一研究方向存在一个共同的任务[199] 。...Deep Transfer Learning for NER 如何有效地将知识从一个领域转移到另一个领域：（a）开发一个健壮的识别器，该识别器能够在不同领域中正常工作；（b）在NER任务中探索zeroshot

2.1K3 0

如何利用深度学习识别千万张图片？

首先我们来谈一下什么是卷积神经网络，相信在深度学习中这是最重要的概念，首先你可以把卷积想象成一种混合信息的手段。想象一下装满信息的两个桶，我们把它们倒入一个桶中并且通过某种规则搅拌搅拌。...卷积核的输出是一幅修改后的图像，在深度学习中经常被称作 feature map。对每个颜色通道都有一个 feature map。...在图像识别问题中，输入层的每一个神经元可能代表一个像素的灰度值。...但这种神经网络用于图像识别有几个问题，一是没有考虑图像的空间结构，识别性能会受到限制；二是每相邻两层的神经元都是全相连，参数太多，训练速度受到限制。而卷积神经网络就可以解决这些问题。...卷积神经网络使用了针对图像识别的特殊结构，可以快速训练。因为速度快，使得采用多层神经网络变得容易，而多层结构在识别准确率上又很大优势。

1.5K5 0

如何用深度学习来识别恶意软件

但是，如果我机智地把系统升级，加入人工智能模块，即所谓的深度学习技术，那么即使手指出镜，这瓶液体也可以被识别出来。深度学习，就像人们所熟知的神经网络，受到大脑激励，不断增强学习识别物体的能力。...以视觉识别为例，我们的大脑可以通过感官输入获得原始数据，同时进一步自主学习更高级别的特点。同样，在深度学习中，原始数据从深度神经网络中读取，凭此学习如何识别物体。...此外，恶意软件检测率仍然离100%识别很远。人工智能的深度学习是机器学习的一个高级分支，也被称为“神经网络”，因为它与人类大脑的工作方式如出一辙。...由于深度神经网络是机器学习中的第一算法单元，不需要手动工程特征，因此这是深度学习的伟大革命。...例如，基于深度学习的解决方案对大幅和轻微修改的恶意代码的检测识别率超过99%。这些结果与深度学习在其他领域的表现是一致的，如计算机视觉、语音识别和文本理解。

2K9 0

·深度学习进行语音识别-简单语音处理

深度学习进行语音识别-简单语音处理吴恩达教授曾经预言过,当语音识别的准确度从95%提升到99%的时候，它将成为与电脑交互的首要方式。下面就让我们来学习与深度学习进行语音室识别吧！...这是使用深度学习进行语音识别的最高追求，但是很遗憾我们现在还没有完全做到这一点（至少在笔者写下这一篇文章的时候还没有–我敢打赌，再过几年我们可以做到）一个大问题是语速不同。...为了解决这个问题，我们必须使用一些特殊的技巧，并进行一些深度神经网络以外的特殊处理。让我们看看它是如何工作的吧！将声音转换为比特（Bit）显然，语音识别的第一步是–我们需要将声波输入到电脑中。...从短音频中识别字符现在我们已经让音频转变为一个易于处理的格式了，现在我们将要把它输入深度神经网络。神经网络的输入将会是 20 毫秒的音频块。...不识别「Hullo」是一个合理的行为，但有时你会碰到令人讨厌的情况：你的手机就是不能理解你说的有效的语句。这就是为什么这些语音识别模型总是处于再训练状态的原因，它们需要更多的数据来修复这些少数情况。

3.3K2 0

浅出深度学习系列-说说“人脸识别”

深度学习：目标检测算法 + 人脸多任务级联算法基于深度学习的多类目标检测算法发展迅速，将其应用到人脸检测中，具有通用性。...与此同时，深度学习对人脸对齐、多姿态人脸检测、人脸表情特征提取与降维、表情分类与表情识别应用等问题有创造性贡献，人脸检测与人脸对齐等多任务相结合的方法，后面章节会有详细介绍。...由于姿势、光照或遮挡等原因，在非强迫环境下的人脸识别和对齐是一项具有挑战性的问题。这种算法可以很好的解决上述的两个问题。能利用检测和校准之间固有的相关性在深度级联的多任务框架下来提升它们的性能。 ?...DeepId DeepFace的工作后来被进一步拓展成了DeepId系列，主要改进的方面有：通过联合识别与验证进行人脸表征深度学习，在分类和验证中使用多任务处理。...Facenet FaceNet是谷歌研发的人脸识别系统，是一个基于百万级人脸数据训练的深度卷积神经网络的通用系统，可以用于人脸验证（是否是同一人）、识别（这个人是谁）和聚类（寻找类似的人）。

1.2K3 0

深度学习之MNIST数据集识别（四）

参考零基础入门深度学习(3) - 神经网络和反向传播算法 https://www.zybuluo.com/hanbingtao/note/476663 详解 MNIST 数据集 https://

1.4K3 0

点击加载更多

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭