首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

苹果、俄勒冈州立提出AutoFocusFormer: 摆脱传统栅格,采用自适应下采样的图像分割

传统 RGB 图像以栅格(raster)形式储存,像素点的分布在整个图像上均匀统一。然而,这种均匀分布往往与图像实际内容的密度分布相去甚远。尤其是在现今常用的深度网络中,在编码部分经过频繁的下采样(downsampling)后,小物体占据的点极少,而大物体占据的点很多。如下图中,背景中繁忙的人群只剩下极少量的点表示,而画面下方大量的点被信息量极低的地面占用。如果从存储的特征个数和算力的角度来考虑这个图像识别的过程,那么可以想见地面特征被大量的存储,大部分的算力被用来计算这些地面。而真正关键的人群,由于点少,分到的特征就少,用于计算的算力也就很少。

02

专访腾讯“优图团队”:腾讯内部的核心技术团队是这样服务产品团队的

一个偶然的机会,36氪和“优图团队”进行了接触,他们是腾讯内部专注于图像处理、模式识别、机器学习、数据挖掘等领域的核心技术团队,由毕业自清华、北大、中科院、上海交大等院校的博士、硕士组成。 腾讯优图团队隶属于腾讯社交网络事业群,基于整个腾讯的社交网络平台,为QQ空间、腾讯地图、腾讯游戏、等50多款产品提供图像技术支持。每天QQ空间有2亿上传图片的活跃用户,团队单日最多处理照片达6亿张,累计已经分析处理了超过300亿张照片 36氪:作为纯粹的技术团队,怎么平衡技术和产品之间的矛盾? 我们首先会对一些关键技术,

06

36氪专访腾讯“优图团队”:腾讯内部的核心技术团队是这样服务产品团队的

近日,36氪和“优图团队”进行了接触,他们是腾讯内部专注于图像处理、模式识别、机器学习、数据挖掘等领域的核心技术团队,由毕业自清华、北大、中科院、上海交大等院校的博士、硕士组成。 腾讯优图团队隶属于腾讯社交网络事业群,基于整个腾讯的社交网络平台,为 QQ 空间、腾讯地图、腾讯游戏、等 50 多款产品提供图像技术支持。每天 QQ 空间有 2 亿上传图片的活跃用户,团队单日最多处理照片达 6 亿张,累计已经分析处理了超过 300 亿张照片 36氪:作为纯粹的技术团队,怎么平衡技术和产品之间的矛盾? 我们首先会对

06

递归神经网络(RNN)在语义识别方面的应用

背景 数据时代已经到来,当今企业家们已经认识到数据的重要性,并且期望通过数据分析能够驱动增长。企业业务流程面临“计划驱动”转型到”数据驱动“的巨大变革。企业需要关注的不是大数据问题,而是从小数据问题开始,关注数据价值挖掘和数据安全。未来的数据分析要求更高,数据分析的粒度会更加细腻,用户行为数据愈加重要。 本次分享主题《递归神经网络(RNN)在语义识别方面的应用》,嘉宾是参与”《数据驱动未来》 CDA数据分析师俱乐部活动·深圳站“的 深度学习专家及图像识别算法高级工程师-陈远波。 以下就跟着陈远波老师的思维一

011

微软亚研:对深度神经网络中空间注意力机制的经验性研究

摘要:空间注意力(Spatial Attention)机制最近在深度神经网络中取得了很大的成功和广泛的应用,但是对空间注意力机制本身的理解和分析匮乏。本论文对空间注意力机制进行了详尽的经验性分析,取得了更深入的理解,有些认知是跟之前的理解很不一样的,例如,作者们发现 TransformerAttention 中对 query 和 key 的内容进行比较对于空间注意力帮助很小,但对于 Encoder-Decoder Attention(编码器-解码器注意力)是至关重要的。另一方面,将可变形卷积(DeformableConvolution)与和 query 无关的 key saliency 进行适当组合可以在空间注意力中实现最佳的准确性-效率之间的权衡。本论文的研究结果表明,空间注意力机制的设计存在很大的改进空间。

06

深度学习:实际问题解决指南

当你想进行预测的时候,使用深度学习要比其他机器学习技术更快更有效。 深度学习是一门快速发展的学科,它将数据中高层次化的模式建模成复杂的多层网络。因为这是建模一个问题最一般的方法,深度学习拥有这解决大部分机器学习和人工智能领域问题的潜力。类似微软、谷歌这样的公司使用深度学习来解决诸如语音识别,图像识别,三维物体识别,和自然语言处理等领域的难题。 然而,深度学习需要进行大量的计算来构建一个有用的模型。到目前为止,计算成本和可用性限制了其实际应用。此外,研究人员缺乏理论基础和将深度学习运用到实际问题之中的经验知识

06

图像识别的原理、过程、应用前景,精华篇!

图像识别技术是信息时代的一门重要的技术,其产生目的是为了让计算机代替人类去处理大量的物理信息。随着计算机技术的发展,人类对图像识别技术的认识越来越深刻。图像识别技术的过程分为信息的获取、预处理、特征抽取和选择、分类器设计和分类决策。简单分析了图像识别技术的引入、其技术原理以及模式识别等,之后介绍了神经网络的图像识别技术和非线性降维的图像识别技术及图像识别技术的应用。从中可以总结出图像处理技术的应用广泛,人类的生活将无法离开图像识别技术,研究图像识别技术具有重大意义。 1、图像识别技术的引入 图像识别是人

010

深度学习:实际问题解决指南

当你想进行预测的时候,使用深度学习要比其他机器学习技术更快更有效。 深度学习是一门快速发展的学科,它将数据中高层次化的模式建模成复杂的多层网络。因为这是建模一个问题最一般的方法,深度学习拥有这解决大部分机器学习和人工智能领域问题的潜力。类似微软、谷歌这样的公司使用深度学习来解决诸如语音识别,图像识别,三维物体识别,和自然语言处理等领域的难题。 然而,深度学习需要进行大量的计算来构建一个有用的模型。到目前为止,计算成本和可用性限制了其实际应用。此外,研究人员缺乏理论基础和将深度学习运用到实际问题之中的经验知识

010

算法到实战,如何把深度学习应用到生活?| 回顾

计算机视觉是一门研究如何使机器“看”的科学,掌握解决具体计算机视觉任务的方法则会帮助我们解决大规模系统的复杂问题,其应用相当广泛,包括并不限于:图像分类,人脸识别;车辆检测,行人检测;语义分割,实例分割;目标跟踪,视频分割;图像生成,视频生成。 为了让大家更好的理解计算机视觉在人工智能领域的强大应用,12月7日晚,上海交通大学卢宪凯博士受AI研习社邀请,开展了一场主题为《计算机视觉概述和深度学习简介》的公开课,卢博士在公开课中给大家介绍了计算机视觉的定义、研究方法和应用举例,重点介绍深度学习发展历史,常见深

06

首个基于时序平移的视频迁移攻击算法,复旦大学研究入选AAAI 2022

近年来,深度学习在一系列任务中(例如:图像识别、目标识别、语义分割、视频识别等)取得了巨大成功。因此,基于深度学习的智能模型正逐渐广泛地应用于安防监控、无人驾驶等行业中。但最近的研究表明,深度学习本身非常脆弱,容易受到来自对抗样本的攻击。对抗样本指的是由在干净样本上增加对抗扰动而生成可以使模型发生错误分类的样本。对抗样本的存在为深度学习的应用发展带来严重威胁,尤其是最近发现的对抗样本在不同模型间的可迁移性,使得针对智能模型的黑盒攻击成为可能。具体地,攻击者利用可完全访问的模型(又称白盒模型)生成对抗样本,来攻击可能部署于线上的只能获取模型输出结果的模型(又称黑盒模型)。此外,目前的相关研究主要集中在图像模型中,而对于视频模型的研究较少。因此,亟需开展针对视频模型中对抗样本迁移性的研究,以促进视频模型的安全发展。

03
领券