首页
学习
活动
专区
工具
TVP
发布

PyVision

专栏作者
81
文章
92606
阅读量
17
订阅数
基于多尺度神经网络和特征融合的SOTA单目深度估计
论文: https://arxiv.org/pdf/2009.09934.pdf 代码: https://github.com/abhinavsagar/msnnff
McGL
2021-07-07
2.2K2
AugLy: Facebook Research新开源多模态数据增强库,鲁棒模型好帮手。
地址: https://github.com/facebookresearch/AugLy
McGL
2021-07-07
9471
M1 MacBook Pro vs. Intel i9 MacBook Pro,数据科学终极笔记本之战
预算没问题的情况下,数据科学应用最好选哪个笔记本?内核 M1 vs. i9–9880H, 我们全方位对比测试了复合benchmarks、 Python、 Numpy、 Pandas 和 Scikit Learn 性能来一探究竟。
McGL
2021-07-07
2K0
使用TVM优化PyTorch模型实现快速CPU推理
Apache TVM 是一个相对较新的 Apache 项目,以深度学习模型推理的性能大幅改进为目标。它属于一种叫做模型编译器(model compilers) 的新技术: 它以高级框架(如 PyTorch 或 TensorFlow)中编写的模型作为输入,生成一个为在特定硬件平台上运行而优化的二进制包作为输出。
McGL
2021-07-07
1.9K0
迈向深度学习的终结和AGI的开端
AI 的神经元比生物神经元简单的多,不过改进的方向不一定是变得更复杂。有可能只是从其中一部分得到启发。
McGL
2021-07-07
2630
Transformer真的需要注意力吗?
近年来,基于自注意力特别是 Transformer 的方法大量涌现,首先是在自然语言处理领域,最近在计算机视觉领域。
McGL
2021-07-07
6080
对比自监督学习方法综合对比分析
【导读:这篇来自华盛顿大学的论文深入研究了各种对比自监督模型,系统分析了计算机视觉任务的基准问题;算法,数据集和终端任务如何影响模型性能;以及哪种编码器是最好的通用主干网络。】
McGL
2021-07-07
7550
丰田研究院:自监督单目图像深度估计再改进,数据和代码已开源
上一篇文章,我们讨论了深度神经网络如何从一张图像中预测深度。特别是,我们证明了这个问题可以自监督只使用视频和几何约束。这种方法高度可扩展,甚至可以工作在未校准的摄像头或自动驾驶常见的多摄像头装备。
McGL
2021-07-07
1.1K0
丰田研究院:自监督单目图像深度估计,数据和代码已开源
计算机视觉是人工智能的一个领域,它使计算机能够表示视觉世界。由于神经网络可以从数据中学习如何做出准确的预测,深度学习已经彻底改变了这个领域。最近的进展有望使汽车更加安全,通过自动驾驶车辆增加自由时间,以及为残疾人和我们迅速老龄化的全球人口提供机器人援助。
McGL
2021-05-28
1.3K0
Lyft高性能3D目标检测,端到端融合摄像头和激光雷达
这是一个来自 LyftLevel5 的自动驾驶汽车研究和实践案例,通过结合多种感知传感器,来实现更准确的 3D 检测(如汽车,行人,骑自行车的人等)。
McGL
2021-05-28
6350
广度网络和深度网络学到的东西是一样的吗?
要提高神经网络性能并使其适配可用计算资源,一个常见做法是调整结构的深度和宽度。实际上流行的神经网络系列,包括 EfficientNet、 ResNet 和 Transformers,都是由一组灵活深度和宽度的结构组成。但是除了对准确率的影响之外,目前对于这些结构设计的基本选择如何影响模型的理解是很有限的,例如对其内部表征(internal representations)的影响。
McGL
2021-05-08
8060
我的PyTorch模型比内存还大,怎么训练呀?
随着深度学习的飞速发展,模型越来越臃肿先进,运行SOTA模型的主要困难之一就是怎么把它塞到 GPU 上,毕竟,你无法训练一个设备装不下的模型。改善这个问题的技术有很多种,例如,分布式训练和混合精度训练。
McGL
2021-05-08
1.8K0
自动驾驶中的深度学习
最早使用神经网络来检测车道线,分割地面和驾驶的自动驾驶汽车叫 ALVINN,创建于1989年。
McGL
2021-05-08
1.2K0
学习率调度器和自适应优化器简史
很久很久以前,在 Adam 和 Adagrad 发布之前,几乎所有神经网络的训练方式都是一样的 —— 使用一个固定的学习率和随机梯度下降(优化器)。
McGL
2021-04-21
1.8K0
Python 3.10发布临近,一文尽览所有重要新特性和变化
Python 3.10 的发布日益临近,是时候来看看它将带来的最重要的新特性和变化了。内容包括类型检查,类型别名,switch/case语法,数量统计,上下文管理器,性能等。
McGL
2021-04-21
6870
一键去纹身,AI看了直呼......
程序小哥 Vijish Madhavan 刚刚开源了他搞的去纹身模型 SkinDeep,下面是这个 AI 应用到那个 AI 身上的效果,看起来效果杠杠的。
McGL
2021-04-21
6910
PyTorch全新性能分析工具,可视化瓶颈,并集成到了VS Code
随着 PyTorch 1.8.1的发布,一个全新改进的性能调试工具 PyTorch Profiler 来了。作为微软和 Facebook 合作的一部分,PyTorch Profiler 是一个开源工具,可以对大规模深度学习模型进行准确高效的性能分析和故障排除。
McGL
2021-04-21
4.5K0
自动驾驶运动预测
要实现完全自动驾驶,尚未解决的关键问题之一是预测自动驾驶汽车附近物体的行为。使用我们的 Prediction 数据集和 L5Kit 工具包,即使你之前没有自动驾驶相关经验,也可以在一个空闲的下午或周末开始构建运动预测模型。如果成功的话,你可以帮助推动自动驾驶行业作为一个整体向前发展,如果你的解决方案在 Kaggle 竞赛中名列前茅,你甚至可以获得我们3万美元奖金池的一部分。
McGL
2021-03-30
1.2K0
Attention Is Not All You Need
2017年的论文 《Attention is All You Need》 引入了基于注意力机制的 transformer 架构,标志着机器学习有史以来最大的突破之一。最近的一项研究提出了一种新的方法来研究自注意力(self-attention),它的偏置(bias)和秩崩溃(rank collapse)问题。
McGL
2021-03-15
7760
3D电影化照片背后的技术揭秘
回看过去的照片可以帮助人们重温一些最难忘的时刻。去年12月,我们发布了电影照片(Cinematic Photos),这是谷歌照片(Google Photos)的一个新功能,旨在重新体验照片拍摄时的沉浸感,通过推断图像中的 3D 表示模拟相机的运动和视差。在这篇文章中,我们来看看这个过程背后的技术,并演示电影照片是如何将一张来自过去的 2D 照片转换成更为身临其境的 3D 动画的。
McGL
2021-03-15
6770
点击加载更多
社区活动
Python精品学习库
代码在线跑,知识轻松学
【玩转EdgeOne】征文进行中
限时免费体验,发文即有奖~
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·干货材料·成员作品·最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档