科研工程师

1996

从部署到实践，即刻拥有你的专属龙虾助手

OpenClaw开发者专区🦞🦞🦞

自行/邀约他人一键搬运博客，享价值百万资源包

腾讯云自媒体同步曝光计划

往期视频·干货材料·成员作品 最新动态

腾讯技术创作特训营知识专栏

新邀入驻腾讯云开发者社区，福利多多！

本文介绍了一种适应性跟踪方法，可以在不降低准确性的情况下提高深度跟踪器的速度。该方法通过使用廉价（cheap）特征处理简单帧，使用昂贵（expensive）的深度特征处理复杂帧，从而显著降低了前向传递成本。作者使用强化学习方法训练了一个代理来决定何时使用哪种特征，同时还展示了学习所有深度层可以实现接近实时的平均跟踪速度。该方法在近50%的时间内提供了100倍的加速，表明了适应性方法的优势。

深度特征级联的适应性跟踪学习策略

针对合成孔径雷达图像目标检测易受噪声和背景干扰影响, 以及多尺度条件下检测性能下降的问题, 在兼顾网络规模和检测精度的基础上, 提出了一种改进的合成孔径雷达舰船目标检测算法。使用坐标注意力机制, 在确保轻量化的同时抑制了噪声与干扰, 以提高网络的特征提取能力; 融入加权双向特征金字塔结构以实现多尺度特征融合, 设计了一种新的预测框损失函数以改善检测精度, 同时加快算法收敛, 从而实现了对合成孔径雷达图像舰船目标的快速准确识别。实验验证表明, 所提算法在合成孔径雷达舰船检测数据集(synthetic aperture radar ship detection dataset, SSDD)上的平均精度均值达到96.7%, 相比于YOLOv5s提高1.9%, 训练时收敛速度更快, 且保持了网络轻量化的特点, 在实际应用中具有良好前景。

改进YOLOv5的合成孔径雷达图像舰船目标检测方法

今年的ICCV2023 best student paper颁给了康奈尔大学的qianqian wang，目前是加州大学伯克利分校的博士后研究员!

这是魔法吗？一次跟踪所有信息，ICCV 2023最佳学生论文！Github已经1.6K star

对于CVer来说，「代码和找代码」能力都是一种很重要的能力，毕竟idea再好只有通过代码实现出来才能发文章和刷榜。当我们阅读一篇高质量或者英文论文时，如何去找到该文章实现的代码，进而结合文章内容和代码实现去更好的理解作者所做的工作。只有自己跑一遍代码才能去改进网络，在研读大佬所写的代码的同时也能精进自己的代码能力。博主结合自己的经历，分享几个常用的找文章代码方式。

驾驭计算机视觉的翅膀：论文找代码的几种必杀技！

题目：Putting People in Their Place: Affordance-Aware Human Insertion into Scenes

CVPR 2023：把人放在他们的位置，把人自然地插到图像里

在计算机视觉中，视频识别和检测是一个重要的方向。历年来CVPR和ICCV等顶会文章中这类论文是最多的。视频识别和检测也是最有落地场景前景的，像人脸识别、动作检测、异常检测、行人重识别、行人计数等都是很有落地前景的应用方向。本文介绍百度PaddlePaddle推出PP-Human行为识别模块，覆盖视频分类、检测、关键点识别等重要领域，既有demo又有代码，是初学者很好的入门学习资料。

揭开视频识别（动作识别）的神秘面纱（附代码和demo）！

自从大模型推出来之后，似乎没有什么工作是大模型不能做的。特别是在文本生成、文案写作、代码提示、代码生成、代码改错等方面都表现出不错的能力。下面我将介绍运用大模型写代码的几种方式，帮助程序员写出更好的代码！（大模型包括但不限于ChatGPT、文心一言【博主测试的大模型】、星火认知大模型等）

几种技巧让大模型（ChatGPT、文心一言）帮你提高写代码效率！

我们提出了一种few-shot动作识别框架STRM，它在学习高阶时间表示的同时，增强了特定类特征的区分能力。我们的方法的重点是一个新的时空增强模块，它将空间和时间上下文与专用的局部帧级别和全局帧级别特征丰富子模块聚合在一起。局部帧级别的扩展捕获基于外观的动作特征。另一方面，全局帧级扩展明确编码了广泛的时间上下文，从而捕获了随时间推移的相关对象特征。然后，利用得到的时空丰富表示来学习查询和支持动作子序列之间的关系匹配。我们进一步在帧级丰富的特征上引入query类相似性分类器，通过在所提出的框架中的不同阶段加强特征学习来增强特定类特征的可区分性。在四个不同的少样本动作识别数据基准上进行了实验：Kinetics、SSv2、HMDB51和UCF101，我们所提的方法达到最佳水平。

CVPR2022 | 动作识别框架新范式 STRM，用最小的样本获得最高的精度

“预计到2020年，国际上微电子技术水平将发展到14纳米，我们应该清醒地认识到，核心技术是买不到的，必须靠我们自己，只是一代又一代的引进新的生产能力是赶不上世界先进水平的。我们研究人人员要争口气，否则发达国家在核心技术方面总是要卡我们的脖子。”

江泽民：新时期我国信息技术产业的发展

第1级，APA 自动泊车：驾驶员在车内，随时准备制动，分为雷达感知和雷达+视觉感知两种方式。

自动泊车之停车位检测算法（角点检测/语义分割）

【Ikomia API：用来轻松快速构建和部署计算机视觉工作流的开源工具，可以任意部署 OpenCV, Detectron2, OpenMMLab or YOLO with the best state-of-the-art algorithms from individual repos.】 by Ikomia 

State-of-the-art Computer Vision with a few lines of code

去年九月，清华大学新媒体研究中心发表了《2020-2021年元宇宙发展研究报告》，获得人们的普遍关注。获取方式在本公众号回复关键词“元宇宙”

清华大学：元宇宙发展研究报告3.0发布！

近期，随着特斯拉等一众智能车厂发力，智能驾驶已成为消费者在选购车型中重要的考量维度。在智能驾驶技术研发中，受到关注度最高的是远场感知系统，非常容易获取到相关的技术资料。相对而言，近场感知受到的关注少很多，但是技术复杂度并没有因此降低，尤其是在泊车场景，近场感知能力尤为重要。缘于此，笔者近期会分享关于环视近场感知技术的系列工作，希望对该领域的技术同僚有所帮助。

环视近场感知之多任务学习（深度估计/语义分割/目标分割/脏污分割）

这次工程部署主要选择了比较熟悉的旋转选择框架-GGHL。如果没有特殊算子的检测框架，依然可以使用下面的这个Pipeline, 旋转目标检测主要分成五参数和八参数的表征方法，分别对应的 x,y,w,h.以及对应的八参数的转化求法 x_1,y_1,x_2,y_2,x_3,y_3,x_4,y_4 。这两种方式在后处理的时候可以互相转换，我们这里选择后者。

旋转目标检测模型-TensorRT 部署(C++)

‍‍‍‍‍‍‍‍‍‍今日推荐几篇最新/经典计算机视觉方向的论文，涉及诸多方面，其中多篇都是CVPR2022录用的文章，具体内容详见论文原文和代码链接。

经典/最新计算机视觉论文及代码推荐

Resnet被证明能够扩展到数千层，并且仍然具有改进的性能。然而，每提高一个百分点的精确度，就要花费将近两倍的层数，因此训练非常深的Resnet存在着减少特征重用的问题，这使得这些网络的训练速度非常慢。为所以该篇论文提出了一种新的体系结构，减少了网络的深度，增加了网络的宽度，这种结构称为宽残差网络（WRN），宽度即网络输出通道数，并通过实验证明它们远远优于常用的薄而深的网络结构。

CNN模型合集 | Resnet变种-WideResnet解读

TensorFlow由Google智能机器研究部门研发；TensorFlow编程接口支持Python和C++。随着1.0版本的公布，相继支持了Java、Go、R和Haskell API的alpha版本。2.0版本又把Keras的相关API都嵌入到tf中，使得其功能更加强大。但由于版本变动过大，因此1.0版本的代码在2.0版本好多都报错，造成版本升级迭代困难。

深度学习四大框架之争(Tensorflow、Pytorch、Keras和Paddle)

数据增强是提高图像分类器精度的有效技术。但是当前的数据增强实现是手工设计的。在本论文中，我们提出了AutoAugment来自动搜索改进数据增强策略。我们设计了一个搜索空间，其中一个策略由许多子策略组成，每个小批量的每个图像随机选择一个子策略。子策略由两个操作组成，每个操作都是图像处理功能，例如平移，旋转或剪切，以及应用这些功能的概率。我们使用搜索算法来找到最佳策略，使得神经网络在目标数据集上产生最高的验证准确度。我们的方法在ImageNet上获得了83.5％的top1准确度，比之前83.1％的记录好0.4％。在CIFAR-10上，我们实现了1.5％的错误率，比之前的记录好了0.6％。扩充策略在数据集之间是可以相互转换的。在ImageNet上学到的策略也能在其他数据集上实现显著的提升。

自动数据增强论文及算法解读（附代码）

    最近在github上看到一个博主开源的YOLOv7仓库都惊呆了，YOLOv6都还没出来怎么就到YOLOv7了

使用transformer的YOLOv7及TensorRT部署

通过观察，我们发现只要把二叉树上的每一个节点的左右子节点进行交换，最后的结果就是完全翻转之后的二叉树。

LeetCode每日一题：翻转二叉树

文章

问答

视频

教程

学习中心

腾讯云实验室

直播

竞赛

腾讯云代码分析专区

腾讯iOA零信任安全管理系统专区

腾讯云架构师技术同盟交流圈

腾讯云数据库专区

腾讯云智能顾问专区

腾讯云原生专区

腾讯混元专区

腾讯云TCE专区

腾讯云Lighthouse专区

腾讯云HAI专区

腾讯云Edgeone专区

腾讯云存储专区

腾讯云智能专区

腾讯轻联专区 

腾讯云开发专区

TAPD专区

腾讯轻量云游戏服专区

EdgeOne AI 安全实战专区

腾讯云最具价值专家

腾讯云架构师技术同盟

腾讯云创作之星

腾讯云开发者先锋

腾讯云代码助手

云原生构建

TAPD 敏捷项目管理

Cloud Studio

SDK中心

API中心

命令行工具

涵盖代码开发、场景应用、自动测试全流程，助你从零构建专属AI助手

一站式MCP教程库，解锁AI应用新玩法

聚焦“写作效率、视觉美观与运行性能”三方面进行全面升级，为您提供更高效、稳定的创作环境

社区富文本&Markdown编辑器全新改版上线，欢迎大家体验!

诚挚邀请您参与本次调研，分享您的真实使用感受与建议。您的反馈至关重要，感谢您的支持与参与！

社区新版编辑器体验调研

腾讯云开发者社区推出了1996专栏，为你提供了1996的相关文章，致力于帮助开发者快速成长与发展。

1996

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐