计算机视觉战队

从部署到实践，即刻拥有你的专属龙虾助手

OpenClaw开发者专区🦞🦞🦞

自行/邀约他人一键搬运博客，享价值百万资源包

腾讯云自媒体同步曝光计划

往期视频·干货材料·成员作品 最新动态

腾讯技术创作特训营知识专栏

新邀入驻腾讯云开发者社区，福利多多！

城市的火灾可能会造成毁灭性的后果，造成财产损失，并危及公民的生命。传统的火灾探测方法在准确性和速度方面存在局限性，使得实时探测火灾具有挑战性。

一种基于YOLO-v8的智能城市火灾探测改进方法

ChatGPT（全名:Chat Generative Pre-trained Transformer），是OpenAI研发的聊天机器人程序，于2022年11月30日发布。ChatGPT是人工智能技术驱动的自然语言处理工具，它能够通过理解和学习人类的语言来进行对话，还能根据聊天的上下文进行互动，真正像人类一样来聊天交流，甚至能完成撰写邮件、视频脚本、文案、翻译、代码，写论文等任务。

当YoloV8与ChatGPT互通，这功能是真的强大！后期打通语音试试

在过去几年中，YOLO 系列模型已成为实时目标检测领域的主流方法。许多研究通过修改架构、扩充数据以及设计新的损失函数，将基线水平提升到了更高层次。然而，我们发现尽管特征金字塔网络（FPN）和路径聚合网络（PANet）缓解了这一问题，但以往的模型仍存在信息融合方面的难题。

Gold-YOLO：基于聚合与分配机制的高效目标检测器

相关研究提出一种基于 YOLO 的水下图像目标检测方法，引入一种改进的无锚点 YOLO 检测方法，将检测特征与识别特征分离，以减少特征间的相互干扰，提高检测精度。还提出一种基于 Retinex 的图像增强算法用于水下图像增强，并通过在水下数据集上的相关实验，验证了增强型 YOLO 检测方法的有效性。

CEH-YOLO：基于 YOLO 的水下目标检测复合增强模型

目前，基于卫星图像的多类别船舶检测和分类由于在军事和民用领域的重要应用而备受关注。

无人机视角下多类别船舶检测及数量统计

合成孔径雷达（Synthetic Aperture Radar, SAR）作为一种基于电磁波的主动探测技术，具有全天时、全天候的对地观测能力，已发展成为一种不可或缺的对地观测工具，在军民很多领域均有着重要的应用。

首个公开发表的SAR图像目标识别基础模型！国防科大刘永祥&刘丽教授团队提出SARATR-X 1.0

春节前最后一周，能媲美 Open AI 满血版 o1（Full Version，而非 preview）的模型终于出现了！

追平满血版o1的国产多模态模型终于来了！训练细节全部公开

随着当前大语言模型的广泛应用和推理时扩展的新范式的崛起，如何实现高效的大规模推理成为了一个巨大挑战。特别是在语言模型的推理阶段，传统注意力机制中的键值缓存（KV Cache）会随着批处理大小和序列长度线性增长，俨然成为制约大语言模型规模化应用和推理时扩展的「内存杀手」。

阶跃公开了自家新型注意力机制：KV缓存消耗直降93.7%，性能不减反增

https://pan.baidu.com/s/1yoamhld79Glc4wE_SUT1DA 

YOLO-S：小目标检测的轻量级、精确的类YOLO网络

论文地址：https://arxiv.org/pdf/2112.13082.pdf

多尺度特征融合：为检测学习更好的语义信息（附论文下载）

最近在arXiv中翻阅到一遍基于Yolov8的飞机实时目标检测论文，当时通过研究其中的一些相关算法，并应用到实际场景。一个可用于迁移学习和进一步研究的飞行物体实时检测的广义模型，以及一个可供实施的精化模型。

机场项目：解决飞行物空间大小/纵横比、速度、遮挡等问题引起的实时目标检测问题

目标检测被认为是计算机视觉领域中最具挑战性的问题之一，因为它涉及场景中对象分类和对象定位的组合。最近，与其他方法相比，深度神经网络 (DNN) 已被证明可以实现卓越的目标检测性能，其中YOLOv2是基于DNN的最先进技术之一。

Fast YOLO：用于实时嵌入式目标检测

论文链接：https://arxiv.org/pdf/2104.08683.pdf

不需要标注了？看自监督学习框架如何助力目标检测

在过去的十年中，深度神经网络(DNNs)在各种应用中表现出显著的性能。当我们试图解决更艰难和最新的问题时，对计算和电力资源的需求增加已经成为不可避免的。

大改Yolo框架 |  能源消耗极低的目标检测新框架

论文地址：https://arxiv.org/pdf/2201.03243v1.pdf

利用先进技术保家卫国：深度学习进行小目标检测（适合初学者入门）

无人机小目标检测的轻量级、精确的类YOLO网络

由于缺乏夜间图像注释，夜间目标检测是一个具有挑战性的问题。尽管有几种领域自适应方法，但实现高精度结果仍然是一个问题。

昼夜无监督域自适应目标检测（附原代码）

近期开源的 Deepseek V3，让国产 MoE 大模型在全球圈粉无数，一跃成为中国 AI 圈的顶流担当。

「源神」稚晖君又双叒叕开源，这一次机器人直接进入人类生活！

Column of Computer Vision Institute
这个项目登上了今天的GitHub Trending。

GitHub 7.5k star量，各种视觉Transformer的PyTorch实现合集整理好了

Non keypoint-based的目标检测模型由分类和回归分支组成，由于不同的任务驱动因素，这两个分支对来自相同尺度级别和相同空间位置的特征具有不同的敏感性。point-based的预测方法，在基于高分类置信点具有高回归质量的假设上，导致错位问题。我们的分析表明，该问题进一步具体由尺度错位和空间错位组成。

优于FCOS：在One-Stage和Anchor-Free目标检测中以最小的成本实现最小的错位（代码待开源）

文章

问答

视频

教程

学习中心

腾讯云实验室

直播

竞赛

腾讯云代码分析专区

腾讯iOA零信任安全管理系统专区

腾讯云架构师技术同盟交流圈

腾讯云数据库专区

腾讯云智能顾问专区

腾讯云原生专区

腾讯混元专区

腾讯云TCE专区

腾讯云Lighthouse专区

腾讯云HAI专区

腾讯云Edgeone专区

腾讯云存储专区

腾讯云智能专区

腾讯轻联专区 

腾讯云开发专区

TAPD专区

腾讯轻量云游戏服专区

EdgeOne AI 安全实战专区

腾讯云最具价值专家

腾讯云架构师技术同盟

腾讯云创作之星

腾讯云开发者先锋

腾讯云代码助手

云原生构建

TAPD 敏捷项目管理

Cloud Studio

SDK中心

API中心

命令行工具

涵盖代码开发、场景应用、自动测试全流程，助你从零构建专属AI助手

一站式MCP教程库，解锁AI应用新玩法

聚焦“写作效率、视觉美观与运行性能”三方面进行全面升级，为您提供更高效、稳定的创作环境

社区富文本&Markdown编辑器全新改版上线，欢迎大家体验!

诚挚邀请您参与本次调研，分享您的真实使用感受与建议。您的反馈至关重要，感谢您的支持与参与！

社区新版编辑器体验调研

腾讯云开发者社区推出了计算机视觉战队专栏，为你提供了计算机视觉战队的相关文章，致力于帮助开发者快速成长与发展。

计算机视觉战队

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐