低光照条件下交通标志的有效检测仍是一项重大挑战。为解决这一问题,我们提出YOLO-LLTS算法,这是一种专为低光环境设计的端到端实时交通标志检测方法。首先,我们...
在基于大语言模型的文生视频技术中,视频质量评测的重要性不言而喻。这种技术涉及到将文本信息转化为视觉元素,然后再将这些元素合成为视频。在这个过程中,视频质量的好坏...
上一章,我们介绍了大模型的基础知识及在应用大模型时的相关技术。在本章,我们将探讨大模型在计算机视觉上的测试应用,如何帮助我们提升本书前面章节的活体检测算法的测试...
大语言模型的评测是非常重要的,它有助于了解模型的性能、局限性和可靠性。具体来说,通过评测,我们可以有如下收获。
但为什么会这样呢?你认为经过几十年的研究,我们会很自然地说“这里的问题已经解决了,让我们专注于别的事情”。在某种程度上,我们可以这样说,但仅适用于狭窄和简单的用...
大规模图像和视频数据集的人工标注通常耗时、易错且成本高昂,这成为铁路视频故障检测中机器学习工作流的主要瓶颈。本研究提出一种半自动化标注方法,利用预训练的YOLO...
植物育种计划需要对成熟天数进行评估和了解,以便在适当的试验中进行适当的选择和安排。大豆育种计划在育种的早期阶段会给试验品种分配相对成熟度等级,以表明其适宜的成熟...
水下物体探测对于海洋研究和工业安全检查至关重要。然而,复杂的光学环境和有限的水下设备资源给实现高精度和低功耗带来了巨大挑战。为了解决这些问题,提出了一种尖峰神经...
腾讯云TDP | 会员 (已认证)
经常“打螺丝“的”吃席“观众就会发现,你看这个手机屏幕有没有划痕、这个构件有没有缺陷,要左手拿个电灯,右手拿起这个物品,反复的看反复的摸,大概耗时一分钟以上,一...
计算机视觉和物理引擎是元宇宙中非常重要的两项技术。计算机视觉能够实时识别用户的动作、面部表情等物理活动,而物理引擎则负责模拟虚拟世界中物体的物理行为,如重力、碰...
无人机或无人驾驶飞行器传统上用于军事任务、战争和间谍活动。然而,由于涉及安全和检查、转运、研究目的和娱乐性无人机飞行的多种工业应用,无人机的使用量大幅增加。公共...
本节内容摘自本人编著的<<人工智能-计算机视觉算法测试与应用指南>>,目前已在微信读书、京东读书等平台上架。
随着上周,GPT-4o原生多模态图像生成功能的推出,更多玩法也被开发出来。一夜之间,GPT-4o原生多模态能力的释放,让图像生成、语义分割、深度图构建这些曾需要...
在烟草、食品包装等行业,每个商品上的彩色二维码不仅是防伪溯源的关键,更是企业品牌信誉的“生命线”。然而,高速喷印过程中产生的飞墨、漏印等缺陷,可能导致消费者扫码...
近日,谷歌与计算机历史博物馆(CHM)联合发布了 AlexNet 项目源代码。目前,项目的 Python 代码已作为开源软件在 CHM 的 GitHub 页面上...
前不久,清华大学研究团队继YOLOv10后再次推出全新模型YOLOE(Real-Time Seeing Anything)。
自VQGAN和潜在扩散模型等流行的视觉生成框架出现以来,最先进的图像生成系统一般都是两阶段系统,首先将视觉数据标记化或压缩到低维潜在空间,然后再学习生成模型。标...
人工智能技术要真正发挥其价值,必须与生产生活深度融合,为产业发展和人类生活带来实际效益。近年来,基于深度学习的机器视觉技术在工业自动化领域取得了显著进展,其中Y...
传统的目标检测模型受到封闭数据集的限制,只能检测训练过程中遇到的类别。虽然多模态模型通过对齐文本和图像模态扩展了类别识别,但由于跨模态融合,它们引入了大量过度推...
在传统软件开发中,DevOps通过自动化工具链和持续集成/交付(CI/CD)打破了开发与运维的壁垒,成为软件工业化的基石。然而,当AI技术尤其是计算机视觉(CV...