腾讯云开发者社区-腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

目标检测和深度学习

专栏作者

252

文章

303140

阅读量

114

订阅数

从第一性原理解读大模型Agent技术

人工智能 agent 模型系统原理

本文讲述了从大型人工智能模型到智能体的转变，强调了核心概念和技术进展的重要性。文章中的图表对于理解这些复杂概念至关重要，它们不仅简洁而且包含了关键信息，这使得文章成为一个值得收藏的资源。技术脉络从“Prompt工程”开始，这是AI领域的一个基本概念，指的是如何有效地构造和使用提示词（Prompt）来引导AI模型生成期望的输出。随后发展到“Prompt Chain或Flow”，这进一步细化了Prompt工程，涉及如何将多个提示词串联起来，形成一个流程，以指导AI完成更复杂的任务。进一步地，文章讨论了“Agent”概念的发展，这指的是一个能够自主行动并且进行决策的智能实体。这些智能体可以是单独操作的，也可以是多个智能体协同工作。多Agent系统在处理复杂任务和环境中显得尤为重要，因为它们可以协作，共享信息和资源，从而提高整体性能和效率。文章还提到了“提示词万能公式”，这是一种构造有效AI提示词的方法，包括角色、角色技能、任务核心关键词、任务目标、任务背景、任务范围、任务解决与否判定、任务限制条件以及输出格式/形式和输出量。这种公式的目的是为了最大化AI的效能和准确性。

2023-11-27

5500

两款典型的AI工具：Magic editor 和Genmo AI

人工智能 editor 动画工具视频

谷歌相册新推出的Magic Editor图片编辑功能，是一款集成了人工智能生成内容（AIGC）的前沿产品。与传统修图应用相比，谷歌相册在几个关键方面展现出其独特优势： 1. **多图处理**：谷歌相册能够处理一系列类似照片中的问题，而普通修图应用通常只能一次处理一张图片。 2. **突出修复**：相册专注于修复明显的问题，而传统修图工具则更侧重于细致的编辑。 Google Photo的AI切入点： 1. **最佳表情提取**：这项功能可以从多张相似照片中挑选出人物的最佳表情，并将其融合到当前照片中，极大地提高合照的质量。 2. **先进的消除笔**：传统消除笔在处理复杂对象时可能力不从心，而AIGC技术则大大提升了这一功能的效率和准确度。 3. **物体移动与缩放**：包括精准抠图和背景填充。 4. **声音降噪**：支持声音解析为多声道，并能处理不同声道，以提高音频质量。 5. **模糊变清晰**：这是某些应用的特色功能，也被Google Photo所采纳。总的来说，谷歌相册的Magic Editor为图片编辑带来了革命性的变化，它不仅提高了编辑效率，还扩展了创作的可能性。对于追求完美合照和高质量图片编辑的用户来说，这无疑是一项值得尝试的强大工具。

2023-11-23

4740

目标检测入门（三）：基础网络演进、分类与定位的权衡

机器学习神经网络深度学习人工智能

从此篇开始，我们对近几年检测领域的工作提供一个概览，并试图从中归纳出一些趋势。由于篇幅和视野所限，文章不会求全，相对注重思路的演进，淡化实验结果的报告。事实上，我们并没有看到这一任务上的"The Best Paper"和"The Final Paper"，现阶段的工作远远没有到解决这一问题的程度，深度学习模型也仍然是非常年轻的研究领域。

2022-03-04

3650

目标检测的性能上界讨论

机器学习神经网络深度学习人工智能 https

发现了最近 arxiv 上的一篇文章 Empirical Upper-bound in Object Detection and More，作者们在多个数据集上探讨了多种检测器所能达到的性能上限，颇有当年 Speed/accuracy trade-offs for modern convolutional object detectors 的风采。“目标检测还有什么能做的？”这个问题确实很令人迷茫，但自己今后仍然会密切关注这个方向，希望能和这篇文章一样，为大家带来一些启发。

2020-02-25

8900

比Tiny YOLOv3小8倍，性能提升11个点，4MB的网络也能做目标检测

深度学习人工智能图像识别架构设计编程算法

目标检测在计算机视觉领域是一个活跃的研究分支，而深度学习已经成为这一领域最前沿也是最成功的解决方案。但是，在边缘和移动设备中广泛部署神经网络模型需要大量的计算算力和内存。因此，近来研究领域主要在解决适合以上设备的神经网络。

2019-10-21

5740

谷歌大脑提出：基于NAS的目标检测模型NAS-FPN，超越Mask R-CNN

图像识别机器学习神经网络深度学习人工智能

谷歌大脑的Quoc Le团队，用神经网络架构搜索 (NAS) ，发现了一个目标检测模型。长这样：

2019-06-14

1.5K0

CVPR2019 论文解读汇总（包括目标检测、姿态估计、语义分割等，更新中）

机器学习神经网络深度学习人工智能编程算法

1、CVPR2019 | Guided Anchoring: 物体检测器也能自己学 Anchor 物体检测领域论文"Region Proposal by Guided Anchoring"解读，这篇 paper 的方法用在了 COCO Challenge 2018 检测任务的冠军方法中，在极高的 baseline 上涨了1个点。论文目前已被CVPR2019接收。

2019-05-21

9.7K0

目标检测训练trick超级大礼包—不改模型提升精度，值得拥有

机器学习神经网络深度学习人工智能编程算法

下图展示了使用此trick大礼包训练Faster RCNN和YOLOv3之后，获得的精度增益，相同的算法最多竟有+4.0%AP的增长！

2019-05-17

1.9K0

完美代替传统卷积！Facebook等提出全新卷积操作OctConv，速度接近理论极限

编程算法机器学习神经网络深度学习人工智能

近日，Facebook AI、新加坡国立大学、360 人工智能研究院的研究人员提出一种新的卷积操作 ——Octave Convolution (OctConv)。

2019-05-13

7020

CVPR 2019 | 天秤座R-CNN：全面平衡的目标检测器

机器学习神经网络深度学习人工智能图像识别

这是一篇浙江大学和香港中文大学发表于 CVPR 2019 的论文，这篇文章十分有趣，网友戏称：“无痛涨点，实现简单，良心 paper”，在我看来确实是这样的，没有太大的改造结构，不需增加计算成本的条件下，居然能涨两个点 mAP。

2019-05-13

6010

五大维度深入分析计算机视觉

深度学习人工智能

众所周知，人工智能（Artificial Intelligence）正在改变我们的工作方式及认知。不过，对人工智能一知半解，和成为真正的人工智能工程师之间，还是有一条很宽的鸿沟的。对于想进入AI领域的同学，第一步就是要了解目前人工智能产业的结构体系。

2019-01-02

8280

2019人工智能学术会议列表

人工智能数据挖掘

2018 年已经过去了 66% 左右，ACL、CVPR、ICML、ICLR 等学术会议也已经开完，众多学术圈的朋友们如今可能都在为 NIPS 2018 论文 rebuttal 而奋战，但是不是更多的人在为 2019 年的学术论文而做准备？

2018-08-22

9420

挑战赛 | 京东AI时尚挑战赛

人工智能数据库

随着中国时尚消费市场的扩大和AI技术在中国消费领域的普及，AI+Fashion正在对时尚行业产生重大影响。在AI技术促进和改善时尚相关购物体验的技术不断涌现的同时，相关技术仍然面临重重挑战。

2018-07-23

5710

重磅！卷积神经网络为什么能称霸计算机视觉领域？

卷积神经网络人工智能神经网络

来源: SigAI 作者: AI学习与实践平台导言在机器视觉和其他很多问题上，卷积神经网络取得了当前最好的效果，它的成功促使我们思考一个问题，卷积神经网络为什么会这么有效？在本文中，SIGAI将为大家分析卷积神经网络背后的奥秘。思想起源在各种深度神经网络结构中，卷积神经网络是应用最广泛的一种，它由LeCun在1989年提出[1]。卷积神经网络在早期被成功应用于手写字符图像识别[1][2][3]。2012年更深层次的AlexNet网络[4]取得成功，此后卷积神经网络蓬勃发展，被广泛用于各个领域，在很多

2018-07-20

6420

全球最全计算机视觉资料（1：入门学习|课程|综述|图书|期刊会议）

深度学习人工智能 https 自动化

目标检测和深度学习入门学习计算机视觉：让冰冷的机器看懂这个多彩的世界 by 孙剑 [http://www.msra.cn/zh-cn/news/features/computer-vision-2

2018-07-20

1.5K0

全球最全计算机视觉资料（5：图像和视频标注）

深度学习人工智能

目标检测和深度学习 Image Captioning m-RNN模型《 Explain Images with Multimodal Recurrent Neural Networks》 2014 [https://arxiv.org/pdf/1410.1090.pdf] NIC模型《Show and Tell: A Neural Image Caption Generator》2014 MS Captivator From captions to visual concepts and back 2

2018-07-20

4830

周志华最新演讲：深度学习为什么深？有多好的人才，才可能有多好的人工智能

深度学习人工智能

新智元报道演讲人：周志华【新智元导读】在昨天举行的2018京东人工智能创新峰会上，南京大学计算机系主任、人工智能学院院长周志华教授进行了题为《关于深度学习的思考》的主题演讲。周志华教授提出，人

2018-04-19

5620

深度学习的研究方向: 你会为AI转型么？

深度学习人工智能人脸识别

一. 人工智能应用领域 1. 计算机视觉生物特征识别：人脸识别、步态识别、行人ReID、瞳孔识别；图像处理：分类标注、以图搜图、场景分割、车辆车牌、OCR、AR；视频分析：安防监控、智慧城市； 2. 自然语言处理语音识别（Siri、Cortana、讯飞）、文本数据挖掘、文本翻译； 3. 数据挖掘消费习惯、天气数据、推荐系统、知识库（专家系统）； 4. 游戏角色仿真、AlphaGo（强化学习）； 5. 复合应用无人驾驶、无人机、机器人；

2018-04-18

8650

这个深度学习课程笔记，吴恩达也转了

深度学习人工智能

去年 6 月，吴恩达宣布 deeplearning.ai 创业项目，8 月，该项目揭晓：一套由5门课组成的深度学习系列课程——Deep Learning Specialization，旨在推广普及深度

2018-04-18

6850

重磅 | 今日头条&机器之心联合发布：斯坦福AI指数2017年度报告官方中文版

机器学习人工智能

机器之心发布机器之心编辑部、今日头条由斯坦福大学人工智能百年研究（AI100）推出的「人工智能指数」（AI Index）是一个追踪人工智能行业动态与发展的非营利性项目，其研究覆盖了百年以来人工智能的总体情况，目标是基于数据来推动人工智能的广泛交流和有效对话。2017 年，AI Index 推出了首份年度报告，从多个角度观察和解读了人工智能领域的动态和进展。经「人工智能指数」项目委员会授权，今日头条联合机器之心对此报告做了中文翻译（译文错误由翻译方负责），官方中文版报告近期正式发布。请点击阅读原文

2018-04-18

7640

点击加载更多

社区活动

腾讯技术创作狂欢月

“码”上创作 21 天，分 10000 元奖品池！

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态