首页
学习
活动
专区
工具
TVP
发布

目标检测和深度学习

专栏作者
252
文章
303140
阅读量
114
订阅数
从第一性原理解读大模型Agent技术
本文讲述了从大型人工智能模型到智能体的转变,强调了核心概念和技术进展的重要性。文章中的图表对于理解这些复杂概念至关重要,它们不仅简洁而且包含了关键信息,这使得文章成为一个值得收藏的资源。 技术脉络从“Prompt工程”开始,这是AI领域的一个基本概念,指的是如何有效地构造和使用提示词(Prompt)来引导AI模型生成期望的输出。随后发展到“Prompt Chain或Flow”,这进一步细化了Prompt工程,涉及如何将多个提示词串联起来,形成一个流程,以指导AI完成更复杂的任务。 进一步地,文章讨论了“Agent”概念的发展,这指的是一个能够自主行动并且进行决策的智能实体。这些智能体可以是单独操作的,也可以是多个智能体协同工作。多Agent系统在处理复杂任务和环境中显得尤为重要,因为它们可以协作,共享信息和资源,从而提高整体性能和效率。 文章还提到了“提示词万能公式”,这是一种构造有效AI提示词的方法,包括角色、角色技能、任务核心关键词、任务目标、任务背景、任务范围、任务解决与否判定、任务限制条件以及输出格式/形式和输出量。这种公式的目的是为了最大化AI的效能和准确性。
朱晓霞
2023-11-27
5500
两款典型的AI工具:Magic editor 和Genmo AI
谷歌相册新推出的Magic Editor图片编辑功能,是一款集成了人工智能生成内容(AIGC)的前沿产品。与传统修图应用相比,谷歌相册在几个关键方面展现出其独特优势: 1. **多图处理**:谷歌相册能够处理一系列类似照片中的问题,而普通修图应用通常只能一次处理一张图片。 2. **突出修复**:相册专注于修复明显的问题,而传统修图工具则更侧重于细致的编辑。 Google Photo的AI切入点: 1. **最佳表情提取**:这项功能可以从多张相似照片中挑选出人物的最佳表情,并将其融合到当前照片中,极大地提高合照的质量。 2. **先进的消除笔**:传统消除笔在处理复杂对象时可能力不从心,而AIGC技术则大大提升了这一功能的效率和准确度。 3. **物体移动与缩放**:包括精准抠图和背景填充。 4. **声音降噪**:支持声音解析为多声道,并能处理不同声道,以提高音频质量。 5. **模糊变清晰**:这是某些应用的特色功能,也被Google Photo所采纳。 总的来说,谷歌相册的Magic Editor为图片编辑带来了革命性的变化,它不仅提高了编辑效率,还扩展了创作的可能性。对于追求完美合照和高质量图片编辑的用户来说,这无疑是一项值得尝试的强大工具。
朱晓霞
2023-11-23
4740
目标检测入门(三):基础网络演进、分类与定位的权衡
从此篇开始,我们对近几年检测领域的工作提供一个概览,并试图从中归纳出一些趋势。由于篇幅和视野所限,文章不会求全,相对注重思路的演进,淡化实验结果的报告。事实上,我们并没有看到这一任务上的"The Best Paper"和"The Final Paper",现阶段的工作远远没有到解决这一问题的程度,深度学习模型也仍然是非常年轻的研究领域。
朱晓霞
2022-03-04
3650
目标检测的性能上界讨论
发现了最近 arxiv 上的一篇文章 Empirical Upper-bound in Object Detection and More,作者们在多个数据集上探讨了多种检测器所能达到的性能上限,颇有当年 Speed/accuracy trade-offs for modern convolutional object detectors 的风采。“目标检测还有什么能做的?”这个问题确实很令人迷茫,但自己今后仍然会密切关注这个方向,希望能和这篇文章一样,为大家带来一些启发。
朱晓霞
2020-02-25
8900
比Tiny YOLOv3小8倍,性能提升11个点,4MB的网络也能做目标检测
目标检测在计算机视觉领域是一个活跃的研究分支,而深度学习已经成为这一领域最前沿也是最成功的解决方案。但是,在边缘和移动设备中广泛部署神经网络模型需要大量的计算算力和内存。因此,近来研究领域主要在解决适合以上设备的神经网络。
朱晓霞
2019-10-21
5740
谷歌大脑提出:基于NAS的目标检测模型NAS-FPN,超越Mask R-CNN
谷歌大脑的Quoc Le团队,用神经网络架构搜索 (NAS) ,发现了一个目标检测模型。长这样:
朱晓霞
2019-06-14
1.5K0
CVPR2019 论文解读汇总(包括目标检测、姿态估计、语义分割等,更新中)
1、CVPR2019 | Guided Anchoring: 物体检测器也能自己学 Anchor 物体检测领域论文"Region Proposal by Guided Anchoring"解读,这篇 paper 的方法用在了 COCO Challenge 2018 检测任务的冠军方法中,在极高的 baseline 上涨了1个点。论文目前已被CVPR2019接收。
朱晓霞
2019-05-21
9.7K0
目标检测训练trick超级大礼包—不改模型提升精度,值得拥有
下图展示了使用此trick大礼包训练Faster RCNN和YOLOv3之后,获得的精度增益,相同的算法最多竟有+4.0%AP的增长!
朱晓霞
2019-05-17
1.9K0
完美代替传统卷积!Facebook等提出全新卷积操作OctConv,速度接近理论极限
近日,Facebook AI、新加坡国立大学、360 人工智能研究院的研究人员提出一种新的卷积操作 ——Octave Convolution (OctConv)。
朱晓霞
2019-05-13
7020
CVPR 2019 | 天秤座R-CNN:全面平衡的目标检测器
这是一篇浙江大学和香港中文大学发表于 CVPR 2019 的论文,这篇文章十分有趣,网友戏称:“无痛涨点,实现简单,良心 paper”,在我看来确实是这样的,没有太大的改造结构,不需增加计算成本的条件下,居然能涨两个点 mAP。
朱晓霞
2019-05-13
6010
五大维度深入分析计算机视觉
众所周知,人工智能(Artificial Intelligence)正在改变我们的工作方式及认知。不过,对人工智能一知半解,和成为真正的人工智能工程师之间,还是有一条很宽的鸿沟的。对于想进入AI领域的同学,第一步就是要了解目前人工智能产业的结构体系。
朱晓霞
2019-01-02
8280
2019人工智能学术会议列表
2018 年已经过去了 66% 左右,ACL、CVPR、ICML、ICLR 等学术会议也已经开完,众多学术圈的朋友们如今可能都在为 NIPS 2018 论文 rebuttal 而奋战,但是不是更多的人在为 2019 年的学术论文而做准备?
朱晓霞
2018-08-22
9420
挑战赛 | 京东AI时尚挑战赛
随着中国时尚消费市场的扩大和AI技术在中国消费领域的普及,AI+Fashion正在对时尚行业产生重大影响。在AI技术促进和改善时尚相关购物体验的技术不断涌现的同时,相关技术仍然面临重重挑战。
朱晓霞
2018-07-23
5710
重磅!卷积神经网络为什么能称霸计算机视觉领域?
来源: SigAI 作者: AI学习与实践平台 导言 在机器视觉和其他很多问题上,卷积神经网络取得了当前最好的效果,它的成功促使我们思考一个问题,卷积神经网络为什么会这么有效?在本文中,SIGAI将为大家分析卷积神经网络背后的奥秘。 思想起源 在各种深度神经网络结构中,卷积神经网络是应用最广泛的一种,它由LeCun在1989年提出[1]。卷积神经网络在早期被成功应用于手写字符图像识别[1][2][3]。2012年更深层次的AlexNet网络[4]取得成功,此后卷积神经网络蓬勃发展,被广泛用于各个领域,在很多
朱晓霞
2018-07-20
6420
全球最全计算机视觉资料(1:入门学习|课程|综述|图书|期刊会议)
目标检测和深度学习 入门学习 计算机视觉:让冰冷的机器看懂这个多彩的世界 by 孙剑 [http://www.msra.cn/zh-cn/news/features/computer-vision-2
朱晓霞
2018-07-20
1.5K0
全球最全计算机视觉资料(5:图像和视频标注)
目标检测和深度学习 Image Captioning m-RNN模型《 Explain Images with Multimodal Recurrent Neural Networks》 2014 [https://arxiv.org/pdf/1410.1090.pdf] NIC模型 《Show and Tell: A Neural Image Caption Generator》2014 MS Captivator From captions to visual concepts and back 2
朱晓霞
2018-07-20
4830
周志华最新演讲:深度学习为什么深?有多好的人才,才可能有多好的人工智能
新智元报道 演讲人:周志华 【新智元导读】在昨天举行的2018京东人工智能创新峰会上,南京大学计算机系主任、人工智能学院院长周志华教授进行了题为《关于深度学习的思考》的主题演讲。周志华教授提出,人
朱晓霞
2018-04-19
5620
深度学习的研究方向: 你会为AI转型么?
一. 人工智能应用领域 1. 计算机视觉 生物特征识别:人脸识别、步态识别、行人ReID、瞳孔识别; 图像处理:分类标注、以图搜图、场景分割、车辆车牌、OCR、AR; 视频分析:安防监控、智慧城市; 2. 自然语言处理 语音识别(Siri、Cortana、讯飞)、文本数据挖掘、文本翻译; 3. 数据挖掘 消费习惯、天气数据、推荐系统、知识库(专家系统); 4. 游戏 角色仿真、AlphaGo(强化学习); 5. 复合应用 无人驾驶、无人机、机器人;
朱晓霞
2018-04-18
8650
这个深度学习课程笔记,吴恩达也转了
去年 6 月,吴恩达宣布 deeplearning.ai 创业项目,8 月,该项目揭晓:一套由5门课组成的深度学习系列课程——Deep Learning Specialization,旨在推广普及深度
朱晓霞
2018-04-18
6850
重磅 | 今日头条&机器之心联合发布:斯坦福AI指数2017年度报告官方中文版
机器之心发布 机器之心编辑部、今日头条 由斯坦福大学人工智能百年研究(AI100)推出的「人工智能指数」(AI Index)是一个追踪 人工智能行业动态与发展的非营利性项目,其研究覆盖了百年以来人工智能的总体情况, 目标是基于数据来推动人工智能的广泛交流和有效对话。2017 年,AI Index 推出了首份年度报告,从多个角度观察和解读了人工智能领域的动态和进展。 经「人工智能指数」项目委员会授权,今日头条联合机器之心对此报告做了中文翻译(译文错误由翻译方负责),官方中文版报告近期正式发布。 请点击阅读原文
朱晓霞
2018-04-18
7640
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档