腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
目标检测和深度学习
专栏成员
举报
261
文章
330951
阅读量
114
订阅数
订阅专栏
申请加入专栏
全部文章(261)
其他(75)
深度学习(69)
机器学习(44)
神经网络(40)
人工智能(36)
编程算法(32)
https(23)
github(20)
开源(16)
卷积神经网络(16)
模型(16)
图像识别(14)
python(11)
图像处理(10)
tensorflow(9)
git(9)
网络安全(9)
keras(8)
pytorch(8)
视频(8)
数据分析(6)
自动驾驶(5)
迁移学习(5)
大数据(5)
产品(5)
数据(5)
人脸识别(4)
数据挖掘(4)
企业(4)
工具(4)
工作(4)
行业(4)
NLP 服务(3)
http(3)
强化学习(3)
numpy(3)
数据处理(3)
openai(3)
语音(3)
swift(2)
html(2)
数据库(2)
文字识别(2)
游戏(2)
自动化(2)
无人驾驶(2)
erp(2)
监督学习(2)
windows(2)
agent(2)
百度(2)
测试(2)
互联网(2)
开发(2)
搜索(2)
系统(2)
区块链(1)
java(1)
javascript(1)
go(1)
嵌入式(1)
api(1)
matlab(1)
windows server(1)
语音合成(1)
电商(1)
医疗(1)
渲染(1)
云联网(1)
容器(1)
kubernetes(1)
分布式(1)
hashmap(1)
决策树(1)
scikit-learn(1)
微信(1)
小程序(1)
机器人(1)
架构设计(1)
nat(1)
腾讯云开发者社区(1)
特征工程(1)
图像分析(1)
教育(1)
项目管理(1)
code(1)
editor(1)
gpt(1)
编程(1)
程序员(1)
动画(1)
对象(1)
服务(1)
工程师(1)
工作流(1)
管理(1)
架构(1)
科技(1)
框架(1)
连接(1)
论文(1)
软件(1)
软件工程(1)
软件开发(1)
设计(1)
手机(1)
网络(1)
项目经理(1)
效率(1)
性能(1)
研发(1)
原理(1)
增强现实(1)
搜索文章
搜索
搜索
关闭
美图 CEO 吴欣鸿:两年 13 款 AI 应用背后的经验与教训
视频
电商
工具
工作流
设计
以美图发布的 AI 短片创作工具 MOKI 为例,它的诞生源于美图在制作视频大模型打样过程中发现的问题。视频大模型工作流拆解复杂,而美图具备解决其中很多能力的条件,于是将这些能力串联起来,以工程化的思路解决问题,推出了 MOKI。
朱晓霞
2024-07-24
150
0
字节跳动Seed-TTS:AI语音合成技术的革命
语音合成
游戏
模型
视频
语音
hi,小伙伴们,今天的主题是研究研究TTS,最近工作内容涉及到AI视频混剪,需要进行音色合成,看一下市面上效果好又花钱少的相对成熟技术薅羊毛!
朱晓霞
2024-07-12
376
0
AI会吞噬掉传统软件吗?
软件开发
教育
行业
互联网
软件
Chris Paik是纽约风险投资基金Pace Capital的创始人。他探讨了人工智能(AI)对软件行业的深远影响,并预测了软件开发方式和价值定位的加速变化。以下是文章的核心和重点总结:
朱晓霞
2024-06-17
90
0
一篇大模型Agent工具使用全面研究综述
效率
agent
工具
框架
模型
使用大型语言模型(LLMs)进行工具学习已成为增强LLMs能力以解决高度复杂问题的一个有希望的范式。尽管这一领域受到越来越多的关注和快速发展,但现有的文献仍然分散,缺乏系统性的组织,为新来者设置了进入障碍。因此对LLMs工具学习方面的现有工作进行全面调查,从两个主要方面展开:(1)为什么工具学习是有益的;(2)如何实现工具学习,以全面理解LLMs的工具学习。根据工具学习工作流程中的四个关键阶段对文献进行了系统性审查:任务规划、工具选择、工具调用和响应生成。
朱晓霞
2024-06-04
721
0
OpenAI Sora负责人最新万字干货深访 · 完整版+视频
openai
开发
模型
视频
数据
这篇文章是关于OpenAI Sora项目团队负责人的采访,链接🔗见文章末尾🔚,主要包括以下内容:
朱晓霞
2024-05-14
194
0
情感AI产品Hume.AI CEO Alan Cowen最新访谈视频(42分钟)
模型
视频
数据
语音
产品
一、Alan Cowen个人背景 1.UC Berkeley的心理学博士,在研究人类情感方面发表了40多篇论文。 2.在Google建立了情感计算团队。 情感计算是应用机器学习来理解情感行为。 由于没有足够大的数据,从上世纪60年代到2017年,心理学界普遍认为只有6种基本情绪。 2017年,Cowen首次将“数据驱动”引入情绪研究,提出“语义空间理论”,将情绪的维度扩展到27个,这是一种对情绪更深刻的认识。 3.情感计算的重点是获得“控制数据”(接受实验控制下产生的数据,比如呈现给被试特定的视频片段。与之相对的是自然数据,如互联网上直接收集到的数据)。 4.互联网上的数据是没有“情感标签”的,如果请专门的人士进行数据标注,会受到评注者种族、民族、性别、背景等影响,使标签失准。 比如,美国的标注者倾向于把大多数话语评价为积极的,哪怕这个话语实际上带有讽刺语气。 5.Google作为大型科技公司想要得到“控制数据”很难,因为公司有处理数据的规范,想要破例要面临法律审查、管理费用等困难。 Cowen为了获得“控制数据”在2016年离开了Google,创立了Hume AI。 有更大的自由,获得了海量的“控制数据”,并在这上面训练模型。 二、Hume的功能与目标
朱晓霞
2024-05-06
260
0
凯文凯利2024最新演讲:帮助人类成为更好的人类,是人工智能的最终目标
人工智能
企业
工程师
工作
增强现实
凯文凯利在其2024年的最新演讲中,深入探讨了人工智能(AI)的发展趋势以及它如何影响人类的未来。以下是对他演讲内容的总结:
朱晓霞
2024-04-26
227
0
昆仑万维方汉高质量访谈总结!!!
数据
企业
开源
行业
模型
以下内容是访谈总结,包括大模型对行业的影响、AIGC对内容创作的影响、大模型的商业化路径、技术发展、特定企业的战略定位以及其他市场观点。
朱晓霞
2024-04-26
134
0
产品:Sam Altman & OpenAI COO Brad Lightcap 最新专访
企业
openai
产品
工作
模型
最近OpenAi的老板们又公开露面参加访谈了,各大媒体也是争相报道。报道的内容我放在最后面了,分享一下我的笔记以及感悟。
朱晓霞
2024-04-19
184
0
Transformer作者公开承认参与Q*!|八位作者专访总结
研发
架构
论文
模型
搜索
二、Transformer的诞生背景与早期研发 1. 谷歌应对Siri挑战:2011年底,苹果Siri的问世引发谷歌高层对搜索业务的担忧,认为其可能分流谷歌搜索流量。为此,谷歌于2012年启动了一个旨在直接在搜索结果页提供问题答案的项目,这一需求催生了Transformer架构的研发。
朱晓霞
2024-03-27
173
0
"揭秘AI未来:强化学习之父Richard Sutton的AGI革命性路径大公开!"
模型
网络
强化学习
工作
连接
在人工智能的广阔天地中,强化学习作为连接理论与实践的重要桥梁,一直备受瞩目。Richard Sutton,这位被誉为“强化学习之父”的学者,以其深邃的见解和开创性的工作,为我们描绘了一幅通往人工通用智能(AGI)的宏伟蓝图。
朱晓霞
2024-03-25
310
0
全球首个AI程序员来了!超越GPT-4震撼硅谷!
工作
模型
软件工程
gpt
程序员
首个AI软件工程师一亮相,直接引爆整个科技圈。只需一句指令,它可端到端地处理整个开发项目。
朱晓霞
2024-03-15
180
0
一文带你了解AI虚拟数字人!
行业
模型
企业
渲染
服务
据艾媒咨询,2025年中国虚拟人市场规模预计达480.6亿元,用户群体主要为中型及小微型企业,产品需求量TOP5分别是电商、卫生、社会保障和社会福利业、教育、金融和运输业,主要产品类型为数字员工及定制化数字人。
朱晓霞
2024-03-14
8.3K
1
深入浅出熟悉OpenAI最新大作Sora文生视频大模型
数据
openai
行业
模型
视频
蠢蠢欲动,惴惴不安,朋友们我又来了,这个春节真的过的是像过山车,Gemini1.5 PRO还没过劲,OpenAI又放大招,人类真的要认输了吗,让我忍不住想要再探究竟,到底是什么让文生视频发生了质的跃迁,再次不仅止不住唏嘘,那些老板们辛辛苦苦创起来的业,恐怕又被降维打击了一波!
朱晓霞
2024-02-26
212
0
深入浅出了解谷歌「Gemini大模型」发展历程
测试
模型
视频
性能
语音
Google在2023年12月官宣了Gemini模型,随后2024年2月9日才宣布Gemini 1.0 Ultra正式对公众服务,并且开始收费。现在2024年2月14日就宣布了Gemini 1.5 Pro,史诗级多模态最强MoE首破100万极限上下文纪录!!!Gemini 1.5 Pro在数学、科学和推理方面的表现比Gemini 1.0 Ultra提高了28.9%,在多语言方面提高了22.3%,在编码方面提高了8.9%。此外,在视频理解和音频方面也取得了显著进步。不得不说这技术速度已经有点量级了,让我仍不住想要扒一扒Gemini的爆火路径!
朱晓霞
2024-02-26
894
0
达沃斯Sam Altman总结
对象
互联网
模型
手机
数据
c)模型的“悟性”在提高,过去的高质量训练建立了对世界运行原理的底层“相关性”,未来不需要那么多数据,质量更重要。
朱晓霞
2024-01-29
125
0
一款国产编程神器,秒杀了微软GitHub Copilot。
github
code
编程
开发
模型
代码自动补全、自然语言生成代码、自动添加注释、智能bug查找、解释代码、自动生成单元测试等等。
朱晓霞
2024-01-17
1.6K
0
产品体验|AI视频生成产品新体验
数据分析
测试
产品
工具
视频
效果不错,可自动判断需要出现动态的位置,并且自动判断应该如何运动动。同时也不会产生涉及到复杂的内容(比如人脸)的时候画面崩坏的问题,非常稳定。
朱晓霞
2023-11-27
169
0
从第一性原理解读大模型Agent技术
人工智能
agent
模型
系统
原理
本文讲述了从大型人工智能模型到智能体的转变,强调了核心概念和技术进展的重要性。文章中的图表对于理解这些复杂概念至关重要,它们不仅简洁而且包含了关键信息,这使得文章成为一个值得收藏的资源。 技术脉络从“Prompt工程”开始,这是AI领域的一个基本概念,指的是如何有效地构造和使用提示词(Prompt)来引导AI模型生成期望的输出。随后发展到“Prompt Chain或Flow”,这进一步细化了Prompt工程,涉及如何将多个提示词串联起来,形成一个流程,以指导AI完成更复杂的任务。 进一步地,文章讨论了“Agent”概念的发展,这指的是一个能够自主行动并且进行决策的智能实体。这些智能体可以是单独操作的,也可以是多个智能体协同工作。多Agent系统在处理复杂任务和环境中显得尤为重要,因为它们可以协作,共享信息和资源,从而提高整体性能和效率。 文章还提到了“提示词万能公式”,这是一种构造有效AI提示词的方法,包括角色、角色技能、任务核心关键词、任务目标、任务背景、任务范围、任务解决与否判定、任务限制条件以及输出格式/形式和输出量。这种公式的目的是为了最大化AI的效能和准确性。
朱晓霞
2023-11-27
1K
0
两款典型的AI工具:Magic editor 和Genmo AI
人工智能
editor
动画
工具
视频
谷歌相册新推出的Magic Editor图片编辑功能,是一款集成了人工智能生成内容(AIGC)的前沿产品。与传统修图应用相比,谷歌相册在几个关键方面展现出其独特优势: 1. **多图处理**:谷歌相册能够处理一系列类似照片中的问题,而普通修图应用通常只能一次处理一张图片。 2. **突出修复**:相册专注于修复明显的问题,而传统修图工具则更侧重于细致的编辑。 Google Photo的AI切入点: 1. **最佳表情提取**:这项功能可以从多张相似照片中挑选出人物的最佳表情,并将其融合到当前照片中,极大地提高合照的质量。 2. **先进的消除笔**:传统消除笔在处理复杂对象时可能力不从心,而AIGC技术则大大提升了这一功能的效率和准确度。 3. **物体移动与缩放**:包括精准抠图和背景填充。 4. **声音降噪**:支持声音解析为多声道,并能处理不同声道,以提高音频质量。 5. **模糊变清晰**:这是某些应用的特色功能,也被Google Photo所采纳。 总的来说,谷歌相册的Magic Editor为图片编辑带来了革命性的变化,它不仅提高了编辑效率,还扩展了创作的可能性。对于追求完美合照和高质量图片编辑的用户来说,这无疑是一项值得尝试的强大工具。
朱晓霞
2023-11-23
599
0
点击加载更多
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
立即查看
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档