首页
学习
活动
专区
工具
TVP
发布

AI科技评论

专栏作者
4092
文章
3382403
阅读量
184
订阅数
中科院 AI 团队最新研究发现,大模型可通过自我验证提高推理性能
最近的大型语言模型(Large language mode,LLM)正在变得越来越擅长推理,背后的一个关键技术是思维链(chain-of-thought,CoT),简单来说,CoT 可以让 LLM 模拟人类思考的过程,帮助大型语言模型生成一个推理路径,将复杂的推理问题分解为多个简单的步骤,而不仅仅只是一个最终答案,从而增强模型的推理能力。
AI科技评论
2023-01-03
1.6K0
CVPR 2022丨学习用于小样本语义分割的非目标知识
由于全卷积网络(Fully Convolutional Network, FCN)架构的快速发展,深度学习在语义分割方面取得了里程碑式的进展。大多数方法采用全监督学习方案,需要大量带注释的数据进行训练。尽管它们可以实现良好的性能,但它们数据饥渴的性质需要大量的像素级图像标注。 为了缓解这一问题,特斯联首席科学家邵岭博士及团队,提出了一个用于小样本语义分割的框架,在给定少量像素级标注的支持集(Support)图像的情况下,分割查询集(Query)图像中的目标物体。相关研究成果已于2022年CVPR发表,题为《
AI科技评论
2022-07-07
9330
CVPR 2022 最佳论文候选 | PIP: 6个惯性传感器实现全身动捕和受力估计
本文提出了一个基于物理的稀疏惯性动捕和人体受力估计方案:Physical Inertial Poser (PIP)。仅使用6个惯性传感器(Inertial Measurement Unit,IMU),该方案可以实时捕捉符合真实世界物理规律的人体运动,关节受力、以及地面作用力等信息。 该系统可以在CPU上以60fps的速度运行,算法延迟只有16毫秒,相比前人工作在公开数据及上达到了最高的姿态估计精度、动作平滑性、以及最低的系统延迟,并且首次实现了基于稀疏惯性传感器的人体受力估计。通过引入物理优化,该方案大幅提
AI科技评论
2022-07-07
1.9K0
520王海峰在线「告白」:我们与飞桨的感情又进了一步
作者 | 西西 编辑 | 陈彩娴 万万没想到,我居然会跟王海峰「一起过」520! 今天,「WAVE SUMMIT深度学习开发者峰会」在线召开,百度CTO王海峰发表演讲,表示「飞桨将助力人工智能变得越来越普惠」。 2019年,在第一届Wave Summit深度学习开发者峰会上,王海峰提出,深度学习具有很强的通用性,并具备标准化、自动化和模块化的工业大生产特征,推动人工智能进入工业大生产阶段。如今,三年过去,王海峰的说法得到了验证——如今深度学习的应用已经越来越广泛,遍地开花。 数据显示,截至2022年5月,飞
AI科技评论
2022-05-23
3950
多模态视频理解模型新标杆!微软黄学东团队发布 i-Code
黄学东领衔,微软 Azure 认知服务研究团队重磅发布「视觉-语言-语音」多模态预训练模型 i-Code。在 5 项多模态视频理解任务以及 GLUE NLP 任务上树立了业界新标杆! 编译丨OGAI 编辑丨陈彩娴 人类的智能涉及多个模态:我们整合视觉、语言和声音信号,从而形成对世界全面的认识。然而,目前大多数的预训练方法仅针对一到两种模态设计。 在本文中,我们提出了一种多模态自监督预训练框架「i-Code」,用户可以灵活地将视觉、语音和语言的形式组合成统一的通用的向量表征。在该框架下,我们首先将各个模态的
AI科技评论
2022-05-12
7110
只需要十分之一数据,就能通关四大视觉任务,居然还开源了!
OpenGVLab开源超高性能预训练模型,节省90%数据量!分类、目标检测、语义分割、深度估计,四大任务一网打尽! 作者丨吴彤 编辑丨陈彩娴 Github链接:https://github.com/opengvlab 家人们,你们有没有这种苦恼? 搬一次家就换一次家具,那些又贵又重的家具既不好搬运,又不好全部带走。 下一次又重新购置一遍家具,浪费钱不说,关键是来来回回都做一样的事情!家具还没用过几次,利用率不高呀! 这种搬家的苦恼,就好比AI领域,做几个任务就需要开发几个高度定制的模型,不仅所需的数据采
AI科技评论
2022-05-06
3390
DALL-E 2的工作原理原来是这样!
CLIP+修改版GLIDE双管齐下。 作者 | Ryan O'Connor 编译丨王玥 编辑 | 陈彩娴 OpenAI的模型DALL-E 2于本月初发布,刚一亮相,便在图像生成和图像处理领域卷起了新的风暴。 只需要给到寥寥几句文本提示,DALL-E 2就可以按文本指示生成全新图像,甚至能将毫不相关的物体以看似合理的语义方式组合在一起。 比如用户输入提示“一碗汤是另一个次元的入口”后,DALL-E 2便生成了以下的魔幻图片。 “一碗汤是另一个次元的入口” 图源:https://openai.com/dal
AI科技评论
2022-04-21
1.1K0
旷视数字感知新品解读:“算法定义硬件”才是硬道理
4月13日,以“视界无疆·空间共生”为主题的2022旷视企业业务合作伙伴大会于线上召开。会上,旷视向业界阐述了企业业务未来的发展方向,重磅发布了面向企业业务的空间数字化产品战略、数字感知系列新品,并发起“AIoT生态合伙人计划”,致力携手更多合作伙伴共同开拓AIoT新蓝海。 1 用算法定义硬件,旷视空间数字化产品战略发布 无论是企业还是组织,实现不同空间的数字化均面临着应用场景繁多、需求高度碎片化等痛点,为了适应各类AI需求场景,满足蓬勃的感知应用生态,企业/组织亟需构建一套完整的“标准硬件+海量算法”的数
AI科技评论
2022-04-14
4390
如何通向“广义人工智能”?LSTM 提出者之一Sepp Hochreiter:将符号 AI 与神经 AI 相结合
作者 | Sepp Hochreiter 解读 | Antonio 编辑 | 陈彩娴 人类包含意识、认知、决策等等在内的智慧能力,似乎从人类有记录的那一刻起,就吸引着无数哲学家的思索。与之类似,从AI诞生的那一刻,科学家们则在憧憬:AI 如何能够达到像人类一样的智能? 近期,LSTM 提出者和奠基者,奥地利人工智能高级研究所(IARAI)创始人,曾获得IEEE CIS 2021 年神经网络先驱奖(Neural Networks Pioneer Award)的Sepp Hochreiter教授在《ACM通讯》
AI科技评论
2022-04-12
5150
在Scaling Transformers用稀疏性就足够了!“有了这样的研究,我们以后或许能在笔记本电脑上托管 GPT-3”
大型模型在许多任务上都产生了令人印象深刻的结果,但是训练和微调的成本很高,而且解码速度过慢,以至于研究和使用难度提升。华沙大学,谷歌研究和OpenAI的学者们通过利用稀疏性来解决这个问题。他们研究了模型中所有层级的稀疏变量,并提出了下一代Transformer模型族-Scaling Transformers。 作者|郑宇宏 编辑|陈彩娴 1 Scaling Transformers: 让大型语言模型更易于管理 近年来,基于Transformer架构的大型神经网络,自然语言处理领域取得了巨大的进步。前几年在R
AI科技评论
2022-03-28
5070
万门大学创始人疑似跑路,回顾创业路处处是雷,在线AI课程也在重灾区
作者丨钱磊 编辑丨陈彩娴 3月22日凌晨,万门大学开始解散VIP学员群,学员在睡梦中就被踢出群,醒来发现人去群空一头雾水。 而万门教育的员工不曾收到任何公司变动的通知,也未能按时收到应得的工资。 一切情况归纳到一起,都指向了如今网友十分熟悉的“跑路”二字。 1 “中国第一所网络大学” 其实在疑似跑路前135天,其创始人童哲还在知乎分享了自己的创业心境,他称“早在七年前(2014年)的万门大学商业计划书里面,我就大言不惭地写上了【降低中国教育门槛】的誓言,以及不管你信不信笑不笑都会去用一生实现的目标。”
AI科技评论
2022-03-24
4820
北大邹月娴:视觉-语言预训练模型演进及应用
作者丨邹月娴整理 | 维克多 编辑 | 青暮 预训练模型在自然语言处理和计算机视觉领域引起了学术界和工业界的广泛关注。利用大规模无监督数据进行训练的预训练模型有着非常好的泛化性,只需在小规模标注数据上进行微调,就可以在相应任务上有所提高。但相关研究的进展如何?还有哪些问题需要进一步探索? 2021年12月16日,北京大学深圳研究生院党委副书记、教授、博士生导师、北京大学现代信号与数据处理实验室主任邹月娴在中国计算机大会(CNCC 2021)“产业共话:大型预训练模型的商业应用及技术发展方向”论坛上,做了《视
AI科技评论
2022-03-03
6180
与Jeff Dean聊ML for EDA,最佳论文花落伯克利:EDA顶级会议DAC 2021 精彩回顾
12月9日,第58届EDA首要会议DAC(Design Automation Conference)的线下部分在旧金山落下帷幕,此次会议为期五天。
AI科技评论
2021-12-22
6540
斯坦福大学将差分隐私AI模型训练提速10倍,将用于新冠医学影像
更快、更早地诊断疾病、开发定制化药物和研制新药:人工智能在医疗领域具有巨大的潜力,可以显著改善患者的治疗效果、挽救生命,并帮助全球人类保持健康和延长寿命。
AI科技评论
2021-11-05
4160
提词优化器“琥珀”带你用好CLIP!视觉-语言表征学习新进展
📷 AI科技评论报道 是否还在为设计CLIP模型的提词器(prompt)而烦恼😣?到底是“a photo of a [class]”还是“a [class] photo”🤨?对于特定任务(例如食物分类或是卫星图像识别),如何添加符合语境的上下文(context)🤔?用了本文提出的提词优化器CoOp(中文名:琥珀),这些问题通通不需要烦恼🤩。 📷 文章链接:https://arxiv.org/abs/2109.01134 代码链接:https://github.com/KaiyangZhou/CoOp 结合
AI科技评论
2021-10-11
5290
2021年加拿大皇家科学院院士名单出炉!杨强等4位华人学者入选
当地时间9月7日消息,加拿大皇家科学院(Royal Society of Canada)公布了2021年新增院士名单。
AI科技评论
2021-09-16
7890
DeepMind用神经网络求解MIP后,攻破运筹学只是时间问题?你想多了
Google的DeepMind团队最近官宣了一篇神经网络(Neural Networks)求解MIP论文。一石激起千层浪,在国内外的运筹优化社群引起了讨论。
AI科技评论
2021-08-24
8670
还在满足“小池塘”模拟?这篇图形学论文征服了汪洋大海!UBC博士:一起来“整”个世界
而诸如洪水、烟雾、爆炸等特效计算的背后,实际上是用计算机程序在求解已有百年历史的“纳维-斯托克斯方程”:
AI科技评论
2021-08-24
4100
自动化所研发全球首个图文音三模态预训练模型,让AI更接近人类想象力!
7月9日,中国科学院自动化研究所所长徐波在2021世界人工智能大会(WAIC2021)上就人工智能的最新进展进行报告,发布了自动化所研发的三模态预训练模型—“紫东太初”。他表示,多模态预训练模型被广泛认为是从限定领域的弱人工智能迈向通用人工智能路径的探索。
AI科技评论
2021-07-27
5450
随身携带的动捕系统!基于稀疏惯性传感器的实时人体动作捕捉 | SIGGRAPH 2021
本文是对发表于计算机图形学顶级会议SIGGRAPH 2021 的论文《 TransPose: Real-time 3D Human Translation and Pose Estimation with Six Inertial Sensors 》的解读。
AI科技评论
2021-05-19
3K0
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档