首页
学习
活动
专区
工具
TVP
发布

相约机器人

专栏成员
664
文章
1095978
阅读量
52
订阅数
Deepmind 推出 Flamingo:用于多模态机器学习研究的开放式单一视觉语言模型 (VLM)
智力衡量一个人仅使用几条简单指令就能多快适应新环境。尽管两者之间存在对比,但孩子们可能会在看到书中动物的几张照片后认出动物园里真正的动物。另一方面,典型的视觉模型还不能反映这种人类智力水平。需要接受数以万计已为该任务明确注释的示例的训练。如果目标是对图像中的动物进行计数和识别,例如“三只斑马”,则必须收集数千张照片,并用它们的数量和物种注释每张图像。每次面对新工作时都需要训练新模型是最主要的缺点,这使得该过程效率低下、成本高昂。
代码医生工作室
2022-06-07
2.2K0
来自 CMU 和 LinkedIn 的研究人员开源了 PASS(性能自适应采样策略)在深度学习中的实施
实体关系多次使用图表以各种方式描述。例如,专业图表显示人们如何协作,而社交图表显示人们如何相互联系。
代码医生工作室
2022-04-14
5430
CMU 研究人员开源“PolyCoder”:具有 2.7B 参数的基于机器学习的代码生成器
语言模型 (LM) 通常用于自然语言文献中,以将概率分配给标记序列。LM 最近在用编程语言编写的源代码建模方面表现出出色的性能。这些模型特别擅长代码完成和从自然语言描述生成代码等工作。对于基于 AI 的编程支持,当前最先进的代码大语言模型已显示出巨大的改进。其中最大的模型之一 Codex 已被实现为 IDE 内的开发人员助手,可根据用户的上下文在真实世界的生产工具 GitHub Copilot 中自动编写代码。
代码医生工作室
2022-04-14
1.5K0
加州大学伯克利分校的研究人员推出了一种新的基于能力的算法,称为对比内在控制 (CIC),用于无监督技能发现
在存在外在奖励的情况下,深度强化学习 (RL) 是处理复杂控制任务的强大策略。玩像素视频游戏、掌握围棋游戏、机器人移动性和灵巧的操纵策略都是成功应用的例子。
代码医生工作室
2022-04-14
6150
UT Austin 研究人员展示了一种基于 MRI 数据集实现高质量图像重建的深度学习技术
在磁共振成像 (MRI) 扫描期间,对于许多人来说,时间似乎是静止的。那些经历过的人都明白,在嗡嗡作响的扫描仪内保持不动不动的困难,时间从几分钟到一个多小时不等。
代码医生工作室
2022-03-07
6090
AlphaCode来了!谷歌的DeepMind创造出相当于普通程序员的AI
为不可预见的问题创造解决方案是人类智能的第二天性——这是基于经验的批判性思维的结果。机器学习社区在生成和理解文本数据方面取得了巨大进步,但进步仍然局限于相对简单的数学和编程问题,或者检索和复制现有解决方案。
代码医生工作室
2022-03-07
5970
百度和PCL团队推出ERNIE 3.0 Titan:2600亿参数的预训练语言模型
随着最近人工智能的突破,人类越来越依赖人工智能来解决现实世界的问题。这使得人类学习和运用知识的能力与计算机一样重要。人类通过学习和经验来学习和收集信息,以了解周围环境中的一切。随着知识库的增长,理解和解决问题以及区分事实与荒谬的能力也会增加。然而,人工智能系统缺乏这样的知识,限制了它们适应非典型问题数据的能力。
代码医生工作室
2022-01-08
2.4K0
加州大学伯克利分校研究人员推出无监督强化学习基准 (URLB)
强化学习 (RL) 是一种强大的人工智能范式,用于处理各种问题,包括自动驾驶汽车控制、数字助理和资源分配等。然而即使是当今最好的 RL 代理也很窄。目前大部分 RL 算法只能解决他们所训练的单一工作,没有跨任务或跨域泛化能力。
代码医生工作室
2021-12-29
5620
AI 研究人员提出“GANgealing”:一种 GAN 监督的算法,可以学习输入图像的变换,使它们更好地进行联合对齐
它被认为是光流、3D 匹配和医学成像中的关键元素,仅举几个例子;它还影响跟踪和增强现实。
代码医生工作室
2021-12-13
6240
研究人员推出“PERSIA”:一种基于 PyTorch 的系统,用于训练多达 100 万亿个参数的大规模深度学习推荐模型
基于深度学习的模型主导了生产推荐系统的当代格局。现代推荐系统提供了大量实际应用。由于规模不断扩大的深度神经网络模型,它们取得了令人难以置信的进步。
代码医生工作室
2021-12-09
4290
Hugging Face 推出“数据集”:用于自然语言处理 (NLP) 的轻量级社区库
随着研究人员提出新的目标、更大的模型和独特的基准,公开可用的 NLP(自然语言处理)数据集的规模、种类和数量迅速扩大。精选数据集用于评估和基准测试;监督数据集用于训练和微调模型;预训练和语言建模需要大量的无监督数据集。除了注释方法之外,每个数据集类型都有不同的规模、粒度和结构。
代码医生工作室
2021-11-16
1.1K0
Facebook AI 推出“SaLinA”:一个用于实现包括强化学习算法在内的顺序决策模型的轻量级库
深度学习库非常适合促进复杂可微函数的实现。这些函数通常具有 f(x) → y 之类的形状,其中 x 是一组输入张量,y 是通过对这些输入执行多次计算而产生的输出张量。为了实现一个新的 f 函数并创建一个新的原型,需要通过组合运算符组装各种块(或模块)。尽管过程简单,但这种方法无法处理顺序决策方法的实现。经典平台非常适合以有效的方式管理信息的获取、处理和转换。
代码医生工作室
2021-10-21
4950
突破 PyTorch、TensorFlow 并行瓶颈的开源训练加速框架到底是啥?
随着摩尔定律的失效,单个计算单元的能力已经远远无法满足数据的指数级增长。比如,快手每天上传的新视频超过千万条,即便训练简单的分类模型(比如 ResNet),使用单机单卡的算力,训练快手日内新增视频都需要超过一百天的时间。因此,在数据爆炸性增长的互联网行业,多机多卡的并行训练成为了大数据时代的必然。随着深度学习模型功能的日益强大,分布式训练任务的通信成本和所需算力也随之急剧增长。
代码医生工作室
2021-10-19
4790
GitHub 的AI代码生成神器,其四成代码有漏洞,你还敢用吗
日前,研究人员发现,GitHub Copilot 工具提供的代码建议中 有接近 40% 存在 bug。为了对 Copilot 的实际价值做出量化,研究人员创建了 89 个测试场景以考查其代码建议质量,编写出了 1600 多个程序。经过全面审查,研究人员发现其中近四成存在安全漏洞。
代码医生工作室
2021-09-29
1.1K0
一项新的谷歌人工智能研究使用自我监督学习发现异常数据
一类分类有利于异常检测。它通过假设训练数据都是正态示例来确定实例是否与训练数据属于同一分布。但是,表示学习不适用于这些旧方法。此外,自监督学习在从未标记数据中学习视觉表示方面取得了重大进展,包括旋转预测和对比学习。
代码医生工作室
2021-09-29
8270
选择机器学习模型,要注意这7个问题
本文最初发表于 Towards Data Science 博客,经原作者 Santiago Valdarrama 授权,InfoQ 中文站翻译并分享。
代码医生工作室
2021-09-08
2800
DeepMind 开源感知器 IO,一种通用深度学习模型架构,可处理广泛的数据和任务
最近DeepMind 开源了 Perceiver IO——一种通用的深度学习模型架构,可以处理许多不同类型的输入和输出。这种 Transformers 的“插入式”替代品足够强大,可以在不受领域知识限制的情况下超越基线模型。
代码医生工作室
2021-09-08
9120
MIT、Microsoft 和 Allen AI 开源一套 AI 编程谜题(P3:Python 编程谜题)
AI 中的编程竞赛问题可用于评估程序员处理人工任务的能力并测试当前算法的边界。因此来自麻省理工学院、微软研究院和艾伦人工智能研究所的一个研究团队开源了 Python 编程谜题 (P3)。P3是一款全新的编程挑战套件 ,可以捕捉谜题的本质,用于教授和评估人工智能编程的熟练程度。
代码医生工作室
2021-07-16
6150
IBM 开源“CodeFlare”,这是一种将 AI 工作流简化到混合云的机器学习框架
数据和机器学习分析正变得越来越普遍,但随着需要大量时间进行配置的更大数据集,它们变得越来越复杂。研究人员实际花在数据科学上的时间比更新系统要少,这有时可能会很困难。
代码医生工作室
2021-07-16
5780
康奈尔大学和 NTT Research 推出物理神经网络 (PNN):一种利用反向传播算法用于任意物理系统的通用框架
DNN(深度神经网络)已被证明在解决图像和语音识别以及 NLP 中的各种复杂问题方面非常有用。DDN 现在正在进入实际的物理世界。DNN 与物理过程之间的相似性,例如层次结构、近似对称性、冗余和非线性,表明 DNN 可用于处理来自物理环境的数据。
代码医生工作室
2021-06-15
1.4K0
点击加载更多
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档