首页
学习
活动
专区
工具
TVP
发布

相约机器人

专栏成员
664
文章
1095988
阅读量
52
订阅数
研究人员提出“LViT”,一种利用文本医学报告改进分割的语言视觉模型
在深度学习在医疗保健领域的众多应用中,细分无疑是研究最多的领域之一,因为它可能带来广泛的优势。
代码医生工作室
2022-11-17
1K0
Meta AI 的研究人员创建了用于对象识别的“OMNI3D”数据集和可以推广到看不见的图像的“Cube R-CNN”模型
长期以来计算机视觉一直难以从单个图像中理解对象及其特征,这一主题在机器人技术、辅助技术和 AR/VR 中都有应用。3D 对象识别问题提出了与从 2D 视觉输入中感知 3D 事物相关的新挑战。近十年来大规模数据集帮助 2D 对象识别在预测和定位 2D 图片网格上的项目方面取得了重大进展。另一方面世界是在三个维度中三维构建的。在这里目标是创建一个紧密定向的 3D 边界框,用于估计图片中每个项目的 3D 位置和范围。
代码医生工作室
2022-11-17
5090
微软最新机器学习研究引入 μTransfer:一种新技术,仅使用 7% 的预训练计算即可调整 67 亿参数的 GPT-3 模型
科学家们进行试错程序,这些试验多次导致科学突破。同样基础研究提供了开发大规模人工智能系统的理论见解,从而减少了所需的试错量,并且非常具有成本效益。
代码医生工作室
2022-04-14
7410
KAIST 研究人员提出 DIGAN:一种基于隐式神经表示 (INR) 的生成对抗网络 (GAN),用于使用机器学习生成视频
深度生成模型已经在包括图像和音频在内的各个领域产生了逼真的样本。视频生成最近已成为深度生成模型的下一个问题,引发了对学习视频分发的长期研究。
代码医生工作室
2022-04-14
1.6K0
Google AI 引入 4Ms 方法来减少机器学习模型的碳排放
任何事物(个人、组织、事件或产品)产生的温室气体排放总量称为碳足迹。产生更多碳足迹的过程使用更多资源,产生更多温室气体并导致更大的气候变化。对温室气体排放量的小幅减少做出贡献可以减少大量的总体碳足迹。
代码医生工作室
2022-03-07
9690
在最新的计算机视觉研究中,研究人员介绍了“JoJoGAN”:一种具有一次性面部样式化的 AI 方法
样式映射器将预设样式应用于它接收到的照片。在最近的一项研究中,来自伊利诺伊大学厄巴纳-香槟分校的研究人员将JoJoGAN介绍为一种从单个样式样本中学习样式映射器的简单方法。例如,该技术允许没有经验的用户提供样式样本,然后将该样式应用于他们选择的图像。该团队在人脸照片的背景下讨论了它的方法,因为风格化的人脸对没有经验的用户非常有吸引力;然而,这个概念可以应用于任何图像。
代码医生工作室
2022-03-07
7700
麻省理工学院研究人员开源“Dynamo”:一种基于机器学习的 Python 框架,用于深入了解动态生物过程
与匹兹堡大学医学院合作,麻省理工学院的研究人员开发了一种机器学习框架来定义描述细胞从一种状态到另一种状态的路径的数学方程。
代码医生工作室
2022-03-07
9110
CMU 最新的机器学习研究分析并改进了 GAN 中的频谱归一化
GAN(生成对抗网络)是尖端的深度生成模型,以制作高分辨率、逼真的照片而闻名。GAN 的目标是从目标数据分布中生成随机样本,而只有一小部分可用的训练样本。这是通过学习两个函数来完成的:生成器 G 将随机输入噪声映射到生成的样本,判别器 D 尝试将输入样本分类为准确(即来自训练数据集)或假(即不是来自训练数据集)(即,由生成器生成)。
代码医生工作室
2022-03-07
7520
LinkedIn是如何用图神经网络扩充会员知识图谱的?
LinkedIn 的会员可以在自己的档案中填充个人信息,例如工作经历、教育经历、技能专长等等。从会员的输入中,我们利用人工智能模型来抽取他们的档案属性或档案实体。这个过程被称为标准化和知识图谱的构建,并生成与会员有关的实体的知识图谱。
代码医生工作室
2022-03-07
3110
Meta AI 推出 AV-HuBERT:一种最先进的自我监督框架,用于理解通过看到和听到人们说话来学习的语音
人工智能用于各种语音识别和理解活动,从启用智能扬声器到为失聪或有语言障碍的人设计辅助工具。然而这些语音理解算法经常在最需要它们的日常场景中表现不佳:当很多人同时说话或有很多背景噪音时。即使是先进的降噪技术也常常无法有效应对海滩旅行中的海浪声或嘈杂的街头市场背景的喧闹声。
代码医生工作室
2022-03-07
2.1K0
2022 年新兴深度学习趋势
在当今行业,人工智能和机器学习被视为技术变革的基石。由于将机器学习算法纳入其运营,企业变得更加智能和高效。随着计算领域的下一次范式转变正在进行中,深度学习的进步引起了行业专家和 IT 公司的关注。
代码医生工作室
2022-03-07
2K0
百度和PCL团队推出ERNIE 3.0 Titan:2600亿参数的预训练语言模型
随着最近人工智能的突破,人类越来越依赖人工智能来解决现实世界的问题。这使得人类学习和运用知识的能力与计算机一样重要。人类通过学习和经验来学习和收集信息,以了解周围环境中的一切。随着知识库的增长,理解和解决问题以及区分事实与荒谬的能力也会增加。然而,人工智能系统缺乏这样的知识,限制了它们适应非典型问题数据的能力。
代码医生工作室
2022-01-08
2.4K0
OpenAI 发布一项新功能,允许开发人员自定义 GPT-3,其强大的自然语言处理 (NLP) 模型
GPT-3 是 OpenAI 开发的高级自然语言处理模型。它返回自然语言文本完成以响应任何文本请求,例如短语或句子。开发人员在他们的应用程序中使用 GPT-3(通过应用程序编程 (API) 按需收费)来完成文本翻译和软件代码开发等任务。
代码医生工作室
2021-12-22
1.1K0
AI 研究人员提出“GANgealing”:一种 GAN 监督的算法,可以学习输入图像的变换,使它们更好地进行联合对齐
它被认为是光流、3D 匹配和医学成像中的关键元素,仅举几个例子;它还影响跟踪和增强现实。
代码医生工作室
2021-12-13
6240
DeepMind新研究登上Nature封面,这一数学难题被AI攻破了
近日,位于伦敦的人工智能巨头 DeepMind 的研究人员与数学家合作解决了两个独立的问题——一个是结理论,另一个是对称性研究。在这两种情况下,人工智能技术都帮助研究人员发现了可以使用传统方法进行研究的新模式。
代码医生工作室
2021-12-09
5500
创建了一个仪表板来跟踪所有与人类健康相关的人工智能研究 (aiforhealth.app) 使用微调的 BERT 模型
临床AI领域存在大量“研究浪费”。尽管有持续的炒作、希望和投资,但人工智能研究向床边医学的转化极其有限。
代码医生工作室
2021-12-09
2970
研究人员推出“PERSIA”:一种基于 PyTorch 的系统,用于训练多达 100 万亿个参数的大规模深度学习推荐模型
基于深度学习的模型主导了生产推荐系统的当代格局。现代推荐系统提供了大量实际应用。由于规模不断扩大的深度神经网络模型,它们取得了令人难以置信的进步。
代码医生工作室
2021-12-09
4290
TensorFlow 推出 TensorFlow 图神经网络 (TF-GNN)
在现实世界和工程系统中,图形无处不在。图是实体集合的表示,例如对象、地点或人,以及它们之间的关系。在机器学习问题中看到的数据通常是结构化的或相关的,因此可以表示为图形。
代码医生工作室
2021-12-01
1.2K0
微软开源深度学习库 SynapseML:可直接在系统中嵌入45种不同机器学习服务、支持100多种语言文本翻译
目前,数据科学团队在使用机器学习模型时正面临着越来越大的压力。虽然 AI 的采用和分析持续上升,但大约有 87% 的数据科学项目从未投入生产。根据 Algorithmia 最近的调查显示,22% 的公司需要一到三个月的时间来部署模型以实现业务价值,而 18% 的公司需要三个月以上的时间。
代码医生工作室
2021-12-01
6000
Facebook打造第一视角视频数据集Ego4D:捕获超3000小时镜头,剑指下一代AI
近日,Facebook 公布了一项名为 Ego4D 的研究项目。该项目为 Facebook 与全球 13 所大学和实验室合作项目,通过收集第一人称镜头,以训练下一代人工智能模型。
代码医生工作室
2021-11-05
9170
点击加载更多
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档