首页
学习
活动
专区
工具
TVP
发布

相约机器人

专栏成员
664
文章
1095756
阅读量
52
订阅数
研究人员提出“LViT”,一种利用文本医学报告改进分割的语言视觉模型
在深度学习在医疗保健领域的众多应用中,细分无疑是研究最多的领域之一,因为它可能带来广泛的优势。
代码医生工作室
2022-11-17
1K0
Meta AI 的研究人员创建了用于对象识别的“OMNI3D”数据集和可以推广到看不见的图像的“Cube R-CNN”模型
长期以来计算机视觉一直难以从单个图像中理解对象及其特征,这一主题在机器人技术、辅助技术和 AR/VR 中都有应用。3D 对象识别问题提出了与从 2D 视觉输入中感知 3D 事物相关的新挑战。近十年来大规模数据集帮助 2D 对象识别在预测和定位 2D 图片网格上的项目方面取得了重大进展。另一方面世界是在三个维度中三维构建的。在这里目标是创建一个紧密定向的 3D 边界框,用于估计图片中每个项目的 3D 位置和范围。
代码医生工作室
2022-11-17
5090
Deepmind 推出 Flamingo:用于多模态机器学习研究的开放式单一视觉语言模型 (VLM)
智力衡量一个人仅使用几条简单指令就能多快适应新环境。尽管两者之间存在对比,但孩子们可能会在看到书中动物的几张照片后认出动物园里真正的动物。另一方面,典型的视觉模型还不能反映这种人类智力水平。需要接受数以万计已为该任务明确注释的示例的训练。如果目标是对图像中的动物进行计数和识别,例如“三只斑马”,则必须收集数千张照片,并用它们的数量和物种注释每张图像。每次面对新工作时都需要训练新模型是最主要的缺点,这使得该过程效率低下、成本高昂。
代码医生工作室
2022-06-07
2.2K0
KAIST 研究人员提出 DIGAN:一种基于隐式神经表示 (INR) 的生成对抗网络 (GAN),用于使用机器学习生成视频
深度生成模型已经在包括图像和音频在内的各个领域产生了逼真的样本。视频生成最近已成为深度生成模型的下一个问题,引发了对学习视频分发的长期研究。
代码医生工作室
2022-04-14
1.6K0
Google AI 引入 4Ms 方法来减少机器学习模型的碳排放
任何事物(个人、组织、事件或产品)产生的温室气体排放总量称为碳足迹。产生更多碳足迹的过程使用更多资源,产生更多温室气体并导致更大的气候变化。对温室气体排放量的小幅减少做出贡献可以减少大量的总体碳足迹。
代码医生工作室
2022-03-07
9690
在最新的计算机视觉研究中,研究人员介绍了“JoJoGAN”:一种具有一次性面部样式化的 AI 方法
样式映射器将预设样式应用于它接收到的照片。在最近的一项研究中,来自伊利诺伊大学厄巴纳-香槟分校的研究人员将JoJoGAN介绍为一种从单个样式样本中学习样式映射器的简单方法。例如,该技术允许没有经验的用户提供样式样本,然后将该样式应用于他们选择的图像。该团队在人脸照片的背景下讨论了它的方法,因为风格化的人脸对没有经验的用户非常有吸引力;然而,这个概念可以应用于任何图像。
代码医生工作室
2022-03-07
7700
麻省理工学院研究人员开源“Dynamo”:一种基于机器学习的 Python 框架,用于深入了解动态生物过程
与匹兹堡大学医学院合作,麻省理工学院的研究人员开发了一种机器学习框架来定义描述细胞从一种状态到另一种状态的路径的数学方程。
代码医生工作室
2022-03-07
9110
CMU 最新的机器学习研究分析并改进了 GAN 中的频谱归一化
GAN(生成对抗网络)是尖端的深度生成模型,以制作高分辨率、逼真的照片而闻名。GAN 的目标是从目标数据分布中生成随机样本,而只有一小部分可用的训练样本。这是通过学习两个函数来完成的:生成器 G 将随机输入噪声映射到生成的样本,判别器 D 尝试将输入样本分类为准确(即来自训练数据集)或假(即不是来自训练数据集)(即,由生成器生成)。
代码医生工作室
2022-03-07
7520
2022 年新兴深度学习趋势
在当今行业,人工智能和机器学习被视为技术变革的基石。由于将机器学习算法纳入其运营,企业变得更加智能和高效。随着计算领域的下一次范式转变正在进行中,深度学习的进步引起了行业专家和 IT 公司的关注。
代码医生工作室
2022-03-07
2K0
AI 研究人员提出“GANgealing”:一种 GAN 监督的算法,可以学习输入图像的变换,使它们更好地进行联合对齐
它被认为是光流、3D 匹配和医学成像中的关键元素,仅举几个例子;它还影响跟踪和增强现实。
代码医生工作室
2021-12-13
6240
DeepMind新研究登上Nature封面,这一数学难题被AI攻破了
近日,位于伦敦的人工智能巨头 DeepMind 的研究人员与数学家合作解决了两个独立的问题——一个是结理论,另一个是对称性研究。在这两种情况下,人工智能技术都帮助研究人员发现了可以使用传统方法进行研究的新模式。
代码医生工作室
2021-12-09
5500
微软开源深度学习库 SynapseML:可直接在系统中嵌入45种不同机器学习服务、支持100多种语言文本翻译
目前,数据科学团队在使用机器学习模型时正面临着越来越大的压力。虽然 AI 的采用和分析持续上升,但大约有 87% 的数据科学项目从未投入生产。根据 Algorithmia 最近的调查显示,22% 的公司需要一到三个月的时间来部署模型以实现业务价值,而 18% 的公司需要三个月以上的时间。
代码医生工作室
2021-12-01
6000
Microsoft AI 开源“PyTorch-DirectML”:在 GPU 上训练机器学习模型的软件包
微软Windows团队的AI已经公布了˚F IRST DirectML的预览作为后端PyTorch训练ML车型。此版本允许在任何 DirectX12 GPU 和 WSL 上加速 PyTorch 的机器学习训练,释放混合现实计算的新潜力。
代码医生工作室
2021-11-05
4.1K0
谷歌 AI 推出“不确定性基线库”,用于深度学习中的不确定性和鲁棒性
机器学习一直是当今技术中的热门词。它越来越多地用于各种实际应用,例如图像和语音识别、自动驾驶汽车、医学诊断等。因此了解其在实践中的行为和性能变得非常重要。鲁棒性和不确定性的高质量估计对于许多功能至关重要,尤其是深度学习。
代码医生工作室
2021-10-20
7950
DeepMind的新强化学习系统是迈向通用AI的下一步吗?
对于精通围棋、星际争霸 2 以及其他游戏的深度强化学习模型而言,关键的挑战之一是它们无法将其能力泛化到训练领域之外。这种限制使得将这些系统应用到现实世界中变得非常困难,在现实世界中,情况比训练 AI 模型的环境复杂得多且不可预测。
代码医生工作室
2021-09-30
3790
云原生 AI 在自动驾驶领域的应用探索与毫末智行落地实践
毫末智行是一家致力于自动驾驶,提供智能物流解决方案的人工智能技术公司。数据智能是毫末智行的核心能力,乘用车自动驾驶系统及解决方案、低速无人车生态系统及解决方案、自动驾驶相关产品研发与定制服务三大垂类产品为数据智能服务,同时,数据智能也反哺三大垂类产品。
代码医生工作室
2021-09-29
8370
Bengio实验室推出开源AI药物研发平台,唐建领队、清北上交学生参与开发
现在,来自加拿大蒙特利尔学习算法研究所(Mila)的唐建团队,就推出了一个专门用于AI药物研发的开源机器学习平台——TorchDrug。
代码医生工作室
2021-09-29
6140
选择机器学习模型,要注意这7个问题
本文最初发表于 Towards Data Science 博客,经原作者 Santiago Valdarrama 授权,InfoQ 中文站翻译并分享。
代码医生工作室
2021-09-08
2800
IBM 开源“CodeFlare”,这是一种将 AI 工作流简化到混合云的机器学习框架
数据和机器学习分析正变得越来越普遍,但随着需要大量时间进行配置的更大数据集,它们变得越来越复杂。研究人员实际花在数据科学上的时间比更新系统要少,这有时可能会很困难。
代码医生工作室
2021-07-16
5780
兼具CNN和Transformer优势,灵活使用归纳偏置,Facebook提出ConViT
AI 研究人员在构建新的机器学习模型和训练范式时,通常会使用一组被称为归纳偏置(inductive biases)的特定假设,来帮助模型从更少的数据中学到更通用的解决方案。近十年来,深度学习的巨大成功在一定程度上归功于强大的归纳偏置,基于其卷积架构已被证实在视觉任务上非常成功,它们的 hard 归纳偏置使得样本高效学习成为可能,但代价是可能会降低性能上限。而视觉 Transformer(如 ViT)依赖于更加灵活的自注意力层,最近在一些图像分类任务上性能已经超过了 CNN,但 ViT 对样本的需求量更大。
代码医生工作室
2021-07-16
1.2K0
点击加载更多
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档