首页
学习
活动
专区
工具
TVP
发布

相约机器人

专栏作者
664
文章
1042717
阅读量
52
订阅数
微软研究院推出通用多模式基础模型“BEIT-3”,可在视觉和视觉语言任务上实现最先进的迁移性能
机器学习社区最近将注意力转移到语言、视觉和多模式预训练的融合上。这背后的主要目的是创建通用基础模型,可以处理多种模式并轻松定制各种下游任务。微软研究团队最近在论文 Image as a Foreign Language: BEiT 中介绍了 BEiT-3(BERT Pretraining of Image Transformers),这是一种用于视觉和视觉语言任务的通用最先进的多模态基础模型所有视觉和视觉语言任务的预训练。该模型从三个方面改进了收敛技术:主干设计、预训练工作和模型扩展,使其能够实现最先进的性能。
代码医生工作室
2022-11-17
7940
OneFlow v0.8.0 来了!
很高兴地宣布新版本的OneFlow,这是一个深度学习框架,旨在实现用户友好、可扩展和高效。OneFlow v0.8.0 更新包含 523 个提交。有关完整的 changlog,请查看:
代码医生工作室
2022-11-17
3850
10个月车祸270多起,特斯拉Autopilot和全自动驾驶被诉虚假宣传
在自动驾驶领域,特斯拉依靠其 Autopilot 成为业界追赶的标杆。但有时,特斯拉在产品和功能宣传时并不是那么地实事求是。
代码医生工作室
2022-11-17
2260
OpenAI 研究人员为语言模型构建了一个高效的框架来完成文档中的中间空白
假设有一个不完整的代码,希望编码助手自动填充它,或者已经想到了文档的开头和结尾,并且无法想到要在文档中间写一些有用的东西。可用于语言模型的最先进的框架无法有效地做到这一点,尽管它们非常擅长完成提示。OpenAI 的研究人员展示了一种通过修改现有框架使语言模型能够在中间填充文本(FIM - Fill in the middle)的方法。
代码医生工作室
2022-11-17
6760
研究人员提出“LViT”,一种利用文本医学报告改进分割的语言视觉模型
在深度学习在医疗保健领域的众多应用中,细分无疑是研究最多的领域之一,因为它可能带来广泛的优势。
代码医生工作室
2022-11-17
8820
Meta AI 的研究人员创建了用于对象识别的“OMNI3D”数据集和可以推广到看不见的图像的“Cube R-CNN”模型
长期以来计算机视觉一直难以从单个图像中理解对象及其特征,这一主题在机器人技术、辅助技术和 AR/VR 中都有应用。3D 对象识别问题提出了与从 2D 视觉输入中感知 3D 事物相关的新挑战。近十年来大规模数据集帮助 2D 对象识别在预测和定位 2D 图片网格上的项目方面取得了重大进展。另一方面世界是在三个维度中三维构建的。在这里目标是创建一个紧密定向的 3D 边界框,用于估计图片中每个项目的 3D 位置和范围。
代码医生工作室
2022-11-17
4300
Neural Compressor:用于模型压缩的开源 Python 库
英特尔最近发布了 Neural Compressor,这是一个用于模型压缩的开源 Python 包。该库可应用于 CPU 或 GPU 上的深度学习部署,以减小模型大小并加快推理速度。此外它为著名的网络压缩技术提供统一的用户界面,包括跨各种深度学习框架的量化、修剪和知识蒸馏。该工具的自动精度驱动调整技术可用于生成最佳量化模型。此外,它允许知识蒸馏,以便可以将来自教师模型的知识转移到学生模型中。它实现了几种权重剪枝方法,以使用预定的稀疏目标生成剪枝模型。为了改进框架互操作性,
代码医生工作室
2022-11-17
1.3K0
CMU 研究人员提出 Deep Attentive VAE:第一个用于深度概率模型中变分推理的注意力驱动框架
数据是机器学习中必不可少的元素,了解它的分布方式至关重要。无监督方法使生成模型能够了解任何数据分布。他们可能会产生独特的数据样本,如假脸、图形艺术品和风景全景图。它们与其他模型结合使用,以用未观察到的信息补充观察到的数据集,以更好地定义创建感兴趣数据的技术。
代码医生工作室
2022-06-07
3180
Deepmind 推出 Flamingo:用于多模态机器学习研究的开放式单一视觉语言模型 (VLM)
智力衡量一个人仅使用几条简单指令就能多快适应新环境。尽管两者之间存在对比,但孩子们可能会在看到书中动物的几张照片后认出动物园里真正的动物。另一方面,典型的视觉模型还不能反映这种人类智力水平。需要接受数以万计已为该任务明确注释的示例的训练。如果目标是对图像中的动物进行计数和识别,例如“三只斑马”,则必须收集数千张照片,并用它们的数量和物种注释每张图像。每次面对新工作时都需要训练新模型是最主要的缺点,这使得该过程效率低下、成本高昂。
代码医生工作室
2022-06-07
1.9K0
谷歌 AI 引入一种机器学习模型训练方法 (L2P)
监督学习是机器学习 (ML) 的一种流行方法,其中使用已针对手头任务进行适当标记的数据来训练模型。普通监督学习训练独立同分布(IID)。
代码医生工作室
2022-06-07
9030
gDNA:一种 3D 穿衣人体生成模型
快速生成各种高质量虚拟人并完全控制其位置的能力在电影制作、游戏、虚拟现实/增强现实、建筑和计算机视觉中有许多应用。现代计算机图形技术实现了逼真的效果,但它们通常需要大量的专业知识。
代码医生工作室
2022-06-07
8590
用Gooey GUI生成界面避坑记
Gooey 一款为命令行工具制作图形界面的工具。如果看了网上关于Gooey的宣传或介绍,你一定很想试试,但是使用之后才发现全是坑。问题不是Gooey不行,而是没有更深入、更详细的教程。
代码医生工作室
2022-04-14
1.8K0
Google AI 将高性能 CAP12 模型的尺寸缩小 6 倍至 100 倍
近年来,自动语音识别(ASR)等词汇任务取得了重大进展。然而,机器系统难以理解非语言特征,例如语气、情绪或说话者是否戴着面具等。机器听力中最具挑战性的困难之一是弄清楚如何理解这些元素。此外,前沿成果通常来自对私人数据进行训练的超大型模型,这使得它们无法在移动设备上执行或公开发布。
代码医生工作室
2022-04-14
5830
微软最新机器学习研究引入 μTransfer:一种新技术,仅使用 7% 的预训练计算即可调整 67 亿参数的 GPT-3 模型
科学家们进行试错程序,这些试验多次导致科学突破。同样基础研究提供了开发大规模人工智能系统的理论见解,从而减少了所需的试错量,并且非常具有成本效益。
代码医生工作室
2022-04-14
6900
来自 CMU 和 LinkedIn 的研究人员开源了 PASS(性能自适应采样策略)在深度学习中的实施
实体关系多次使用图表以各种方式描述。例如,专业图表显示人们如何协作,而社交图表显示人们如何相互联系。
代码医生工作室
2022-04-14
5020
加州大学伯克利分校的研究人员推出了一种新的基于能力的算法,称为对比内在控制 (CIC),用于无监督技能发现
在存在外在奖励的情况下,深度强化学习 (RL) 是处理复杂控制任务的强大策略。玩像素视频游戏、掌握围棋游戏、机器人移动性和灵巧的操纵策略都是成功应用的例子。
代码医生工作室
2022-04-14
5790
Pytorch 推出“TorchRec”:用于推荐系统 (RecSys) 的基于 Python 的 PyTorch 库
推荐系统 (RecSys) 是当今生产就绪型 AI 的重要组成部分,尽管您看一下 Github 不会知道它。与 Vision 和 NLP 等领域相比,RecSys 的大部分持续发现和开发都是在闭门造车的情况下进行的。对于探索这些方法或创建个性化用户体验的学术研究人员来说,该领域远未实现民主化。
代码医生工作室
2022-03-07
1.7K0
IBM 研究人员构建了一个机器学习模型帮助利用酶的力量进行绿色化学
酶是人体几乎所有活动的主要加速器,有助于从消化到有害化学物质的分解,甚至 DNA 复制。酶的相关性超越了生物学;它们还用于通过减少能源消耗和生产过程中所需的有害溶剂的数量来使工业化学过程更加环保。例如,纸张制造中的木聚糖酶处理已被证明在生产用于印刷或用于笔记本的白纸时可减少 15% 的氯用量和 25% 的有毒可吸附有机卤化物(一种氯副产品)。
代码医生工作室
2022-03-07
3780
UT Austin 研究人员展示了一种基于 MRI 数据集实现高质量图像重建的深度学习技术
在磁共振成像 (MRI) 扫描期间,对于许多人来说,时间似乎是静止的。那些经历过的人都明白,在嗡嗡作响的扫描仪内保持不动不动的困难,时间从几分钟到一个多小时不等。
代码医生工作室
2022-03-07
5670
在最新的计算机视觉研究中,研究人员介绍了“JoJoGAN”:一种具有一次性面部样式化的 AI 方法
样式映射器将预设样式应用于它接收到的照片。在最近的一项研究中,来自伊利诺伊大学厄巴纳-香槟分校的研究人员将JoJoGAN介绍为一种从单个样式样本中学习样式映射器的简单方法。例如,该技术允许没有经验的用户提供样式样本,然后将该样式应用于他们选择的图像。该团队在人脸照片的背景下讨论了它的方法,因为风格化的人脸对没有经验的用户非常有吸引力;然而,这个概念可以应用于任何图像。
代码医生工作室
2022-03-07
7400
点击加载更多
社区活动
RAG七天入门训练营
鹅厂大牛手把手带你上手实战
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档