首页
学习
活动
专区
工具
TVP
发布

相约机器人

专栏作者
664
文章
1014879
阅读量
52
订阅数
版本升级:电子发票小助手0.95版(稳定版本)发布
在0.91版本之后,陆陆续续又改了些小bug。目前已经在0.95版本上趋于稳定。欢迎大家试用。
代码医生工作室
2023-03-08
7790
微软研究院推出通用多模式基础模型“BEIT-3”,可在视觉和视觉语言任务上实现最先进的迁移性能
机器学习社区最近将注意力转移到语言、视觉和多模式预训练的融合上。这背后的主要目的是创建通用基础模型,可以处理多种模式并轻松定制各种下游任务。微软研究团队最近在论文 Image as a Foreign Language: BEiT 中介绍了 BEiT-3(BERT Pretraining of Image Transformers),这是一种用于视觉和视觉语言任务的通用最先进的多模态基础模型所有视觉和视觉语言任务的预训练。该模型从三个方面改进了收敛技术:主干设计、预训练工作和模型扩展,使其能够实现最先进的性能。
代码医生工作室
2022-11-17
7380
OneFlow v0.8.0 来了!
很高兴地宣布新版本的OneFlow,这是一个深度学习框架,旨在实现用户友好、可扩展和高效。OneFlow v0.8.0 更新包含 523 个提交。有关完整的 changlog,请查看:
代码医生工作室
2022-11-17
3700
10个月车祸270多起,特斯拉Autopilot和全自动驾驶被诉虚假宣传
在自动驾驶领域,特斯拉依靠其 Autopilot 成为业界追赶的标杆。但有时,特斯拉在产品和功能宣传时并不是那么地实事求是。
代码医生工作室
2022-11-17
2230
OpenAI 研究人员为语言模型构建了一个高效的框架来完成文档中的中间空白
假设有一个不完整的代码,希望编码助手自动填充它,或者已经想到了文档的开头和结尾,并且无法想到要在文档中间写一些有用的东西。可用于语言模型的最先进的框架无法有效地做到这一点,尽管它们非常擅长完成提示。OpenAI 的研究人员展示了一种通过修改现有框架使语言模型能够在中间填充文本(FIM - Fill in the middle)的方法。
代码医生工作室
2022-11-17
6360
研究人员提出“LViT”,一种利用文本医学报告改进分割的语言视觉模型
在深度学习在医疗保健领域的众多应用中,细分无疑是研究最多的领域之一,因为它可能带来广泛的优势。
代码医生工作室
2022-11-17
8170
Meta AI 的研究人员创建了用于对象识别的“OMNI3D”数据集和可以推广到看不见的图像的“Cube R-CNN”模型
长期以来计算机视觉一直难以从单个图像中理解对象及其特征,这一主题在机器人技术、辅助技术和 AR/VR 中都有应用。3D 对象识别问题提出了与从 2D 视觉输入中感知 3D 事物相关的新挑战。近十年来大规模数据集帮助 2D 对象识别在预测和定位 2D 图片网格上的项目方面取得了重大进展。另一方面世界是在三个维度中三维构建的。在这里目标是创建一个紧密定向的 3D 边界框,用于估计图片中每个项目的 3D 位置和范围。
代码医生工作室
2022-11-17
3890
Neural Compressor:用于模型压缩的开源 Python 库
英特尔最近发布了 Neural Compressor,这是一个用于模型压缩的开源 Python 包。该库可应用于 CPU 或 GPU 上的深度学习部署,以减小模型大小并加快推理速度。此外它为著名的网络压缩技术提供统一的用户界面,包括跨各种深度学习框架的量化、修剪和知识蒸馏。该工具的自动精度驱动调整技术可用于生成最佳量化模型。此外,它允许知识蒸馏,以便可以将来自教师模型的知识转移到学生模型中。它实现了几种权重剪枝方法,以使用预定的稀疏目标生成剪枝模型。为了改进框架互操作性,
代码医生工作室
2022-11-17
1.2K0
CMU 研究人员提出 Deep Attentive VAE:第一个用于深度概率模型中变分推理的注意力驱动框架
数据是机器学习中必不可少的元素,了解它的分布方式至关重要。无监督方法使生成模型能够了解任何数据分布。他们可能会产生独特的数据样本,如假脸、图形艺术品和风景全景图。它们与其他模型结合使用,以用未观察到的信息补充观察到的数据集,以更好地定义创建感兴趣数据的技术。
代码医生工作室
2022-06-07
2890
Salesforce AI Research Propose 'ALPRO':一种新的视频和语言表示学习(预训练)框架
本文是 Marktechpost 工作人员根据研究论文“对齐和提示:使用实体提示进行视频和语言预训练”的总结。这项研究的所有功劳归于该项目的研究人员。
代码医生工作室
2022-06-07
5100
Deepmind 推出 Flamingo:用于多模态机器学习研究的开放式单一视觉语言模型 (VLM)
智力衡量一个人仅使用几条简单指令就能多快适应新环境。尽管两者之间存在对比,但孩子们可能会在看到书中动物的几张照片后认出动物园里真正的动物。另一方面,典型的视觉模型还不能反映这种人类智力水平。需要接受数以万计已为该任务明确注释的示例的训练。如果目标是对图像中的动物进行计数和识别,例如“三只斑马”,则必须收集数千张照片,并用它们的数量和物种注释每张图像。每次面对新工作时都需要训练新模型是最主要的缺点,这使得该过程效率低下、成本高昂。
代码医生工作室
2022-06-07
1.8K0
谷歌 AI 引入一种机器学习模型训练方法 (L2P)
监督学习是机器学习 (ML) 的一种流行方法,其中使用已针对手头任务进行适当标记的数据来训练模型。普通监督学习训练独立同分布(IID)。
代码医生工作室
2022-06-07
8770
LinkedIn 开源“Feathr”,它是简化机器学习 (ML) 功能管理并提高开发人员生产力的功能商店
LinkedIn 研究团队最近开源了功能商店Feathr,旨在简化机器学习 (ML) 功能管理并提高开发人员的工作效率。数十个 LinkedIn 应用程序使用 Feathr 来定义特性、计算它们以进行训练、将它们部署到生产中,并在消费者之间共享它们。与以前特定于应用程序的特征管道解决方案相比,Feathr 用户报告说,显着减少了向模型训练添加新特征所需的时间,并提高了运行时性能。
代码医生工作室
2022-06-07
9260
gDNA:一种 3D 穿衣人体生成模型
快速生成各种高质量虚拟人并完全控制其位置的能力在电影制作、游戏、虚拟现实/增强现实、建筑和计算机视觉中有许多应用。现代计算机图形技术实现了逼真的效果,但它们通常需要大量的专业知识。
代码医生工作室
2022-06-07
8280
用Gooey GUI生成界面避坑记
Gooey 一款为命令行工具制作图形界面的工具。如果看了网上关于Gooey的宣传或介绍,你一定很想试试,但是使用之后才发现全是坑。问题不是Gooey不行,而是没有更深入、更详细的教程。
代码医生工作室
2022-04-14
1.7K0
Google AI 将高性能 CAP12 模型的尺寸缩小 6 倍至 100 倍
近年来,自动语音识别(ASR)等词汇任务取得了重大进展。然而,机器系统难以理解非语言特征,例如语气、情绪或说话者是否戴着面具等。机器听力中最具挑战性的困难之一是弄清楚如何理解这些元素。此外,前沿成果通常来自对私人数据进行训练的超大型模型,这使得它们无法在移动设备上执行或公开发布。
代码医生工作室
2022-04-14
5630
微软最新机器学习研究引入 μTransfer:一种新技术,仅使用 7% 的预训练计算即可调整 67 亿参数的 GPT-3 模型
科学家们进行试错程序,这些试验多次导致科学突破。同样基础研究提供了开发大规模人工智能系统的理论见解,从而减少了所需的试错量,并且非常具有成本效益。
代码医生工作室
2022-04-14
6610
来自 CMU 和 LinkedIn 的研究人员开源了 PASS(性能自适应采样策略)在深度学习中的实施
实体关系多次使用图表以各种方式描述。例如,专业图表显示人们如何协作,而社交图表显示人们如何相互联系。
代码医生工作室
2022-04-14
4810
CMU 研究人员开源“PolyCoder”:具有 2.7B 参数的基于机器学习的代码生成器
语言模型 (LM) 通常用于自然语言文献中,以将概率分配给标记序列。LM 最近在用编程语言编写的源代码建模方面表现出出色的性能。这些模型特别擅长代码完成和从自然语言描述生成代码等工作。对于基于 AI 的编程支持,当前最先进的代码大语言模型已显示出巨大的改进。其中最大的模型之一 Codex 已被实现为 IDE 内的开发人员助手,可根据用户的上下文在真实世界的生产工具 GitHub Copilot 中自动编写代码。
代码医生工作室
2022-04-14
1.4K0
KAIST 研究人员提出 DIGAN:一种基于隐式神经表示 (INR) 的生成对抗网络 (GAN),用于使用机器学习生成视频
深度生成模型已经在包括图像和音频在内的各个领域产生了逼真的样本。视频生成最近已成为深度生成模型的下一个问题,引发了对学习视频分发的长期研究。
代码医生工作室
2022-04-14
1.4K0
点击加载更多
社区活动
Python精品学习库
代码在线跑,知识轻松学
热点技术征文第五期
新风口Sora来袭,普通人该如何把握机会?
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·干货材料·成员作品·最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档