首页
学习
活动
专区
工具
TVP
发布

机器之心

专栏作者
8963
文章
6290580
阅读量
277
订阅数
AudioLDM一作解读:文本生成高质量音频,单GPU即可
文本驱动的生成模型在图像和视频领域已经取得了显著成果,例如大火的 Stable Diffusion,可以生成大片级别的图像,但是在音频领域,技术上的进展还是比较局限的。 文本到音频的生成模型对许多和创作相关的行业都会产生积极的作用,例如游戏开发者或者电影配音人员可以借助此项技术,根据特定的要求去生成声音,而不是在庞大的音频数据库中搜寻,从而加快生产效率。文本到音频的生成模型也可以为未来自动内容创作提供文本和声音之间的桥梁。 然而,以往文本到音频的研究都存在生成质量有限、计算成本高的问题。 针对上述困难,来
机器之心
2023-02-23
5300
开源模型、单卡训练,带你了解爆火的文本指导音频生成技术AudioLDM
机器之心专栏 机器之心编辑部 给出一段文字,人工智能就可以生成音乐,语音,各种音效,甚至是想象的声音,比如黑洞和激光枪。最近由英国萨里大学和帝国理工学院联合推出的AudioLDM,在发布之后迅速火遍国外,一周内在推特上收获了近 300 次的转发和 1500 次的点赞。在模型开源第二天,AudioLDM就冲上了 Hugging Face 热搜榜第一名,并在一周内进入了 Hugging Face 最受喜欢的前 40 名应用榜单(共约 25000),也迅速出现了很多基于 AudioLDM 的衍生工作。 Audio
机器之心
2023-02-23
8170
疑似抄袭论文评分第一,字面歧义被指违背伦理,这届ICLR审稿怎么了?
深度学习顶级学术会议 ICLR 2023( International Conference on Learning Representations)审稿意见已出炉。对于论文作者而言,真是「几家欢喜,几家忧」。
机器之心
2022-12-16
2570
让程序员动嘴写代码,Copilot测试新功能「嘿,GitHub!」
Copilot 的诞生,曾经在程序员群体中引发热议。这是 GitHub 今年早些时候推出的每月 10 美元的付费工具,用于帮助开发者编写代码。Copilot 会在开发者的代码编辑器内推荐代码行,比如当开发者在 Visual Studio Code、Neovim 和 JetBrains IDE 等集成开发环境中输入代码时,它就能够推荐下一行的代码。此外,Copilot 甚至可以提供关于完整的方法和复杂的算法等建议,以及模板代码和单元测试的协助。
机器之心
2022-12-15
9190
OceanBase社区版4.0正式上线,与企业版同等性能,一键安装两分钟跑通Demo
11 月 3 日,2022 年云栖大会现场,OceanBase 社区版 4.0 正式上线(代号:小鱼),定位为 Beta 版本,兼容 MySQL 能力全面开放,与企业版同等性能。
机器之心
2022-12-15
7750
AMD Composable Kernel: 定制化算子融合,大幅提升AI端到端性能
图优化在降低 AI 模型的训练和推理使用的时间和资源方面起着重要作用。图优化的一个重要功能是模型中将可以融合的算子进行融合,通过降低内存占用和减少数据在低速内存中的搬运来提高计算效率。然而,实现一套能够提供各种算子融合的后端方案难度很大,导致在实际硬件上 AI 模型能够使用的算子融合非常有限。
机器之心
2022-12-15
6490
1秒出图,全球最快的开源Stable Diffusion出炉
第一辆汽车诞生之初,时速只有 16 公里,甚至不如马车跑得快,很长一段时间,汽车尴尬地像一种“很酷的玩具”。人工智能作图的出现也是如此。
机器之心
2022-12-15
1.2K0
Stable Diffusion新玩法,一句话帮你换图,网友魔改《戴珍珠耳环的少女》长这样
输入一句话,就能把图片修改好,这是很多画师梦寐以求的修图工具!但是话说回来,再优秀的画师,如果仅凭自己的专业优势,不借助其他工具,也很难在短时间内完成图片的修改。
机器之心
2022-12-15
1.1K0
Copilot逐字复制代码,恐抹去整个开源社区?程序员拿出律师证发起集体诉讼
作为一名开发者,或许你不介意 GitHub Copilot 未经询问就使用了你的开源代码。
机器之心
2022-12-15
2930
YOLO内卷时期该如何选模型?
机器之心转载 来源:知乎 作者:知乎用户@迪迦奥特曼 YOLO 新版本那么多,到底选哪个? 前不久看到了美团微信公众号上的宣传,更新发布了新版 YOLOv6,还放出了 arxiv 论文,更新了之前的 N/T/S 小模型,也放出了 M 和 L 版本的大模型,论文实验表格多达十几个,看的出来是很用心的做了,YOLO官方也认可了这个起名。 之前本人写了一个 YOLO 合集的文章(迪迦奥特曼:从百度飞桨 YOLOSeries 库看各个 YOLO 模型:https://zhuanlan.zhihu.com/p/550
机器之心
2022-10-08
8090
2022年高通创新奖学金北美获奖名单公布:38人获奖,华人占半数
机器之心报道 编辑:陈萍、小舟 高通将为每个获奖团队提供10万美元的奖学金和技术指导。 2022 年高通创新奖学金获得者(Qualcomm Innovation Fellowship Winners)北美获奖名单现已公布,共有 38 人获奖。该奖项创始于 2009 年,至今已有 14 年。在今年的获奖名单中,华人学生占据一半名额。 每个获奖团队能够获得高通公司提供的 10 万美元奖学金和技术指导。 丁文浩(Wenhao Ding),Jiacheng Zhu 学校:CMU Innovation Title:
机器之心
2022-09-28
4550
没有3D卷积的3D重建方法,A100上重建一帧仅需70ms
选自arXiv 作者:Mohamed Sayed等 机器之心编译 编辑:陈萍、小舟 来自 Niantic 和 UCL 等机构的研究者使用精心设计和训练的 2D 网络,实现了高质量的深度估计和 3D 重建。 从姿态图像重建 3D 室内场景通常分为两个阶段:图像深度估计,然后是深度合并(depth merging)和表面重建(surface reconstruction)。最近,多项研究提出了一系列直接在最终 3D 体积特征空间中执行重建的方法。虽然这些方法已经获得出令人印象深刻的重建结果,但它们依赖于昂贵的
机器之心
2022-09-13
3520
ECCV 2022|R2L: 用数据蒸馏加速NeRF
机器之心专栏 作者:Huan Wang 神经辐射场 (Neural Radiance Field, or NeRF) [Mildenhall et al., ECCV, 2020] 开启了用神经网络表征三维场景的新范式。NeRF 这两年在学术界和工业界都很火热, 但 NeRF 一个比较大的缺点是, 渲染速度慢。虽然 NeRF 用的神经网络 (11 层的 MLP) 本身很小, 但是渲染一个像素需要采集一条光线上的很多点(上百个), 这导致渲染一张图的计算量非常大, 如下图所示: 用 PyTorch 在单张 N
机器之心
2022-08-25
4980
模型越大表现越差,这个比赛悬赏25万美元找大模型不擅长的任务,去试试?
机器之心报道 编辑:张倩 帮大模型找 bug 还能赚钱,去试试? 「找到一项任务,越大的模型反而表现越差,你就有机会拿走 10 万美元的奖金。」这是纽约大学的几位研究人员组织的一项另类竞赛。 随着语言模型变得越来越大(参数数量、使用的计算量和数据集大小都变大),它们的表现似乎也原来越好,这被称为自然语言的 Scaling Law。 但是,这些模型也有自己的缺陷,比如存在偏见、可能产生看似合理实则错误的信息。这项竞赛的目的就是要找到一些大模型不擅长的例子。 组织者将这些现象称为 inverse scali
机器之心
2022-07-06
2830
Copilot收费,惹怒软件自由保护协会SFC:停止使用GitHub,时机已到
机器之心报道 机器之心编辑部 放弃 GitHub:时机已到? 诞生于 2008 年,如今已经 14 岁,凭借完整协议支持、Git 格式的版本库托管等优势,GitHub 成为最受开发者欢迎的代码托管平台。 然而,GitHub 在被微软收购,于去年推出 Copilot 后,这引发了行业内一些组织的不满。因为用户发现 Copilot 复制粘贴代码实锤,所谓「原生 AI 代码生成工具」的宣传不攻自破。 而如今,Copilot 也已经开启收费模式。现以每月 10 美元(人民币约 67 元)或每年 100 美元(人民币
机器之心
2022-07-04
7540
送给大模型的「高考」卷:442人联名论文给大模型提出204个任务,谷歌领衔
机器之心报道 编辑:泽南 大规模预训练模型需要大型 benchmark 来进行验证。 在 Jeff Dean 等人 Pathways 架构的首个模型 PaLM 中,研究人员在一个名为 BIG-Bench 的大模型专用基准上与其他算法进行了多项任务测试。近日,谷歌终于将 BIG-Bench 的论文和 GitHub 公开出来。 研究人员表示,该工作历经两年努力完成,论文长达 100 页,作者有 442 人,目前 benchmark 包含的任务已经从 PaLM 论文时期的 150 个增加到超过 200 个。 B
机器之心
2022-06-13
6130
一枚笑脸emoji,估值20亿美元:Hugging Face官宣1亿美元C轮融资
机器之心报道 编辑:蛋酱、泽南 一周之内完成融资,这就是 Transformer 的力量吗? Hugging Face 的 transformer 模型在 GitHub 上现在有 6.2 万 star 量,一个星 1600 美元。 五年前,一家来自纽约的创业公司 Hugging Face 宣布,它为那些颇感无聊的青少年打造了一款 iPhone 聊天机器人应用,可以分享一些电脑生成的人脸和笑话,也可以和 Siri 玩互动。换句话说,他们想打造一个可以理解任何类型对话主题的聊天机器人。 「我们可以和人工智能谈
机器之心
2022-05-10
7190
GitHub正在封禁部分俄罗斯开发者账号:受制裁实体前员工也被「误伤」
机器之心报道 编辑:蛋酱 开源无国界,但总有GitHub上的开发者被封号。 如果你是一位俄罗斯开发者,且正在或曾经为受美国制裁的实体工作,那你的GitHub账户正处于危险境地,随时可能被封禁。 据俄罗斯媒体报道,这一波封禁起始于4月13日,且并未区分企业与个人账号。 据了解,被封禁的个人账户要么和受制裁实体附属、合作的关系,要么为受制裁实体工作。但从现状来看,即使是那些以前为受制裁公司工作过的人似乎也被「误伤」了。 这意味着俄罗斯用户也许会突然发现他们的项目被删除,账户被暂停使用,即使这些项目与
机器之心
2022-04-19
6470
十年积累,5.4万GitHub Star一朝清零:开源史上最大意外损失
机器之心报道 编辑:蛋酱、小舟 我们找 GitHub CEO 求助,但为时已晚。 2022 年 2 月 15 日,GitHub 通过推特平台广播了一则消息:「我们的朋友 HTTPie 最近不小心将自己设为了私密,丢掉了所有的 Star。如果你仍然爱它,就给它一颗 Star 作为情人节礼物。」 10 年攒下的 Star 突然清零?这是怎么回事? 昨天,项目作者 Jakub Roztočil 在博客中正式回应了这一事件。 十年获得 5.4W Star 的开源项目 HTTPie 项目的第一次提交还是在十年之前。
机器之心
2022-04-18
6000
让模型训练速度提升2到4倍,「彩票假设」作者的这个全新PyTorch库火了
机器之心报道 机器之心编辑部 登陆 GitHub 以来,这个项目已经收获了 800 多个 Star。 随着越来越多的企业转向人工智能来完成各种各样的任务,企业很快发现,训练人工智能模型是昂贵的、困难的和耗时的。 一家公司 MosaicML 的目标正是找到一种新的方法来应对这些层出不穷的挑战。近日, MosaicML 推出了一个用于高效神经网络训练的 PyTorch 库「Composer」,旨在更快地训练模型、降低成本,并获得表现更好的模型。 Composer 是一个用 PyTorch 编写的开源库,旨在集
机器之心
2022-04-06
4190
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档