首页
学习
活动
专区
圈层
工具
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

#音频

谷歌AI成功破解海豚语,海洋版ChatGPT来了!掀人类跨物种交流革命

新智元

谷歌推出了一款名为DolphinGemma的创新AI模型,不仅能听懂海豚说什么,还能在水下和海豚实时交流。

400

如何通过OpenHarmony的音频模块实现录音变速功能?

小帅聊鸿蒙

OpenAtom OpenHarmony(以下简称“OpenHarmony”)是由开放原子开源基金会孵化及运营的开源项目,是面向全场景、全连接、全智能时代的智能...

7610

AI涌现人类情感!希腊「乐之神」Orpheus开源,单卡可跑语音流式推理

新智元

【新智元导读】开源语音模型Orpheus让LLM涌现出人类情感!在A100 40GB显卡上,30亿参数模型的流式推理速度甚至超过了音频播放速度。甚至可以zero...

9010

免费用!阿里通义大模型上新,超逼真音视频生成SOTA!

机器之心

近日,阿里通义实验室推出了全新数字人视频生成大模型 OmniTalker,只需上传一段参考视频,不仅能学会视频中人物的表情和声音,还能模仿说话风格。相比传统的数...

10110

接入DeepSeek后的自由画布,做PPT还真的有点强。

数字生命卡兹克

因为它本身的产品形态,就支持无数的素材叠加,来最后输出一个任意模态的东西,可以是文本,可以是PPT,可能是音频,未来,可能还有视频。

7700

30秒就能完美复刻你的声音,这就是当今最强的中文AI语音克隆。

数字生命卡兹克

上传的语音最少上传10s的音频片段就可以克隆了,不过这个样本其实不是特别够,所以我一般推荐音频素材最好在30s左右,当然你也可以更长,不过一般不需要超过5分钟。

7910

微信公众号悄悄上线AI音色克隆,微信的一小步,却是AI的一大步。

数字生命卡兹克

这里我正好也解释一下,为啥现在微信、豆包、kimi等等产品,在做AI音色克隆的时候,都要让你现场读一段文本,再用这段音频去做音色克隆,而不是让你随便上传一段音频...

6010

10秒钟复刻AI付航吐槽一切,这就是现在最好的TTS声音克隆。

数字生命卡兹克

点击上传参考音频,即我们想要克隆的人的音频,这里我用了付航喜剧之王里的一段12秒的音频。音频不是越长越好,一定得15秒以下才行。

7810

用AI五分钟就能生成一档播客?感觉降维打击了。

数字生命卡兹克

不是,直接给一篇文章,然后用AI就能生成十几分钟的双人播客,两人有打断、有调侃、有语气,一个捧哏一个逗哽各司其职,比人聊的还好听,你敢信?

3300

5分钟教你用AI做表情迁移,让一只猫萌萌哒的唱歌。

数字生命卡兹克

跟之前的那种照片说话啥的不一样,那种是给一段音频,然后让照片根据音频动起来。阿里的EMO就是一个典型。

4200

OpenAI春季发布会:这是"Moss"的诞生,我们人类究竟该何去何从。

数字生命卡兹克

更重要的是可以实时推理音频、视觉和文本,注意这里是实时,实时,实时,推理的不是文本,是音频!视觉!

3700

一口气讲清楚:AGI、RAG、AIGC

老_张

看了很多关于AI大模型的文章,发现其中高频出现了一些专业名词,比如AGI、RAG、AIGC等。看着很高大上,但这些名词到底是什么意思,又预示着什么,普通人很难通...

11310

NotebookLM:基于 Gemini 的个性化 AI 研究助理

CoderJia

音频概述:otebookLM 就能生成一段类似播客的音频,深入探讨您资料中的关键概念。例如下面这段以两人对话的形式讲解论文:

10210

MediaToolkit:.NET 开发者的多媒体处理工具

郑子铭

在开发过程中处理音频和视频文件是许多应用程序的重要功能。MediaToolkit 是一个强大的库,帮助轻松处理这些多媒体文件。封装了 FFmpeg 的功能,使得...

10610

每周AI论文速递(240715-240719)

叶子的技术碎碎念

SpreadsheetLLM:优化大语言模型处理电子表格的能力 电子表格因其广泛的双维网格、多样化的布局和格式选项,给大语言模型(LLMs)带来了显著挑战。为此...

8000

HTML的笔记及展示(3)(绘图和多媒体支持相关)

鲲志说

实际应用中,我们使用HTML来完成绘图和多媒体相关功能不是很常用,所以只要知道,需要用时查阅使用即可。

4100

频率(Frequency)

jack.yang

频率作为描述周期性现象的一个重要物理量,其概念起源于对自然界中各种周期性运动现象的观察和分析。为了纪念德国物理学家赫兹在电磁学领域的杰出贡献,人们将频率的单位命...

9900
领券