语音合成

文章/答案/技术大牛

发布

首页标签语音合成

#语音合成

拟真高效的文本转语音服务

老罗数字人刷屏背后，AI导演正偷偷改写直播「剧本」

机器之心 12天前2025-06-21 10:22:59

今年 618 大促期间，「交个朋友」在百度优选搞了场直播，不过这场直播的主角不是人，而是 AI。直播间里，罗永浩和朱萧木两个数字人配合默契，不抢话、不抬杠，只是...

9810

Spark-TTS: AI语音合成的"变声大师"

martinzh7 30天前2025-06-02 14:32:30

嘿，各位AI爱好者！还记得那些机器人般毫无感情的合成语音吗？或者那些只能完全模仿但无法创造的语音克隆？今天我要介绍的Spark-TTS模型，可能会让这些问题成为...

33110

你的声音能被复制？F5-TTS 带你体验“声音版 AI 绘图”

一只牛博 2025-05-312025-05-31 09:11:38

? F5-TTS 是一种最新的语音合成系统，支持从文本直接合成语音，同时能模仿任意目标声音。名字中的 “F5” 指：

21210

从 0 到 1 创建任务：云蝠外呼系统任务设置全流程教学

云小蝠聊大模型 2025-05-302025-05-30 10:24:43

选中刚建立的任务，点击右侧导入，点击模版，下载单任务模板，根据模板填写联系人号码，然后点击添加导入有数据的模板。

12510

VALL-E vs. Spark-TTS：两代零样本 TTS 模型横评

用户11657403 2025-05-162025-05-16 17:45:25

零样本文本转语音（Zero-Shot TTS）技术近年出现突破。微软于 2023 年发布的 VALL-E 模型仅需 3 秒语音示例便可克隆说话人声音，刷新业界对...

25610

Android原生开发TTS(Text To Speech)初始化失败的解决办法

用砖头敲代码 2025-04-252025-04-25 09:57:23

经过我摸索，下载sherpa-onnx-{version}-{arch}-zh-tts-engine开头的就是中文的tts引擎，后面的就是模型，大家按需下载就好...

44310

语音合成突破：F5R-TTS首次实现非自回归模型的GRPO优化，零样本克隆性能显著提升

机器之心 2025-04-212025-04-21 00:13:39

在人工智能技术日新月异的今天，语音合成（TTS）领域正经历着一场前所未有的技术革命。最新一代文本转语音系统不仅能够生成媲美真人音质的高保真语音，更实现了「只听一...

20910

虚拟偶像“C位出道”：数字浪潮下的崛起与财富密码（3/10）

正在走向自律 2025-04-122025-04-12 19:07:17

在当今数字化浪潮席卷全球的时代，虚拟偶像如同一颗颗璀璨的新星，在文化娱乐的天空中闪耀着独特的光芒。从全球粉丝破亿的虚拟歌姬 “初音未来”，到国内人气爆棚的洛天依...

40610

突破性语音合成技术！Spark-TTS：用大模型打造你的专属AI语音助手

AI浩 2025-03-172025-03-17 15:43:56

你是否想过，未来的语音助手不仅能“说话”，还能根据你的需求调整音色、语速甚至情绪？近日，一项名为Spark-TTS的突破性技术横空出世，它基于大语言模型（LLM...

2.4K10

呼叫智能体：传统呼叫中心的智能化延伸

更新中 2025-03-042025-03-04 14:03:02

在人工智能技术高速发展的今天，呼叫智能体（Call Agent）正成为企业服务升级的核心引擎。它不仅是传统呼叫中心的智能化延伸，更是融合语音克隆、多语种交互、...

72010

什么是呼叫智能体

更新中 2025-02-262025-02-26 15:19:02

在人工智能技术快速发展的今天，呼叫智能体（AI Call Agent）作为智能客服领域的核心应用之一，正逐渐改变企业与用户的交互方式。它不仅能够实现传统呼叫中心...

29210

为什么应该关注AI外呼技术？

更新中 2025-02-252025-02-25 17:03:00

在客户服务领域，呼叫中心一直是企业与用户沟通的核心渠道。然而，传统的人力呼叫模式正面临效率瓶颈和高昂成本的双重挑战。随着人工智能技术的快速发展，AI外呼系统凭借...

24910

万字长文 | 让大模型“开口”说话：从ASR到端到端语音大模型的进化之旅

AI研思录 2025-02-202025-02-20 19:42:30

在我们日常生活中，语音助手已经变得越来越普遍。无论是苹果的Siri还是小米的小爱同学，它们都在以惊人的速度渗透到我们的日常生活中。这些语音助手不仅能够帮我们查询...

1.3K20

一图背单词

AlphaHinex 2025-02-102025-02-10 15:51:33

拍摄一张包含英文单词（词组、句子）的图片，通过扣子[1] 中的智能体：一图背单词[2] 上传并设定 tag，之后在 word-practice[3] 中进行随...

9100

AI女友养成记 CosyVoice vs MiniCPM-o2.6

疯狂的KK 2025-01-202025-01-20 20:11:56

CosyVoice 是阿里巴巴通义实验室推出的一款开源语音生成大模型，专注于语音合成技术。它通过先进的技术架构，能够将文本内容转化为高度自然、拟人化的语音输出。...

55410

LangSegment：多语言(97种语言)的混合文本自动分词工具

luckpunk

腾讯云 TDP ｜先锋会员 (已认证)

2025-01-182025-01-18 09:56:56

主要用途：它非常适合各种 TTS 语音合成项目，多语种混合文本的前端推理，和预处理后端训练。

42610

让 Agent 具备语音交互能力：技术突破与应用前景（16/30）

正在走向自律 2025-01-022025-01-02 08:37:34

在当今数字化时代，人机交互方式正经历着深刻的变革。从早期的命令行界面到图形用户界面，再到如今日益普及的语音交互，人们对于与机器沟通的便捷性和自然性有了更高的追求...

42310

#语音合成

老罗数字人刷屏背后，AI导演正偷偷改写直播「剧本」

Spark-TTS: AI语音合成的"变声大师"

你的声音能被复制？F5-TTS 带你体验“声音版 AI 绘图”

从 0 到 1 创建任务：云蝠外呼系统任务设置全流程教学

VALL-E vs. Spark-TTS：两代零样本 TTS 模型横评

Android原生开发TTS(Text To Speech)初始化失败的解决办法

语音合成突破：F5R-TTS首次实现非自回归模型的GRPO优化，零样本克隆性能显著提升

虚拟偶像“C位出道”：数字浪潮下的崛起与财富密码（3/10）

突破性语音合成技术！Spark-TTS：用大模型打造你的专属AI语音助手

呼叫智能体：传统呼叫中心的智能化延伸

什么是呼叫智能体

为什么应该关注AI外呼技术？

万字长文 | 让大模型“开口”说话：从ASR到端到端语音大模型的进化之旅

一图背单词

AI女友养成记 CosyVoice vs MiniCPM-o2.6

LangSegment：多语言(97种语言)的混合文本自动分词工具

让 Agent 具备语音交互能力：技术突破与应用前景（16/30）

相关产品

热门专栏

腾讯技术工程官方号的专栏

AI科技大本营的专栏

QQ音乐技术团队的专栏

企鹅号快讯

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐