首页
学习
活动
专区
圈层
工具
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

#语音

AI懒羊羊唱歌绝佳的人声训练方法

疯狂的KK

    前几天就着手准备指定人物唱歌的教程,苦于还要抽时间去收集素材,就只是短期的把整个流程跑了一下,全程没有报错,就在素材这里不想花过多的时间,下午突然想到了...

1200

3mm超薄「随身AI大脑」来了!全球首个Agentic神器让打工人疯狂种草

新智元

而只要在「翻译成另一门语音」中选择中文,这段长达10分钟的法语音频,就会立刻被翻译成通顺流畅的中文。

12010

国产 KT148A 重复擦写语音芯片:420 秒存储 + 串口更换 + 1.5 元高性价比

清月电子

KT148A 是 flash 型芯片,内置 512Kbyte 可重复擦写空间,程序和语音空间都在同一个内置 flash 里。程序由 CPU 读取在 ram 运行...

9010

KT142C-SOP16 语音芯片:6 段音乐 IO 控制与纽扣电池供电选型方案

清月电子

需实现 6 段音乐的独立控制,要求每段音乐对应独立 IO 触发端口,需满足以下技术条件:

5100

KT142A 语音芯片插播功能使用指南及文件存储命名规则

清月电子

插播"ADVERT1"的文件夹,曲目为"001" ==7E 25 02 01 01 EF

5200

老罗数字人刷屏背后,AI导演正偷偷改写直播「剧本」

机器之心

今年 618 大促期间,「交个朋友」在百度优选搞了场直播,不过这场直播的主角不是人,而是 AI。直播间里,罗永浩和朱萧木两个数字人配合默契,不抢话、不抬杠,只是...

8710

首个全面梳理语音大模型发展脉络的权威综述,入选ACL 2025主会

机器之心

想象一下,如果 AI 能够像人类一样自然地进行语音对话,不再需要传统的「语音转文字(ASR)- 文本大模型处理(LLM)- 文字转语音(TTS)」的繁琐流程,而...

14210

KT148A 语音芯片串口下载工具报错原因及排错方法

清月电子

文档聚焦 KT148A 语音芯片串口下载工具报错问题,用户在 Win11 等系统使用时弹出 Microsoft Visual C++ Debug Library...

7911

13年死磕一个真理,这家中国AI黑马冲刺IPO

新智元

在深度学习尚未普及的2012年,云知声敏锐捕捉到语音交互的变革机遇。公司推出的「语音云」平台开创性地采用DNN算法,将中文语音识别准确率提升至一个新的水平。

7610

为什么 KT142C 芯片 BUSY 脚空闲高电平仅 0.2V?附低功耗模式配置指南

清月电子

KT142C芯片busy引脚空闲输出的高电平只有零点几v,busy引脚有什么特别的吗?

6100

Android中TextToSpeech的使用

计蒙不吃鱼

(2)TextToSpeech.QUEUE_ADD:该模式下会把新的语音任务放到语音任务之后,等前面的语音任务执行完了才会执行新的语音任务。

8810

Android中TextToSpeech的使用

计蒙不吃鱼

(2)TextToSpeech.QUEUE_ADD:该模式下会把新的语音任务放到语音任务之后,等前面的语音任务执行完了才会执行新的语音任务。

8810

一手评测Seedance 1.0 pro,字节首次登顶视频大模型竞技场的大杀器来了。

数字生命卡兹克

其中大部分都写过了,比如语音播客模型,就是前几天我写的扣子的AI播客,底层就是这个。

35010

智能体还能配置MCP?手把手用百宝箱打造一个音途智游,让旅游加入语音

LucianaiB

腾讯云TDP | 宣传大使 (已认证)

这一构想随着百宝箱平台最新上线的MCP(多模态内容处理)功能变为现实。特别是平台已预配置的Minimax MCP解决方案,为用户提供了开箱即用的语音合成能力。本...

11710

基于PYNQ的智能垃圾分类系统

FPGA技术江湖

大侠好,欢迎来到FPGA技术江湖,江湖偌大,相见即是缘分。大侠可以关注FPGA技术江湖,在“闯荡江湖”、"行侠仗义"栏里获取其他感兴趣的资源,或者一起煮酒言欢。...

16910

混元语音数字人模型,开源!

腾讯开源

这一能力来自5月28日腾讯混元发布并开源的语音数字人模型HunyuanVideo-Avatar,由腾讯混元视频大模型(HunyuanVideo)及腾讯音乐天琴实...

13210

深度解析一对一视频语音通话技术:打造卓越直播交友体验​

山东布谷科技_孙哥

在数字化社交迅猛发展的当下,一对一视频语音通话已成为社交互动的核心方式,尤其是在直播交友app领域,其重要性愈发凸显。要构建出色的一对一直播交友平台,需深入理解...

7210

谷歌 AI Studio 实时视频对话终于支持中文了!屏幕共享+语音,Gemini 2.5 Flash 原生音视频加持。

AI进修生

ChatGPT Plus 虽然也有实时视频和屏幕共享功能,但每天使用次数限制比较大,而且只能在手机端使用,实在不太方便。

10000

openai-go v1.3.0正式发布:全新实时与音频模型全面上线,打造智能交互新时代!

福大大架构师每日一题

版本最显著的改进是新增对最新实时模型和音频模型的支持。实时模型能够实现低延迟的智能对话和数据处理,适用于对响应速度和交互即时性要求极高的应用场景,而音频模型则扩...

11610

ChatGPT-4o 有何特别之处?

石臻臻的杂货铺[同名公众号]

输入输出过程:用户发出的语音请求经过自动语音识别(ASR)转为文本(这里用的Whisper),文本经过大语言模型处理生成响应文本,响应文本再经过文本转语音(TT...

15610
领券