语音 - 标签 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

首页标签语音

#语音

完整FreeSWITCH语音处理模块mod_audio_stream技术实现细节分享

杜金房 12小时前2026-07-17 20:22:33

本文档涵盖 mod_audio_stream，这是一个 FreeSWITCH 模块，用于从活动通话信道捕获音频，并通过 WebSocket 或 TCP 连接将其...

900

ECCV 2026 | 武大提出Unison：统一的音视频协同生成框架

Amusi 21小时前2026-07-17 10:49:41

本文介绍了武汉大学行为理解与视觉感知实验室（HUVPR-Lab）在ECCV2026上发表的研究成果。该工作针对以人为中心的音视频联合生成中长期存在的"语音-音...

2500

别再裸面了，搭个 AI 面试官先练一轮

王中阳AI编程 2天前2026-07-15 12:55:37

我没用豆包的语音功能——豆包模型不太行。方案是：龙虾 + 讯飞输入法语音输入。讯飞的语音识别准确率很高，技术术语识别也没问题。效果和豆包原生语音差不多，但模型用...

11810

视频推理框架进展I

用户10637292 4天前2026-07-13 18:45:17

摘要：近年来，测试时间优化的进步使得大模型（LLM）在推理能力方面取得了显著的提升，使它们能够解决数学和编码方面高度复杂的问题。然而，多模式大模型（MLLM）的...

9110

【AI Agent展】思必驰天琴语音助手——新一代智能座舱人机对话系统

数据猿 4天前2026-07-13 15:28:38

天琴语音助手是思必驰自主研发的新一代智能座舱人机对话系统，专为车载场景打造。产品基于思必驰自研的全栈对话式AI技术体系和“1+N”大模型智能体架构，融合车控、导...

12110

伪造 Microsoft Entra 通行密钥注册的语音钓鱼攻击研究

芦笛

中国互联网络信息中心｜工程师 (已认证)

6天前2026-07-12 07:56:12

针对 2026 年 4 月以来 O-UNC-066 威胁组织发起的新型语音钓鱼（Vishing）攻击，本文深入剖析其伪造 Microsoft Entra 通行密...

10810

GPT-Live上线：ChatGPT语音终于能像正常人说话了

袁锐钦 7天前2026-07-11 08:32:21

7月8日，OpenAI发布了新语音模型GPT-Live，全面替换ChatGPT原有的语音模式。

64830

老婆问我什么是多模态能力

不惑

腾讯云TDP ｜产品KOL (已认证)

7天前2026-07-10 19:50:40

那天晚上，我躺在沙发上刷手机，老婆突然从厨房探出头来问我："你天天看那些AI新闻，我问你个事儿——什么叫多模态能力？我看好多文章都在说这个词，感觉很厉害的样子。...

7110

写作和思考，应该被AI改变么？

程序新视界 7天前2026-07-10 18:23:22

此时，停下来用手机打字，真的太慢，也影响散步的节奏。于是就尝试了一种新的记录方式：语音转文字（属于传统AI的功能范畴）。打开手机自带的记事本，用输入法的语音输入...

7510

AI（原生）产品中如何平衡自然语言交互与GUI交互？（第二讲）

程序新视界 7天前2026-07-10 18:21:09

这个问题看似简单，却极大的决定的产品发展的方向以及内置功能的技术实现。比如，市面上有这样一款机器人，它没有图形化界面输入输出，只有基于语音的输入和音频的输出，最...

12510

在 AI 面前，不要再“端着”说话了

桑榆肖物 9天前2026-07-08 17:11:56

作为一个每天高强度使用 AI 辅助编程的人，我对大模型的各种“脾气”算是摸得比较熟了。从写代码、查 Bug，到拆需求、整理思路，AI 已经成了我工作流里很重要的...

14510

个人办公 AI 选型指南：桌面 AI 智能体平台怎么选

hollyx 9天前2026-07-08 17:00:28

摘要：个人用户选桌面 AI 智能体，更看重上手门槛、免费额度与单兵生产力。本文从个人视角对比主流平台，给出可按需套用的选型思路。一、个人为何需要桌面 AI ...

27310

我在地铁上用手机写完了一个网页，Trae手机版实测

袁锐钦 9天前2026-07-08 16:39:38

操作路径：打开Trae App → 点击底部输入框 → 语音或文字输入指令 → 选择执行设备（云端/我的电脑）→ 等结果推送。

21610

语音钓鱼受害非现场理赔与交易标识优化监管机制研究

芦笛

中国互联网络信息中心｜工程师 (已认证)

14天前2026-07-04 07:55:38

语音钓鱼（Voice Phishing）长期成为韩国金融领域高频电信诈骗类型，传统线下网点提交理赔材料的处置模式存在流程繁琐、受害群众维权成本高、资金止付溯源效...

11610

牛！一款国产AI语音登顶全球第一，首个可编辑语音模型来了！

开源星探 14天前2026-07-03 12:56:34

无论是短视频配音、有声书制作，还是游戏角色语音生成，AI语音都在深刻改变着我们的创作方式。

42910

Claude Code 语音模式上线！按住空格说话，Coding 效率直接起飞

用户1640761 16天前2026-07-01 21:50:06

各位正在用 Claude Code 刷终端、修 Bug、建 Feature 的 coder 们，好消息直接砸脸了！

18010

Voicebox：本地优先的 AI 语音工作室

山行AI 16天前2026-07-01 18:28:40

这就是 Voicebox 的核心价值：它把语音输入、语音输出、语音创作和 Agent 语音交互放在同一个本地闭环里。

53710

PHP Neuron V3 正式全面支持多模态

Tinywan 16天前2026-07-01 15:01:49

这些组件对于创建本地语音助手以实现免提与模型交互非常有帮助。典型的流程包括捕获音频，使用单独的语音转文本（STT）服务将其转录为文本，将文本发送到代理进行处理，...

12910

#语音

完整FreeSWITCH语音处理模块mod_audio_stream技术实现细节分享

ECCV 2026 | 武大提出Unison：统一的音视频协同生成框架

别再裸面了，搭个 AI 面试官先练一轮

视频推理框架进展I

【AI Agent展】思必驰天琴语音助手——新一代智能座舱人机对话系统

伪造 Microsoft Entra 通行密钥注册的语音钓鱼攻击研究

GPT-Live上线：ChatGPT语音终于能像正常人说话了

老婆问我什么是多模态能力

写作和思考，应该被AI改变么？

AI（原生）产品中如何平衡自然语言交互与GUI交互？（第二讲）

在 AI 面前，不要再“端着”说话了

个人办公 AI 选型指南：桌面 AI 智能体平台怎么选

我在地铁上用手机写完了一个网页，Trae手机版实测

语音钓鱼受害非现场理赔与交易标识优化监管机制研究

牛！一款国产AI语音登顶全球第一，首个可编辑语音模型来了！

Claude Code 语音模式上线！按住空格说话，Coding 效率直接起飞

Voicebox：本地优先的 AI 语音工作室

PHP Neuron V3 正式全面支持多模态

热门专栏

腾讯开源的专栏

腾讯云服务器团队的专栏

张善友的专栏

TEG云端专业号的专栏

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐