语音 - 标签 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

首页标签语音

#语音

视频推理框架进展I

用户10637292 1天前2026-07-13 18:45:17

摘要：近年来，测试时间优化的进步使得大模型（LLM）在推理能力方面取得了显著的提升，使它们能够解决数学和编码方面高度复杂的问题。然而，多模式大模型（MLLM）的...

3310

【AI Agent展】思必驰天琴语音助手——新一代智能座舱人机对话系统

数据猿 1天前2026-07-13 15:28:38

天琴语音助手是思必驰自主研发的新一代智能座舱人机对话系统，专为车载场景打造。产品基于思必驰自研的全栈对话式AI技术体系和“1+N”大模型智能体架构，融合车控、导...

4610

伪造 Microsoft Entra 通行密钥注册的语音钓鱼攻击研究

芦笛

中国互联网络信息中心｜工程师 (已认证)

3天前2026-07-12 07:56:12

针对 2026 年 4 月以来 O-UNC-066 威胁组织发起的新型语音钓鱼（Vishing）攻击，本文深入剖析其伪造 Microsoft Entra 通行密...

9110

GPT-Live上线：ChatGPT语音终于能像正常人说话了

袁锐钦 4天前2026-07-11 08:32:21

7月8日，OpenAI发布了新语音模型GPT-Live，全面替换ChatGPT原有的语音模式。

56330

老婆问我什么是多模态能力

不惑

腾讯云TDP ｜产品KOL (已认证)

4天前2026-07-10 19:50:40

那天晚上，我躺在沙发上刷手机，老婆突然从厨房探出头来问我："你天天看那些AI新闻，我问你个事儿——什么叫多模态能力？我看好多文章都在说这个词，感觉很厉害的样子。...

6510

写作和思考，应该被AI改变么？

程序新视界 4天前2026-07-10 18:23:22

此时，停下来用手机打字，真的太慢，也影响散步的节奏。于是就尝试了一种新的记录方式：语音转文字（属于传统AI的功能范畴）。打开手机自带的记事本，用输入法的语音输入...

7310

AI（原生）产品中如何平衡自然语言交互与GUI交互？（第二讲）

程序新视界 4天前2026-07-10 18:21:09

这个问题看似简单，却极大的决定的产品发展的方向以及内置功能的技术实现。比如，市面上有这样一款机器人，它没有图形化界面输入输出，只有基于语音的输入和音频的输出，最...

11510

在 AI 面前，不要再“端着”说话了

桑榆肖物 6天前2026-07-08 17:11:56

作为一个每天高强度使用 AI 辅助编程的人，我对大模型的各种“脾气”算是摸得比较熟了。从写代码、查 Bug，到拆需求、整理思路，AI 已经成了我工作流里很重要的...

13810

个人办公 AI 选型指南：桌面 AI 智能体平台怎么选

hollyx 6天前2026-07-08 17:00:28

摘要：个人用户选桌面 AI 智能体，更看重上手门槛、免费额度与单兵生产力。本文从个人视角对比主流平台，给出可按需套用的选型思路。一、个人为何需要桌面 AI ...

22410

我在地铁上用手机写完了一个网页，Trae手机版实测

袁锐钦 6天前2026-07-08 16:39:38

操作路径：打开Trae App → 点击底部输入框 → 语音或文字输入指令 → 选择执行设备（云端/我的电脑）→ 等结果推送。

17510

语音钓鱼受害非现场理赔与交易标识优化监管机制研究

芦笛

中国互联网络信息中心｜工程师 (已认证)

11天前2026-07-04 07:55:38

语音钓鱼（Voice Phishing）长期成为韩国金融领域高频电信诈骗类型，传统线下网点提交理赔材料的处置模式存在流程繁琐、受害群众维权成本高、资金止付溯源效...

11310

牛！一款国产AI语音登顶全球第一，首个可编辑语音模型来了！

开源星探 11天前2026-07-03 12:56:34

无论是短视频配音、有声书制作，还是游戏角色语音生成，AI语音都在深刻改变着我们的创作方式。

40110

Claude Code 语音模式上线！按住空格说话，Coding 效率直接起飞

用户1640761 13天前2026-07-01 21:50:06

各位正在用 Claude Code 刷终端、修 Bug、建 Feature 的 coder 们，好消息直接砸脸了！

16410

Voicebox：本地优先的 AI 语音工作室

山行AI 13天前2026-07-01 18:28:40

这就是 Voicebox 的核心价值：它把语音输入、语音输出、语音创作和 Agent 语音交互放在同一个本地闭环里。

47610

PHP Neuron V3 正式全面支持多模态

Tinywan 13天前2026-07-01 15:01:49

这些组件对于创建本地语音助手以实现免提与模型交互非常有帮助。典型的流程包括捕获音频，使用单独的语音转文本（STT）服务将其转录为文本，将文本发送到代理进行处理，...

12710

AI 赋能自动语音诈骗全链路检测与 STIR/SHAKEN 协同防御研究

芦笛

中国互联网络信息中心｜工程师 (已认证)

13天前2026-07-01 11:19:37

AI 技术规模化普及推动自动语音外呼（Robocall）、语音钓鱼、垃圾骚扰通信形成产业化黑产，传统静态黑名单、单一号码拦截手段难以适配攻击者动态规避策略。美国...

15510

Shopify Shop 应用虚假订单收据语音钓鱼攻击机理与防护研究

芦笛

中国互联网络信息中心｜工程师 (已认证)

15天前2026-06-30 10:53:11

移动端统一订单聚合类 App 依托多渠道订单同步能力简化用户购物查询流程，但数据聚合机制带来的信任边界模糊问题催生新型社会工程钓鱼攻击。本文以 2026 年 6...

17510

DevSecOps 视角下语音钓鱼（Vishing）通信安全全链路防护研究

芦笛

中国互联网络信息中心｜工程师 (已认证)

15天前2026-06-30 10:00:09

AI 深度伪造语音技术普及推动网络攻击由邮件钓鱼（Phishing）向语音钓鱼（Vishing）迁移，传统 DevSecOps 体系仅聚焦代码、应用层安全，忽略...

12810

自部署 LiveKit 的降噪与回声消除：能力边界与工程选型

buzzfrog 16天前2026-06-28 11:37:07

这已经能覆盖很多常见场景。只有当用户环境很吵、语音识别准确率要求很高，或者存在多人背景说话干扰时，再考虑更强的降噪或语音隔离方案。

11010

#语音

视频推理框架进展I

【AI Agent展】思必驰天琴语音助手——新一代智能座舱人机对话系统

伪造 Microsoft Entra 通行密钥注册的语音钓鱼攻击研究

GPT-Live上线：ChatGPT语音终于能像正常人说话了

老婆问我什么是多模态能力

写作和思考，应该被AI改变么？

AI（原生）产品中如何平衡自然语言交互与GUI交互？（第二讲）

在 AI 面前，不要再“端着”说话了

个人办公 AI 选型指南：桌面 AI 智能体平台怎么选

我在地铁上用手机写完了一个网页，Trae手机版实测

语音钓鱼受害非现场理赔与交易标识优化监管机制研究

牛！一款国产AI语音登顶全球第一，首个可编辑语音模型来了！

Claude Code 语音模式上线！按住空格说话，Coding 效率直接起飞

Voicebox：本地优先的 AI 语音工作室

PHP Neuron V3 正式全面支持多模态

AI 赋能自动语音诈骗全链路检测与 STIR/SHAKEN 协同防御研究

Shopify Shop 应用虚假订单收据语音钓鱼攻击机理与防护研究

DevSecOps 视角下语音钓鱼（Vishing）通信安全全链路防护研究

自部署 LiveKit 的降噪与回声消除：能力边界与工程选型

热门专栏

腾讯开源的专栏

腾讯云服务器团队的专栏

张善友的专栏

TEG云端专业号的专栏

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐