作者 | QCon 全球软件开发大会
如果你也关注 Agent、AI 搜索、多模态、工程化等话题,一定不要错过这 100+ 可落地的实践案例!
10 月 23 日 -10 月 25 日,QCon 全球软件开发大会将在上海举办。本次大会将聚焦 Agentic AI、具身智能、强化学习框架、端侧大模型实践、多智能体协作等热门话题,以及 AI 时代下的软件研发、可观测、开源等技术实践,邀请来自腾讯、阿里、字节跳动、华为、蚂蚁集团、小红书等企业的技术专家,和来自清华大学、北京邮电大学、浙江大学的顶尖高校讲师,和你一起重构技术认知与能力边界!
阶跃星辰语音模型负责人杨学锐已确认出席并发表题为《端到端语音模型:从语音表征到模型架构》的主题分享。在大语言模型(LLM)迅猛发展的时代,语音技术正迎来新一轮变革。本次演讲将系统梳理语音模型从传统架构走向端到端融合的演进路径,深入分析语音表征的不同形式与模型设计的关键思路,涵盖语义与声学 token 的权衡、多尺度解码结构、训练策略等重要议题。同时,将直面实践中诸如数据差异、推理效率、模态对齐等核心挑战,并分享以 Step-Audio2 为代表的先进端到端语音模型在实际部署与落地中的实践经验。无论您是对语音技术前沿感兴趣的研究者,还是关注语音大模型落地应用的工程师,本次演讲都将为您提供有价值的技术洞察与实践参考。
杨学锐,历任阶跃星辰语音模型负责人,大疆创新音频负责人,云从科技语音算法负责人。在相关领域深耕多年,发表论文、专利、书籍若干。他在本次会议的详细演讲内容如下:
演讲提纲
您认为,这样的技术在实践过程中有哪些痛点?
演讲亮点
听众收益
除此之外,本次大会还策划了多模态融合技术与创新应用、混沌工程与全链路压测实践、Data Infra for AI、Agentic AI、加速与反哺:AI 时代的可观测实践、Vibe Coding、端侧大模型的创新与应用、大模型推理的工程实践、AI 搜索技术的深水区、模型训练与微调、具身智能:当 AI 学会“动手思考”、大模型驱动的制造革命、AI4SE:软件研发提质增效实践、AI 重塑视觉创作体验、从“炫技”走向“实用”的 AI 产品、大模型驱动的智能数据分析等 20 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 100+ 资深专家在 QCon 上海站现场带来前沿技术洞察和一线实践经验。