MixLab科技+设计实验室-腾讯云开发者社区

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

MixLab科技+设计实验室

微信搜索mix-lab无界社区，人工智能&设计&科技，谈点设计，敲点代码，偶尔创作点人工智能实验产品。

专栏成员

584

文章

577424

阅读量

127

订阅数

唱歌就能画一幅图像？ #whisper-to-stable-diffusion

那么将 Whisper 与 Stable Diffusion 结合，可以直接完成语音生成图像的任务。用户可以语音输入一个短句，Whisper 会自动将语音转化为文本，接着，Stable Diffusion 会根据文本生成图像。

2023-01-11

4510

GUI界面如何设计？？｜Mixlab指南推荐

ios gui 语音识别

本文将重点介绍语音交互的GUI。设计的对象主要包括语音助手的GUI容器、语音助手和用户之间的对话流、语音助手的当前状态和播报内容，以及显示用户说话内容的ASR区域。

2021-05-28

1.1K0

VGUI融合的3种实现方式

gui 语音识别

一般来说，多模交互中的VGUI（VUI+GUI的简称）有三种实现方式，分别是应用级语音交互、可见即可说和系统级语音交互，真正对多模交互有用的实现方式是系统级语音交互，以下我会介绍三种实现方式的区别。

2020-03-12

1.4K0

没有更多了

社区活动

【纪录片】中国数据库前世今生

穿越半个世纪，探寻中国数据库50年的发展历程

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态