首页
学习
活动
专区
工具
TVP
发布

MixLab科技+设计实验室

微信搜索mix-lab无界社区,人工智能&设计&科技,谈点设计,敲点代码,偶尔创作点人工智能实验产品。
专栏成员
584
文章
577424
阅读量
127
订阅数
唱歌就能画一幅图像? #whisper-to-stable-diffusion
那么将 Whisper 与 Stable Diffusion 结合,可以直接完成语音生成图像的任务。用户可以语音输入一个短句,Whisper 会自动将语音转化为文本,接着,Stable Diffusion 会根据文本生成图像。
mixlab
2023-01-11
4510
GUI界面如何设计??|Mixlab指南推荐
本文将重点介绍语音交互的GUI。设计的对象主要包括语音助手的GUI容器、语音助手和用户之间的对话流、语音助手的当前状态和播报内容,以及显示用户说话内容的ASR区域。
mixlab
2021-05-28
1.1K0
VGUI融合的3种实现方式
一般来说,多模交互中的VGUI(VUI+GUI的简称)有三种实现方式,分别是应用级语音交互、可见即可说和系统级语音交互,真正对多模交互有用的实现方式是系统级语音交互,以下我会介绍三种实现方式的区别。
mixlab
2020-03-12
1.4K0
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档