comwkang

文章/答案/技术大牛

发布

LV0

我关注的人

使用CLIP和LLM构建多模态RAG系统

在本文中我们将探讨使用开源大型语言多模态模型(Large Language Multi-Modal)构建检索增强生成(RAG)系统。本文的重点是在不依赖Lang...

deephub 2024-01-172024-01-17 13:46:36

数据类型、系统、LLM、人工智能、模型

语雀迁移至Obsidian

之前一直使用Typora+各种博客(Wordpress/Hexo/Typecho)来进行笔记和写作，后来接触并爱上了语雀，主要是贴图太方便了。（使用Typora...

Naraku 2022-01-202022-01-20 09:00:31

编程算法、python、腾讯云开发者社区、https、网络安全

Encoder-Decoder 和 Seq2Seq

Encoder-Decoder 模型主要是 NLP 领域里的概念。它并不特值某种具体的算法，而是一类算法的统称。Encoder-Decoder 算是一个通用的框...

easyAI 2019-12-182019-12-18 17:49:41

语音识别、机器翻译、NLP技术、编程算法

端到端声源分离研究：现状、进展和未来

什么是端到端音源分离呢？罗艺老师首先介绍了端到端音源分离的定义。从名称来看，端到端的含义是模型输入源波形后直接输出目标波形，不需要进行傅里叶变换将时域信号转换至...

深蓝学院 2020-09-072020-09-07 17:44:21

语音识别、语音合成、NLP技术

ffmpeg针对音视频常规命令整理

FFmpeg是一套可以用来记录、转换数字音频、视频，并能将其转化为流的开源计算机程序。采用LGPL或GPL许可证。它提供了录制、转换以及流化音视频的完整解决方案...

HI hero 2021-12-272021-12-27 15:11:54

人脸核身、语音识别

女朋友生气了吗？算法比直男更懂她

场景描述：利用 AI 技术判断一个人的情绪通常有两种途径，一种是通过面部表情，另一种是通过语音。前者已经比较成熟，而语音识别情感方面的研究，正在快速发展。近期，...

HyperAI超神经 2019-11-292019-11-29 11:57:15

语音识别、神经网络

GitHub标星近10万：只需5秒音源，这个网络就能实时“克隆”你的声音

本文中，Google 团队提出了一种文本语音合成（text to speech）神经系统，能通过少量样本学习到多个不同说话者（speaker）的语音特征，并合成...

AI科技大本营 2019-11-142019-11-14 13:55:23

语音识别、语音合成、编程算法

Andrew Ng(吴恩达)关于机器学习职业生涯以及阅读论文的一些建议

既然你已经在阅读这篇文章了，那么你可能已经知道该领域的先驱之一Andrew Ng是谁，并且你可能对会对他关于如何建立机器学习职业生涯的建议感兴趣。

zenRRan 2019-10-112019-10-11 12:00:49

机器学习、神经网络、人工智能、深度学习、语音识别

吴恩达：关于机器学习职业生涯以及阅读论文的一些建议

Datawhale 2019-10-092019-10-09 16:50:10

机器学习、神经网络、人工智能、深度学习、语音识别

个人简介

暂未填写公司和职称
暂未填写个人简介
暂未填写技能专长
暂未填写学校和专业
暂未填写个人网址
暂未填写所在城市
加入社区时间：2022-07-12

个人成就

TA 很懒，什么都没有留下╮（╯＿╰）╭

关注了：9关注者：0