首页
学习
活动
专区
工具
TVP
发布

深度学习|机器学习|歌声合成|语音合成

专栏作者
306
文章
290515
阅读量
36
订阅数
[算法前沿]--061-生成式 AI 的发展方向,是 Chat 还是 Agent?
AI Agent是一种超越简单文本生成的人工智能系统。它使用大型语言模型(LLM)作为其核心计算引擎,使其能够进行对话、执行任务、推理并展现一定程度的自主性。简而言之,Agent是一个具有复杂推理能力、记忆和执行任务手段的系统。
三更两点
2024-02-09
2560
[算法前沿]--003-AGI通用人工智能模型对安全的影响和开源的大模型
2023年虽然才开始不久,但毫无疑问ChatGPT是今年最重大的科技话题之一。Chat GPT是生成式人工智能的开山之作,出道即巅峰,是继PC互联网、移动互联网之后又一次革命性创新,其创新性在于突破之前决策式AI基于规则的算法模型框架,跳出之前“数据搬运工”的传统模式,即在海量数据中寻找符合规则策略的数据,经过比对计算,基于当前的环境、条件和状态,准确的找到符合条件的数据,一步一步的走向算法和程序的终点,得出一个确定的决策。 生成式AI为决策式AI赋予了灵魂和思想,决策式AI需要在海量数据中挑选并使用符合规则的数据,自身并不创造新的数据,生成式AI的革命性创新的根本在于将逻辑和伦理以算法的形式植入,并产生新的数据,相当于为算法植入了思想和灵魂,尽管其智能水平与高水平人类仍有较大差距,但生成式AI在可无限扩展的算力和数据加持下,其成长性和发展前景将无比光明。 从2022年底至今,Chat GPT已经从3.0快速迭代到3.5,从3.5迭代到4.0,配合市场营销的宣传,ChatGPT已经成功打造了几个标签: l 高富帅:超级算力+海量数据+机器学习+资本追捧 l 自学成才:自我学习,自我提升,快速进阶 l 会推理:读懂复杂问题,具备逻辑能力
三更两点
2023-04-28
6050
第14节:lstm原理及numpy
文章目录 lstm原理 rnn lstm实例 lstm原理 文本相关。主要应用于自然语言处理(NLP)、对话系统、情感分析、机器翻译等等领域,Google翻译用的就是一个7-8层的LSTM模型。 时序相关:就是时间序列的预测,诸如预测天气/温度/. 为何全连接层和卷积神经网络无法处理序列问题,因为缺乏记忆模块,无法记忆之前输入的内容. rnn 📷 - 简单的rnn。输入是2维的(timesteps, input_features). 这里的loop就是在timesteps上的loop:每一个时刻t,RNN
三更两点
2022-04-13
3660
第12节:RNN原理及numpy实现
文章目录 RNN RNN训练 numpy复现 RNN 📷 X t 表 示 t 时
三更两点
2022-01-06
3210
第10节卷积神经网络CNN及其numpy复现
池化:对不同位置的特征进行聚合统计称为池化.目的就是减少特征,降低了信息输出的维度.
三更两点
2022-01-06
3340
决策树原理及numpy实现版
(1)若D中所有实例属于同一类 则T为单结点树,并将类 ​作为该结点的类标 记,返回T; (2)若A=Ø,则T为单结点树,并将D中实例数最大的类 作为该结点的类标记, 返回T; (3)否则,计算A中各特征对D的信息增益,选择信息增益最大的特征 Ag ; (4)如果Ag 的信息增益小于阈值ξ ,则置T为单结点树,并将D中实例数最大的类 ​作为该结点的类标记,返回T; (5)否则,对Ag 的每一可能值 ​,依Ag = i​将D分割为若干非空子集 ​,将 中实例 数最大的类作为标记,构建子结点,由结点及其子结点构成树T,返回T; (6)对第i个子结点,以 ​为训练集,以A-{Ag }为特征集,递归地调用步(1)~步(5),得到子树 返回 。
三更两点
2021-12-15
6830
第2节:支持向量机SVM即numpy
. 几何间隔:函数间隔可以表示分类预测的正确性及确信度。但是选择分离超平面时,只有函数间 隔还不够。因为只要成比例地改变w和b,例如将它们改为2w和2b,超平面并没有改变, 但函数间隔却成为原来的2倍。我们可以对分离平面的法向量加约束,比如规范化
三更两点
2021-12-04
4150
机器学习原理:GBDT
文章目录 GBDT 原理 例子 问题 实例 GBDT GBDT既可以用于分类也可以用于回归. GBDT(Gradient Boosting Decision Tree,梯度提升决策树树)是一种迭代的决策树算法,该算法由多棵决策树组成,所有树的结论累加起来做最终答案。 GBDT的思想使其具有天然优势可以发现多种有区分性的特征以及特征组合。业界中,Facebook使用其来自动发现有效的特征、特征组合,来作为LR模型中的特征,以提高 CTR预估(Click-Through Rate Predicti
三更两点
2021-08-18
3720
机器学习原理解读:决策树
文章目录 决策树 decision tree 原理 极大似然 决策树修剪 剪枝类型 实例 总结 决策树 decision tree 属于监督学习算法,可以用于分类和回归问题 适合离散数据的分析:连续转化为离散数据 发展历程:ID3(离散变量的分类问题)->C4.5(离散变量和连续变量的分类问题)->CART(可以处理离散变量和连续变量的分类回归问题) ID3和C4.5可以多分叉,Cart只能是二叉树;决策树在分裂时,判段标准不同.ID3以信息增益为标准;c4.5亿信息增益率为标准;car
三更两点
2021-08-10
2560
机器学习原理-支持向量机
支持向量机(SVM,Support Vector Machine)是一种监督学习方法。是以超平面的方式对二类的分类算法。
三更两点
2021-08-10
2670
深度学习面试必备题目
基础知识 1. 为何深层神经网络难以训练 梯度消失:反向调整权重的时候 前面层的梯度越来越小,导致前面层的学习慢于后面层; 梯度爆炸:在循环神经网络中,网络更新过程中梯度不断积累,导致网络的权重值大幅度更新,网络不稳定.在极端的情况下.权重值甚至会溢出,变成nan值,再也无法更新. 权重矩阵的退化导致模型的有效自由度减少. 2. 深度学习和机器学习的区别是什么 机器学习依赖行业分析人员的特征,从而有目的的去提取目标信息,非常依赖任务的特异性以及设计特征的人.深度学习可以从大数据
三更两点
2021-06-29
3310
深度强化学习训练智能体:超级玛丽
TOC 视频地址 测试通关视频: https://live.csdn.net/v/121855 [2qjRnLvdTpMCWBz]深度强化学习 深度神经网络提供了丰富的表示形式,可以使强化学习(RL)算法有效执行。Actor Critic简述 强化学习的分类可以分为以值函数为中心的和以策略为中心的算法 Actor Critic (演员评判家)是一种值函数为中心和以策略为中心算法的结合体,它合并了以值函数为基础 (比如 Q learning) 和 以动作概率为基础 (比如 Policy Gradients)
三更两点
2021-02-08
7930
基于CNN的歌声合成算法论文解读
文章目录 资料 前沿 基于DNN的歌声合成 基于CNN的歌声合成 损失函数 样本 结论 资料 https://n3utrino.work/ 前沿 Title:Singing voice synthesis based on convolutional neural networks 核心思路:midi 输入到CNN,预测声学特征(acoustic feature),声学特征输入到声码器得到音频。 一句话:运用CNN模型将乐谱序列映射到声学特征 深度神经网络是人工神经网络,其包含很多隐含层。
三更两点
2021-01-26
4190
微软歌声合成算法HIFISINGER论文解读
文章目录 论文题目: 摘要 前沿 背景 方法 SF-gan来建模宽频率(频域) ML-gan来建模长波形(时域) 其他设计 实验和结果 datasets model config 训练和合成 音质对比 论文题目: HIFISINGER: TOWARDS HIGH-FIDELITY NEURAL SINGING VOICE SYNTHESIS 摘要 高保真的歌声需要高的采样频率。高采样必定导致更宽的频率带和更长的波形序列,给歌声合成模型带来困难。 hifisinger是采用48kHZ的采样频率。它包括
三更两点
2021-01-26
2970
基于CNN的歌声合成算法论文解读
基于卷积的神经网络歌声合成器能很好地合成歌声,以段落为单元转化乐谱特征序列为声学特征序列。无需参数合成算法就可以训练自然语音参数轨迹。并且能实现并行计算加快训练速度。
三更两点
2021-01-21
6480
微软歌声合成算法HIFISINGER论文解读
论文题目: HIFISINGER: TOWARDS HIGH-FIDELITY NEURAL SINGING VOICE SYNTHESIS 摘要 高保真的歌声需要高的采样频率。高采样必定导致更宽的频率带和更长的波形序列,给歌声合成模型带来困难。 hifisinger是采用48kHZ的采样频率。它包括基于自然语音的fastSpeech和并行的声码器WaveGAN,在声学模型和声码器中引入了多尺度对抗训练,以改善歌唱建模。 sub-frequency GAN 来生成梅尔声谱图,并将80维的mel频率分成多个
三更两点
2021-01-19
1.7K0
语音合成:HIFI-Gan 方法解读
提出HIFI-gan方法来提高采样和高保真度的语音合成。语音信号由很多不同周期的正弦信号组成,对于音频周期模式进行建模对于提高音频质量至关重要。其次生成样本的速度是其他同类算法的13.4倍,并且质量还很高。
三更两点
2021-01-18
4.8K0
R语言统计知识以及常用方法实例
文章目录 统计 平均值 中位数 众数 线性回归 一元 多元回归 逻辑回归 正态分布 决策树 随机森林 生存分析 卡方检验 统计 平均值 语法 mean(x, trim = 0, na.rm = FALSE, ...) x - 是输入向量。 trim - 用于从排序的向量的两端删除一些观测值。 na.rm - 用于从输入向量中删除缺少的值。 示例 x <- c(17,8,6,4.12,11,8,54,-11,18,-7) # Find Mean. result.mean <- mean(x) print(
三更两点
2021-01-14
6000
tensorflow2系类知识-4 :RNN
文章目录 循环神经网络(RNN) 示例代码 循环神经网络(RNN) 循环神经网络(Recurrent Neural Network, RNN)是一种适宜于处理序列数据的神经网络,被广泛用于语言模型、文
三更两点
2021-01-14
2940
tensorflow2系类知识-3 :CNN
CNN 基础知识 卷积神经网络(Convolutional Neural Network, CNN)是一种结构类似于人类或动物的 视觉系统 的人工神经网络,包含一个或多个卷积层(Convolutional Layer)、池化层(Pooling Layer)和全连接层(Fully-connected Layer)。 示例代码 # -*- coding:utf-8 -*- # /usr/bin/python ''' ------------------------------------------------
三更两点
2021-01-14
2670
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档