暂无搜索历史
序列标注是对输入序列中的每个标记进行标注标签的过程,常用于信息抽取任务,如分词、词性标注和命名实体识别。其中,命名实体识别是其中的一种任务。
Pix2Pix是一种基于条件生成对抗网络的深度学习图像转换模型,可以实现多种图像之间的转换,如语义/标签到真实图片、灰度图到彩色图等。该模型由Phillip I...
基于denoising diffusion probabilistic model (DDPM)的扩散模型,该模型已在图像/音频/视频生成领域取得显著成果。目前...
DCGAN是GAN的扩展,使用卷积和转置卷积层来分别构建判别器和生成器。它由Radford等人提出,判别器包括卷积层、BatchNorm层和LeakyReLU激...
CycleGAN是一种循环对抗生成网络,用于实现在没有配对示例的情况下学习将图像从一个域转换到另一个域的方法。它的重要应用领域是域迁移,即图像风格迁移。与之前的...
MobileNet是2017年由Google团队提出的轻量级CNN网络,专注于移动端、嵌入式或IoT设备。它使用深度可分离卷积的思想来减小模型参数与运算量,同时...
K近邻算法是一种用于分类和回归的非参数统计方法,通过计算样本与训练样本的距离,找出最接近的k个样本进行投票来确定分类结果。算法的基本要素包括K值、距离度量和分类...
MusicGen是基于单个语言模型(LM)的音乐生成模型,使用文本描述或音频提示生成高质量的音乐样本。它基于Transformer结构,包括文本编码器模型和音频...
自注意结构模型的发展,特别是Transformer模型的出现,极大推动了自然语言处理模型的发展。Transformers的计算效率和可扩展性使其能够训练具有超过...
SSD是一种单阶段目标检测算法,通过卷积神经网络进行特征提取,并在不同的特征层进行检测输出,实现多尺度检测。它采用了anchor的策略,预设不同长宽比例的anc...
ShuffleNetV1是一种计算高效的CNN模型,旨在在移动端利用有限的计算资源达到最佳的模型精度。其设计核心是引入了Pointwise Group Conv...
数据库的索引是经在项目中常常使用到的,但索引是吧双刃剑,提高了查询但是也拖慢了修改的速度。
图像分类是计算机视觉应用中最基础的一种,属于有监督学习类别。它的任务是给定一张图像,判断图像所属的类别,比如猫、狗、飞机、汽车等等。本章将介绍使用ResNet5...
下载狗与狼分类数据集,数据来自ImageNet,每个分类有大约120张训练图像与30张验证图像。使用download接口下载数据集,并自动解压到当前目录。
图像语义分割是图像处理和机器视觉技术中的重要一环,旨在对图像中的每个像素进行分类。与普通的分类任务不同,语义分割任务输出与输入大小相同的图像,输出图像的每个像素...
MindSpore有两种运行模式:动态图模式和静态图模式。默认情况下是动态图模式,也可以手工切换为静态图模式。
保存模型使用save_checkpoint接口,传入网络和指定的保存路径,要加载模型权重,需要先创建相同模型的实例,然后使用load_checkpoint和lo...
超参数是可以调整的参数,可以控制深度学习模型训练优化的过程,包括训练轮次、批次大小和学习率等。这些超参数的取值会影响模型的训练和收敛速度,其中学习率在迭代过程中...
神经网络的训练主要使用反向传播算法,通过损失函数计算模型预测值与正确标签的差异,并进行反向传播计算梯度,最终更新模型参数。自动微分能够计算可导函数在某点处的导数...
从目前的系统来看,系统的优化无非就几个方向。第一个是CPU的使用,可以去分析哪一个线程占用的CPU最多,以及哪一个线程耗时最久,从这个角度去分析。第二点就是内存...
暂未填写学校和专业
暂未填写个人网址