首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

#pytorch

PyTorch是一个基于Torch的 开源机器学习库,用于自然语言处理等应用程序。

【深度学习入门篇 ⑦】PyTorch池化层

@小森

假设输入的尺寸是(𝑁,𝐶,𝐻,𝑊),输出尺寸是(𝑁,𝐶,𝐻𝑜𝑢𝑡,𝑊𝑜𝑢𝑡),kernel_size是(𝑘𝐻,𝑘𝑊),可以写成下面形式 :

4410

【深度学习入门篇 ⑥】PyTorch搭建卷积神经网络

@小森

卷积神经网络是深度学习在计算机视觉领域的突破性成果,在计算机视觉领域,往往我们输入的图像都很大,使用全连接网络的话,计算的代价较高;另外图像也很难保留原有的特征...

2610

【深度学习入门篇 ⑤ 】PyTorch网络模型创建

@小森

可以用 torchsummary 查看网络结构,如果没有的话,使用pip命令进行安装

4510

【深度学习入门篇 ④ 】Pytorch实现手写数字识别

@小森

通过前面的学习,我们已经掌握了PyTorch API的基本使用,今天我们使用PyTorch实现手写数字识别案例!

4010

【深度学习入门篇 ③】PyTorch的数据加载

@小森

掌握PyTorch数据通常的处理方法,是构建高效、可扩展模型的关键一步。今天,我们就利用PyTorch高效地处理数据,为模型训练打下坚实基础。

3910

【深度学习入门篇 ②】Pytorch完成线性回归!

@小森

上一部分我们自己通过torch的方法完成反向传播和参数更新,在Pytorch中预设了一些更加灵活简单的对象,让我们来构造模型、定义损失,优化损失等;那么接下来,...

3010

【AI模型】NanoDet-PyTorch环境配置及运行测试

DevFrank

该代码基于NanoDet项目进行小裁剪,专门用来实现Python语言、PyTorch 版本的代码,下载直接能使用,支持图片、视频文件、摄像头实时目标检测。

9210

Llama3.1技术报告解读

aaronwjzhao

Llama3.1共开源了8B、70B、405B三种参数量的模型,三个模型具体信息如下图,其中405B除了BF16精度,还有FP8量化版模型,针对8B额外开源了经...

1.3K101

PyTorch | 加速模型训练的妙招

数据科学工厂

提升机器学习模型的训练速度是每位机器学习工程师的共同追求。训练速度的提升意味着实验周期的缩短,进而加速产品的迭代过程。同时,这也表示在进行单一模型训练时,所需的...

7610

【踩坑】探究PyTorch中创建稀疏矩阵的内存占用过大的问题

小锋学长生活大爆炸

对于CUDA的内存问题,那就可以使用torch.cuda.memory_stats()来看他的内存使用情况:

9410

【踩坑】修复报错Cannot find DGL libdgl_sparse_pytorch_2.2.0.so

小锋学长生活大爆炸

5410

降水临近预报_Weather4cast_RainAI代码分享

勤劳小王

set_parser()是一个函数,用于设置和返回一个argparse.ArgumentParser对象

6310

更简单实用的pytorch——pytorch_lighting

勤劳小王

PyTorch Lightning 是一个“batteries included”的深度学习框架,适合需要最大灵活性同时大规模增强性能的专业人工智能研究人员和机...

21420

MInference:通过动态稀疏Attention加速长文本推理

aaronwjzhao

由于注意力机制的二次复杂度,举例来说(如图1 a 所示),在单台装有 A100 的机器上为 LLaMA-3-8B 提供服务时,如果提示有 30 万个 token...

28721

大语言模型--Llama3 token结束符问题

aaronwjzhao

结束符是一个句子(prompt)的结尾标记,再大语言模型中,句子中的每个单词都会被编码成数字才能被模型处理。同样的,结尾标记也会被编码成一个数字。再Meta给的...

16410

Pytorch与torchvision不匹配的若干问题与解决方法

kwai

腾讯 · 员工 (已认证)

注意两条指令获得的 CUDA 版本可能并不一致,这里以 nvcc -V 显示的版本为准,具体原因暂不在本文解释。

26810

NLP实战三:Pytorch实现FastText文本分类

机器学习AI算法工程

NLP实战二:Pytorch实现TextRNN 、TextRNN+Attention文本分类

16110

NLP实战二:Pytorch实现TextRNN文本分类

机器学习AI算法工程

我从THUCNews中抽取了20万条新闻标题,已上传至github,文本长度在20到30之间。一共10个类别,每类2万条。

11210

NLP实战一:Pytorch实现TextCNN文本分类

机器学习AI算法工程

我从THUCNews中抽取了20万条新闻标题,已上传至github,文本长度在20到30之间。一共10个类别,每类2万条。

12410

使用 PyTorch 创建的多步时间序列预测的 Encoder-Decoder 模型

deephub

Encoder-decoder 模型在序列到序列的自然语言处理任务(如语言翻译等)中提供了最先进的结果。多步时间序列预测也可以被视为一个 seq2seq 任务,...

18110
领券