前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Huggingface 预训练模型权重下载的问题

Huggingface 预训练模型权重下载的问题

作者头像
mathor
发布2020-11-09 11:32:42
8.4K0
发布2020-11-09 11:32:42
举报
文章被收录于专栏:mathormathor

文章转自Hugging face预训练模型

Hugging face简介

Hugging face是一个专注于NLP的公司,拥有一个开源的预训练模型库Transformers ,里面囊括了非常多的模型例如 BERT GPT

模型库

官网的模型库的地址如下:https://huggingface.co/models

使用模型

首先需要安装transformers库,使用以下命令安装:

代码语言:javascript
复制
pip install transformers

接下来在代码中调用AutoTokenizer.from_pretrainedAutoModel.from_pretrained即可例如:

代码语言:javascript
复制
from transformers import *
model_name = 'hfl/chinese-xlnet-base'
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModel.from_pretrained(model_name)

运行后系统会自动下载相关的模型文件并存放在电脑中:

使用Windows模型保存的路径在C:\Users\[用户名]\.cache\torch\transformers\目录下,根据模型的不同下载的东西也不相同

使用Linux模型保存的路径在~/.cache/torch/transformers/目录下

存在的问题

这些前提是你的电脑有网络可以直接使用代码下载相应的模型文件,但是问题是有些机器是没有外网连接权限或者下载速度非常慢。

这时候就需要把模型文件下载后在导入代码中,还是以刚才的 hfl/chinese-xlnet-base模型为例,直接在官网搜索模型,点击进入模型的详情界面

在界面中找到List all files in model

把弹窗内的文件全部下载下来

我们假设文件保存在E:\models\hfl\chinese-xlnet-base\目录下

我们只需要把model_name修改为下载的文件夹即可

代码语言:javascript
复制
from transformers import *
model_name = 'E:/models/hfl/chinese-xlnet-base/'
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModel.from_pretrained(model_name)

这样问题就解决了,linux同理这里就不再赘述

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • Hugging face简介
  • 模型库
  • 使用模型
  • 存在的问题
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档