西西嘛呦

腾讯云

开发者社区

文档建议反馈控制台

首页TVP

LV1

发表了文章 2023-07-102023-07-10 16:30:30

怎么让英文大语言模型支持中文？（三）进行指令微调

这里是最后一部分了：怎么让英文大语言模型支持中文？（三）对预训练模型进行指令微调。

西西嘛呦 2023-07-102023-07-10 16:30:30

dataset、input、token、模型、数据

发表了文章 2023-07-102023-07-10 16:29:08

怎么让英文大预言模型支持中文？（二）继续预训练

代码已上传到github： https://github.com/taishan1994/chinese_llm_pretrained

西西嘛呦 2023-07-102023-07-10 16:29:08

dataset、model、size、模型、数据

发表了文章 2023-07-102023-07-10 16:28:34

怎么让英文大预言模型支持中文？（一）构建自己的tokenization

代码地址：https://github.com/taishan1994/sentencepiece_chinese_bpe

西西嘛呦 2023-07-102023-07-10 16:28:34

eos、model、self、token、模型

发表了文章 2023-05-072023-05-07 21:03:46

【python】linux下安装python的一般方法

下载python 这里以安装python3.7.1为例： wget https://www.python.org/ftp/python/3.7.1/Pyth...

西西嘛呦 2023-05-072023-05-07 21:03:46

python、linux、python3、编译、连接

发表了文章 2023-04-272023-04-27 14:30:21

你还弄不清xxxForCausalLM和xxxForConditionalGeneration吗？

大语言模型目前一发不可收拾，在使用的时候经常会看到transformers库的踪影，其中xxxCausalLM和xxxForConditionalGenerat...

西西嘛呦 2023-04-272023-04-27 14:30:21

config、hidden、model、self、模型

发表了文章 2023-04-272023-04-27 14:29:47

LLM（大语言模型）解码时是怎么生成文本的？

源码地址：transformers/configuration_utils.py at v4.28.1 · huggingface/transformers (...

西西嘛呦 2023-04-272023-04-27 14:29:47

model、text、token、模型、搜索

发表了文章 2023-04-272023-04-27 14:27:31

1使用accelerate

虽然这对常规大小的模型来说非常有效，但当我们处理一个巨大的模型时，这个工作流程有一些明显的局限性：在第1步，我们在RAM中加载一个完整版本的模型，并花一些时间随...

西西嘛呦 2023-04-272023-04-27 14:27:31

gpu、磁盘、工作、模型、内存

发表了文章 2023-04-272023-04-27 14:27:05

GPT-NER：通过大型语言模型的命名实体识别

讲在前面，chatgpt出来的时候就想过将其利用在信息抽取方面，后续也发现了不少基于这种大语言模型的信息抽取的论文，比如之前收集过的：

西西嘛呦 2023-04-272023-04-27 14:27:05

gpt、遍历、论文、模型、数据

发表了文章 2023-04-272023-04-27 14:26:40

怎么裁剪LLM（大语言模型）的vocab（词表）？

对于一些多语言的大语言模型而言，它的词表往往很大。在下游使用这些模型的时候，可能我们不需要其它的一些语言，例如只需要中文和英文，此时，我们可以对其vocab进行...

西西嘛呦 2023-04-272023-04-27 14:26:40

model、path、token、编码、模型

发表了文章 2023-04-272023-04-27 14:26:04

你也可以动手参数有效微调：LoRA、Prefix Tuning、P-Tuning、Prompt Tuning

随着大语言模型的流行，如何让大模型在消费级GPU上进行微调训练成为了热点。掌握参数有效微调成为每个自然语言处理工程师必不可少的技能，正好hugging face...

西西嘛呦 2023-04-272023-04-27 14:26:04

model、prefix、prompt、模型、数据

发表了文章 2023-04-272023-04-27 14:25:44

DyLoRA：使用动态无搜索低秩适应的预训练模型的参数有效微调

DyLoRA: Parameter-Efficient Tuning of Pretrained Models using Dynamic Search-Fre...

西西嘛呦 2023-04-272023-04-27 14:25:44

基础、模型、排序、搜索、性能

发表了文章 2023-04-272023-04-27 14:25:24

Chinese-LLaMA-Alpaca技术报告

EFFICIENT AND EFFECTIVE TEXT ENCODING FOR CHINESE LL AMA AND ALPACA

西西嘛呦 2023-04-272023-04-27 14:25:24

部署、量化、模型、数据、性能

发表了文章 2023-04-272023-04-27 14:24:58

1数据集

Towards Better Instruction Following Language Models for Chinese: Investigating ...

西西嘛呦 2023-04-272023-04-27 14:24:58

开源、模型、数据、效率、性能

发表了文章 2023-04-272023-04-27 14:24:35

COIG：开源四类中文指令语料库

CHINESE OPEN INSTRUCTION GENERALIST: A PRELIMINARY RELEASE

西西嘛呦 2023-04-272023-04-27 14:24:35

开源、翻译、工作流、模型、数据

发表了文章 2023-04-082023-04-08 10:04:57

用GPT4进行指令微调

代码：https://instruction-tuning-with-gpt-4.github.io/

西西嘛呦 2023-04-082023-04-08 10:04:57

开源、gpt、模型、数据、性能

发表了文章 2023-04-082023-04-08 10:04:25

LLaMA：开放和高效的基础语言模型

https://github.com/facebookresearch/llama

西西嘛呦 2023-04-102023-04-10 11:22:18

函数、模型、内存、数据、优化

发表了文章 2023-03-312023-03-31 13:06:19

GLM: General Language Model Pretraining with Autoregressive Blank Infilling

ChatGPT已经火了一段时间了，国内也出现了一些平替，其中比较容易使用的是ChatGLM-6B：https://github.com/THUDM/ChatGL...

西西嘛呦 2023-04-022023-04-02 11:08:49

编码、架构、论文、模型、设计

发表了文章 2023-03-312023-03-31 13:05:50

利用ChatGPT进行情感分析

代码地址：https://github.com/taishan1994/ChatSA

西西嘛呦 2023-03-312023-03-31 13:05:50

汽车、教育、chatgpt、代理、数据

发表了文章 2023-02-232023-02-23 10:15:27

colab上更换python版本或者换成tensorflow1.x版本

目前colab已经不支持使用：%tensorflow_version 1.x来切换使用tensorflow1.x版本了。解决方法如下：

西西嘛呦 2023-02-232023-02-23 10:15:27

python、tensorflow

发表了文章 2023-02-162023-02-16 13:26:42

PaLM中使用的激活函数：SwiGLU

我们不难发现，激活函数就是对x乘以一些数，以对某些值进行约束。 GLU（Gated Linear Unit），其一般形式为：

西西嘛呦 2023-02-162023-02-16 13:26:42

asynchronous、dataflow、distributed

12 3 4 5 6 7 8...54 下一页

个人简介

算法工程师
从自己能做到的开始，一件件来，缓慢而坚定地前进，尽力而为
图像识别深度学习数据分析数据挖掘
武汉理工大学 | 软件工程
https://www.cnblogs.com/xiximayou/
广东省 | 深圳市
加入社区时间：2020-08-24

个人成就

获得 2.3K 次赞同
文章被阅读 1.1M 次

关注了：1关注者：44