beyondGuo

文章/答案/技术大牛

发布

LV1

发表了文章 2024-04-262024-04-26 17:42:27

好样本，事半功倍：使用样本设计工程 (SDE) 来构造更好的大模型下游微调样本

关注我公众号的朋友们，抱歉了，转眼本号已经断更了9个月了，这大半年一直很忙，实习、写博士论文，更重要的是我角色转变了——当爹了！所以得忙着照顾老婆孩子哈哈，实在...

beyondGuo 2024-04-262024-04-26 17:42:27

数据、性能、论文、模型、设计

发表了文章 2023-09-122023-09-12 08:31:36

【它真来了吗？RulaiGPT：如~来~】训练一个如来GPT，发现事情并没有那么简单...

这个小项目是基于我最近的一个Github —— LLM-Tuning 实现的，本文涉及到的相关的代码、数据集、教程都在仓库里，建议点个Star⭐后配合本文食用😃...

beyondGuo 2023-09-122023-09-12 08:31:36

gpt、基础、论文、模型、数据

发表了文章 2023-09-012023-09-01 11:29:49

SUFE AI Lab@KDD'23：一种基于异常得分分布的通用损失函数

https://kdd.org/kdd2023/research-track-papers/

beyondGuo 2023-09-012023-09-01 11:29:49

函数、框架、模型、数据、异常

发表了文章 2023-09-012023-09-01 11:28:42

基于 LoRA 的 RLHF: 记一次不太成功但有趣的百川大模型调教经历

为了节省训练资源，快速了解整个 RLHF 的过程，我这里每一步的训练，都采用 LoRA 微调的方式：使用 LoRA 进行 SFT，使用 LoRA 训练 Rewa...

beyondGuo 2023-09-012023-09-01 11:28:41

强化学习、model、模型、数据、LoRa

发表了文章 2023-09-012023-09-01 11:28:04

使用 HC3 数据集来让 baichuan-7B 有对话能力

baichuan-7B 是百川智能开发的一个强大的中文基座模型，然后它本身并不具备对话能力。为了让它能够像 ChatGPT 一样进行对话，我们需要进行对话风格的...

beyondGuo 2023-09-012023-09-01 11:28:04

短信、基础、开发、模型、数据

发表了文章 2023-09-012023-09-01 11:27:37

「ChatGPT 对比与检测」研究项目被 LLM@IJCAI'23 收录！研究回顾

时间过得真快，离当初开始「ChatGPT 对比与检测」这个科研项目已经过去了半年之久，而这半年，正是大模型（LLM）百花齐放、群模乱舞的半年，我当初也想不到，半...

beyondGuo 2023-09-012023-09-01 11:27:37

chatgpt、测试、模型、数据、LLM

发表了文章 2023-09-012023-09-01 11:26:38

有趣实验分享 | 百川智能的 baichuan-7B 能猜到我的心思？

昨天的文章里，有一小部分是展示百川智能的 baichuan-7B 的 LoRA 微调的结果，其中有一个点我在跟实验室里老师同学讨论的时候大家觉得很有意思，这里...

beyondGuo 2023-09-012023-09-01 11:26:38

搜索引擎、chatgpt、互联网、模型、搜索

发表了文章 2023-09-012023-09-01 11:26:00

两行代码开启 LoRA 微调 && LLM 情感实体抽取实践

仓库地址：https://github.com/beyondguo/LLM-Tuning

beyondGuo 2023-09-012023-09-01 11:26:00

模型、实践、数据、LoRa、LLM

发表了文章 2023-09-012023-09-01 11:23:52

大模型思维链经典论文阅读之——Zero-shot CoT, Manual CoT, AutoCoT

ChatGPT 以及 GPT4 作为纯自回归式语言模型，本不应该期待其有什么推理能力，尤其是数学推理，但是他们在基础的推理任务上却十分让我们惊艳（当然肯定不能作...

beyondGuo 2023-09-012023-09-01 11:23:52

zero、测试、论文、模型、数学

发表了文章 2023-02-132023-02-13 10:02:09

OpenAI是如何“魔鬼调教” GPT的？——InstructGPT论文解读

ChatGPT的论文尚未放出，也不知道会不会有论文放出，但是根据公开资料显示，其训练方式，跟OpenAI之前的一个工作——InstructGPT基本无异，主要是...

beyondGuo 2023-02-132023-02-13 10:02:09

api、NLP技术

发表了文章 2023-02-132023-02-13 10:01:12

作为普通NLP科研人员对ChatGPT的一些思考

根据媒体报道，ChatGPT全球用户数已经突破了一百万，早早火出了圈。我朋友圈里的做金融的、做健身教练的、做英语培训的，都玩起了ChatGPT，我一个做NLP的...

beyondGuo 2023-02-132023-02-13 10:01:12

NLP技术

发表了文章 2023-02-132023-02-13 09:59:59

条件语言模型中的OOD检测与选择性生成

在conditional language model（CLM）任务（主要是summarization，translation）中，而由于language ge...

beyondGuo 2023-02-132023-02-13 09:59:59

background、detection、distribution、embedding、lm

发表了文章 2023-02-092023-02-09 16:20:29

我们开发了第一款中英双语ChatGPT检测器，还有...

当晚我很晚才睡着，但是第二天一大早就醒了，兴冲冲得跟几个好友讨论了这个事儿，经过一番讨论，我们觉得这是个有价值的事儿，值得一做！接着我们在一个更大的群里（孤勇A...

beyondGuo 2023-02-092023-02-09 16:20:29

https、网络安全、腾讯云测试服务

发表了文章 2023-02-092023-02-09 16:19:37

首个人类－ChatGPT对比语料集开源！人工测评，语言学分析，检测器模型都在这里

我们提出了首个「人类-ChatGPT 问答对比语料集」，也是最早开发ChatGPT检测器的团队，过去40天我们熬了很多夜，除了艰难的数据收集过程，还做了大量人工...

beyondGuo 2023-02-092023-02-09 16:19:36

https、网络安全、腾讯云测试服务、github、git

发表了文章 2022-12-012022-12-01 11:49:56

好久不见，介绍一下，这位是GENIUS：一个基于“草稿”进行文本生成、数据增强的“小天才”模型

前言：朋友们好啊，好久不见。最近半年比较忙，因此好久没有更新了。今年3月份，我开始了在MSRA NLC组的研究实习，如今转眼已经过去了9个月。这也是我读博士以...

beyondGuo 2022-12-012022-12-01 11:49:56

https、网络安全、NLP技术

发表了文章 2022-12-012022-12-01 11:49:29

Mixture-of-Experts (MoE) 经典论文一览

最近接触到 Mixture-of-Experts (MoE) 这个概念，才发现这是一个已经有30多年历史、至今依然在被广泛应用的技术，所以读了相关的几篇经典论文...

beyondGuo 2022-12-012022-12-01 11:49:29

https、网络安全

发表了文章 2022-11-302022-11-30 15:20:41

Google的 Pathways（理想）与 PaLM（现实）

2022年3月，Google发布了Pathways系统，用于更高效地训练大型模型：

beyondGuo 2022-11-302022-11-30 15:20:41

https、网络安全

发表了文章 2022-11-302022-11-30 15:20:09

数据地图---使用Training Dynamics来映射和诊断数据集

最近看到一篇很有趣的文章，发表于EMNLP-20，作者团队主要来自AllenAI：

beyondGuo 2022-11-302022-11-30 15:20:09

github、https、git、开源、网络安全

发表了文章 2022-04-192022-04-19 12:26:30

盘点Controllable Text Generation(CTG)的进展

A Survey of Controllable Text Generation using Transformer-based Pre-trained Lan...

beyondGuo 2022-04-192022-04-19 12:26:30

NLP技术、linux

发表了文章 2022-04-192022-04-19 12:25:12

LAMBADA——用GPT-2来做文本数据增强

本文提出的方法称为language-model-based data augmentation（LAMBADA）。

beyondGuo 2022-04-192022-04-19 12:25:12

NLP技术、深度学习

12 3 4 5 6 下一页

个人简介

暂未填写公司和职称
深度学习小学生。热爱记录，热爱分享，能把知识讲清楚是我最开心的事。
深度学习神经网络 python tensorflow
上海财经大学 | 管理科学
http://kyhelper.applinzi.com
暂未填写所在城市
加入社区时间：2018-10-24

个人成就

获得 290 次赞同
文章被阅读 183.8K 次

关注了：1关注者：56