技术百科

搜索技术百科

技术百科

发布

技术百科首页 >LLM >大语言模型的发展阶段？

大语言模型的发展阶段？

修改于 2023-08-08 15:23:34

277

词条归属：LLM

规则阶段

从1956年到1992年，基于规则的机器翻译系统是在内部把各种功能的模块串到一起，由人先从数据中获取知识，归纳出规则，写出来教给机器，然后机器来执行这套规则，从而完成特定任务。

统计机器学习阶段

从1993年到2012年，机器翻译系统可拆成语言模型和翻译模型，这里的语言模型与现在的GPT-3/3.5的技术手段一模一样。该阶段相比上一阶段突变性较高，由人转述知识变成机器自动从数据中学习知识，主流技术包括SVM、HMM、MaxEnt、CRF、LM等，当时人工标注数据量在百万级左右。

深度学习阶段

从2013-2018年，相对上一阶段突变性较低，从离散匹配发展到embedding连续匹配，模型变得更大。该阶段典型技术栈包括Encoder-Decoder、LSTM、Attention、Embedding等，标注数据量提升到千万级。

预训练阶段

从2018年到2022年，相比之前的最大变化是加入自监督学习，将可利用数据从标注数据拓展到了非标注数据。该阶段系统可分为预训练和微调两个阶段，将预训练数据量扩大3到5倍，典型技术栈包括Encoder-Decoder、Transformer、Attention等。

大型语言模型阶段

从2023年起，目的是让机器能听懂人的命令、遵循人的价值观。其特性是在第一个阶段把过去的两个阶段缩成一个预训练阶段，第二阶段转换成与人的价值观对齐，而不是向领域迁移。这个阶段的突变性是很高的，已经从专用任务转向通用任务，或是以自然语言人机接口的方式呈现。

大语言模型-01-语言模型发展历程-03-预训练语言模型到大语言模型

数据性能自然语言处理架构模型

语言模型通常是指能够建模自然语言文本生成概率的模型。从语言建模到任务求解，这是科学思维的一次重要跃升。语言模型的发展历程如下：

IT从业者张某某

2025-03-15

5370

大语言模型(LLM)

机器学习深度学习模型数据 LLM

研究者们发现通过扩大预训练语言模型的参数量和数据量，大语言模型（Large Language Model）能够在效果显著提升的同时，展示出许多小模型不具备的特殊能力（如上下文学习能力、逐步推理能力等）。最近，作为代表性的大语言模型应用ChatGPT展现出了超强的人机对话能力和任务求解能力，对于整个AI研究社区带来了重大影响。01

产品言语

2023-09-09

1.6K0

Mistral 大语言模型

人工智能软件测试

Mistral AI 是一家销售人工智能产品的法国公司。它由 Meta Platforms 和 Google DeepMind 的前员工于 2023 年 4 月创立。该公司于 2023 年 10 月筹集了 3.85 亿欧元，2023 年 12 月估值超过 20 亿美元

霍格沃兹测试开发Muller老师

2024-09-03

2650

改进大语言模型的方法

腾讯技术创作特训营S9

这是一篇关于适应开源大语言模型（LLMs）的三部系列博客的第一篇。本文探讨将LLM适应领域数据的各种方法。

JavaEdge

2024-09-13

3940

大语言模型的微调策略

基础开发模型数据效率

尽管大语言模型展示出强大的能力，但在特定任务领域，它们往往无法达到最佳效果。通过微调，可以将特定领域的数据集输入模型中，使模型学习该领域的知识，从而优化自身在特定领域的 NLP 任务中的表现，如情感分析、实体识别、文本分类和对话生成等。本文章讲大语言模型的微调策略及基于 ChatGPT 的微调。

猿人谷

2025-10-21

2410

点击加载更多

词条知识树 8个知识点

大语言模型的发展阶段？

规则阶段

统计机器学习阶段

深度学习阶段

预训练阶段

大型语言模型阶段

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐