首页
学习
活动
专区
圈层
工具
发布
首页标签第四期热点征文-大模型技术

#第四期热点征文-大模型技术

5 分钟搞懂 LLM 微调:从原理到实战

ETL 小当家

微调(Fine-tuning)是指在一个已经预训练好的大语言模型基础上,用特定领域或任务的数据继续训练,让模型更好地适应具体需求。

300

大模型应用:CLIP 模型全维度解析:理解理论基础强化基础范例.16

未闻花名

我们经常讨论到的模型大都基于大文本的模型,鲜有谈及视觉这一块,今天我们结合文本模型来梳理探讨一下视觉的模型,计算机视觉(CV)和自然语言处理(NLP)是两个相对...

500

大模型应用:结构化思维:Schema在大模型信息抽取中的认知引导作用.14

未闻花名

信息抽取的本质是将非结构化数据(文本、文档等)转化为结构化格式(表格、JSON、数据库等)的过程。传统方法依赖规则引擎或有监督学习,需人工设计特征和标注数据,适...

2610

大模型应用:基于本地大模型驱动的 MapReduce 文本总结与分类系统全解析.13

未闻花名

随着大模型技术在本地化部署场景的普及,处理大规模中文文本任务(如超长文本总结、海量新闻分类)时,单进程执行面临算力不足、内存溢出、效率低下等核心问题。MapRe...

4210

Transformer 详解:为什么它能统治整个 AI 领域?

ETL 小当家

在 Transformer 出现之前,处理文本的主流方法是 RNN 及其改进版 LSTM。它们有几个比较头疼的问题。

25210

大模型应用:大模型 MapReduce 全解析:核心概念、中文语料示例实现.12

未闻花名

MapReduce是一种编程模型,用于大规模数据集的并行运算。Map(映射)和Reduce(归约)是函数式编程中的核心概念。在大模型训练中,MapReduce被...

9710

大模型应用:大模型的词元化处理详解:BPE、WordPiece、Unigram.11

未闻花名

词元化(Tokenization)是大模型预处理的核心步骤,将连续文本切分为模型可理解的最小语义单元(Token),这些词元可以是单词、子词或字符。中文没有像英...

13910

大模型应用:大模型性能评估指标:CLUE任务与数据集详解.10

未闻花名

现如今,大型语言模型如雨后春笋般涌现。然而,如何客观、全面地评估这些模型的真实能力,不仅是学术界的挑战,也是我们作为开发者的困惑,一个新的概念CLUE(Chin...

18211

大模型应用:本地大模型部署中的Token效率优化与性能分析.9

未闻花名

在大模型应用日益普及的今天,对模型交互过程中Token消耗的深入理解和有效管理变得至关重要。Token作为大模型处理文本的基本单位,不仅直接关系到模型的响应速度...

13620

大模型应用:构建智能大模型运维体系:模型健康度监测系统实践.8

未闻花名

大型语言模型已成为各行各业的核心基础设施。从客户服务到内容创作,从代码生成到科学研究,大模型正深度融入企业的核心业务流程。然而,随着模型规模的不断扩大和业务场景...

18320

大模型应用:大模型参数调优:结合本地模型对比多种组合探索差异.7

未闻花名

在大模型的应用中,参数调优是连接模型潜力与实际效能的关键桥梁。与传统的软件参数不同,大模型的生成参数更像是一组精密的调控旋钮,它们不改变模型的基础知识,而是影响...

47810

大模型应用:情感分析模型微调深度分析:从基础预测到性能优化.6

未闻花名

情感分析作为自然语言处理的基础任务,在社交媒体监控、产品评价分析、客户服务优化等领域发挥着重要作用。随着预训练语言模型的普及,微调(Fine-tuning)已成...

18010

OpenClaw架构解析:AI工程师的实战学习范本

用户10382422

大家好~ 今天给大家拆解一款极具参考价值的个人AI助手——OpenClaw(改名前Moltbot/Clawdbot),深入它的底层架构,看看其中藏着哪些AI工程...

1K10

大模型应用:概率驱动:大模型文字预测的核心机制与理论基础.5

未闻花名

文字预测,就是让模型根据已经出现的文字,预测下一个最可能出现的字(或词)。比如,输入“今天天气很”,模型可能预测出“好”、“热”、“冷”等。

19510

大模型应用:庖丁解牛:QKV机制详解,大模型的注意力之眼.4

未闻花名

我们先从理论角度来解释QKV机制,QKV机制是注意力机制的核心,尤其在Transformer模型中,注意力机制源于人类感知世界的方式:在处理信息时,我们会选择性...

25510

大模型应用:LangChain核心组件深度解析:llms与embeddings.3

未闻花名

LangChain 是一个用于构建大语言模型(LLM)应用程序的框架。它提供了一套工具和组件,使得开发者可以轻松地将LLM与其他数据源和工具连接起来,构建复杂的...

21210

大模型应用:大模型本地部署实战:从零构建可视化智能学习助手.2

未闻花名

本地部署最大的优势在于数据完全掌控。所有对话记录、学习内容都在本地处理,无需上传到云端,有效防止隐私泄露风险。对于教育场景尤其重要,学生的学习数据、提问内容都能...

17010

构建AI智能体:AI模型选择与部署考量:从业务需求到实际落地的思考决策

未闻花名

现在的模型平台虽然不多,但模型也如雨后春笋,日益爆发的增长,面对众多的模型选项,要做出正确的模型选择,首先需要全面理解这个生态系统的结构。现代AI模型可以按照功...

28410

构建AI智能体:大模型性能评估技巧:本地模型的完整测试框架与可视化分析

未闻花名

在大模型技术蓬勃发展的今天,许多初学者在尝试本地部署时面临着一个现实困境:如何在有限的硬件资源下有效评估模型性能,高端GPU动辄数万元的门槛让个人开发者望而却步...

37710

构建AI智能体:实践出真知:本地AI大模型部署的核心要点与经验总结

未闻花名

当我们初次接触理解大模型时,可能会被那些需要昂贵GPU、复杂环境配置的要求吓到,很多人误以为运行AI模型必须依赖高端显卡和专业的计算机硬件,这种认知让许多对AI...

94741
领券