首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

#LLM

如何利用向量数据库来弥补 LLM 的弱点

云云众生s

现成 LLM 的训练数据来自不同的公共和私人来源。这些数据赋予了 LLM 所有功能。对于企业来说,令人担忧的是,通用 LLM 缺乏组织特定的背景。这是因为没有现...

700

5种搭建LLM服务的方法和代码示例

deephub

在不断发展的大型语言模型(LLMs)领域中,用于支持这些模型的工具和技术正以与模型本身一样快的速度进步。在这篇文章中,我们将总结5种搭建开源大语言模型服务的方法...

5010

LLM能否依据角色的过去预测未来?一篇有趣的研究

zenRRan

先前的基于LLMs的工作的决策过程仅限于简短而直接的背景,因此尚不清楚角色分配的LLM是否可以复制深思熟虑的行动的思维过程和心态,即他们的决策。LLM的角色驱动...

7410

解密Prompt系列28. LLM Agent之金融领域智能体:FinMem & FinAgent

风雨中的小七

本章介绍金融领域大模型智能体,并梳理金融LLM的相关资源。金融领域的大模型智能体当前集中在个股交易决策这个相对简单的场景,不需要考虑多资产组合的复杂场景。交易决...

26320

文本向量化模型新突破——acge_text_embedding勇夺C-MTEB榜首

中杯可乐多加冰

在人工智能的浪潮中,以GPT4、Claude3、Llama 3等大型语言模型(LLM)无疑是最引人注目的潮头。这些模型通过在海量数据上的预训练,学习到了丰富的语...

16110

「LLM天花板」如何利用神奇咒语让语言模型超越人类

百川AI

让LLM解释答案过程中,以ChatGPT为例,解释的时候他甚至会提及具体的句子和标准,来说明打分的依据,这也是为什么解释能够提升准确。

15000

【Rust 研学】 | LLM 入门之旅 2 : BPE 算法

张汉东

然而更多的时候,我享受深入了解技术的实现和事物运行原理。所以 Rust 研学 LLM 系列文章也该继续更新了。

7810

Meta出招了!Megalodon LLM对Transformer架构发起挑战!

程序员吾真本

前两天,科技新闻网站VentureBeat上放出了Ben Dickson的一篇文章,名字就叫“Meta 携 Megalodon LLM 挑战 Transform...

8620

LLM-AI大模型介绍

@小森

🍹大语言模型 (Large Language Model) 是一种人工智能模型, 它们通常包含数千亿甚至更多的参数,并在大规模数据集上进行训练。大语言模型可以处...

10710

国内百模谁第一?清华14大LLM最新评测报告出炉,GLM-4、文心4.0站在第一梯队

新智元

在2023年的「百模大战」中,众多实践者推出了各类模型,这些模型有的是原创的,有的是针对开源模型进行微调的;有些是通用的,有些则是行业特定的。如何能合理地评价这...

10210

扎克伯格最新采访:Meta最强开源模型Llama 3凭什么值百亿美金

小腾资讯君

腾讯云 · 社群运营 (已认证)

4月19日消息,据国外媒体报道,美国当地时间周四,Facebook母公司Meta重磅推出了其迄今最强大的开源人工智能(AI)模型——Llama 3,意图在激烈的...

15110

langchain4j免科学上网实践demo

用户10868311

作为一个只懂java的程序员,之前一直没有机会直接与langchain接触,无法快速跟上AI的浪潮。直至langchain4j的推出,让我有了一探langcha...

15910

Prompt提示工程上手指南:基础原理及实践-思维树 (ToT)策略下的Prompt

fanstuck

此篇文章已经是本系列的第五篇文章,之前我们已经将检索增强生成(RAG)策略,逐渐我们掌握的知识和技术都在不断提高,对于Prompt的技巧策略也不能只局限于局部运...

13220

让AI决策更靠谱:两种现代方法的深度解读

程序员吾真本

像OpenAI的ChatGPT(尤其是其最新版本,GPT-4)、Claude AI和Gemini等新兴的大型语言模型(LLMs)在决策制定方面的表现十分有限。

16540

RAG-Fusion 提高 LLM 生成文本的质量和深度

大数据杂货铺

检索增强生成(RAG)和 RAG-Fusion都是旨在通过集成基于检索和生成组件来增强大型语言模型(LLM)能力的方法4-5。

20710

提高大型语言模型 (LLM) 性能的四种数据清理技术

大数据杂货铺

搜索增强生成(RAG)过程彻底增强对大语言模型(LLM)的理解、为它们提供上下文并帮助防止幻觉的潜力而受到欢迎。RAG 过程涉及几个步骤,从分块供应文档提取到上...

10910

Langchain入坑

大数据杂货铺

为了正确回答最初的问题(“langsmith 如何帮助测试?”),我们需要为LLM提供额外的背景信息。我们可以通过检索来做到这一点。当您有太多数据无法直接传递给...

14020

知识图谱和 LLM:多跳问答

大数据杂货铺

智能搜索使用 LLM 生成适当的 Cypher 语句,以从知识图谱中检索信息。然后,该信息被传递到另一个 LLM 调用,该调用使用原始问题和提供的信息来生成答案...

19910

10个大型语言模型(LLM)常见面试问题和答案解析

deephub

提示校准包括调整提示,尽量减少产生的输出中的偏差。微调修改模型本身,而数据增强扩展训练数据。梯度裁剪防止在训练期间爆炸梯度。

9710

​5种常用于LLM的令牌遮蔽技术介绍以及Pytorch的实现

deephub

本文将介绍大语言模型中使用的不同令牌遮蔽技术,并比较它们的优点,以及使用Pytorch实现以了解它们的底层工作原理。

10710
领券