首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

#LLM

LLM On Kubernetes

我是阳明

从今年开始,人们对大型语言模型 (LLM) 及其在 GPU 基础设施上的部署的兴趣显着增加。这种不断增长的热情是由人工智能和机器学习的进步推动的,这需要 GPU...

9710

人工智能海洋中的塞壬之歌:大型语言模型LLM中的幻觉研究综述(一)

技术人生黄勇

下面这篇论文综述了最近关于幻觉检测、解释幻觉和缓解幻觉所做的努力,重点关注了大模型LLM幻觉所面临的独特挑战。并提出了LLM幻觉现象和评估基准的分类,分析了现有...

5410

大型语言模型的幻觉研究|减轻及避免大模型LLM幻觉(二)

技术人生黄勇

“ 本文及上一篇综述了最近关于语言模型中幻觉问题的研究进展,主要集中在ChatGPT发布后的研究。文章讨论了如何评估、追踪和消除幻觉,并探讨了现有挑战和未来方向...

4410

逆转诅咒|大模型的最大BUG!A=B 训练的大模型LLM无法学会 B=A?国内模型说可以

技术人生黄勇

“ 逆转诅咒的意义在于,它揭示了人工智能仍处于早期发展阶段,当前大模型在逻辑推理方面的能力非常有限。最后提到了对国内模型的简单测试,发现不同模型的表现各不相同,...

8310

AI大模型LLM可以帮助企业做什么?

技术人生黄勇

从这个规律来看,尽管大型语言模型(LLM)现在占据了AI领域的中心舞台,吸引了所有人的关注,但这并不意味着在LLM出现之前AI毫无发展。

9110

一文搞懂大模型!基础知识、 LLM 应用、 RAG 、 Agent 与未来发展

腾讯云开发者

LLM 探秘:想要深入了解人工智能界的“新宠”大型语言模型(LLM)吗?本文将带你走进 LLM 的世界,从入门知识到实际应用,全方位解读这个充满魔力的“大模型”...

16410

【大语言模型】本地部署个人Llama2 LLM服务并实现远程访问web交互界面

aosei

Ollama是一个强大的框架,设计用于在Docker容器中部署大型语言模型(LLM)。它的主要功能是简化在Docker容器内部署和管理LLM的过程。Ollama...

9010

9.9 和 9.11 哪个大?内在原因是tokenizer的问题

算法一只狗

腾讯 · 后台策略工程师 (已认证)

再看看Claude 3.5 Sonnet,给出了自己的推理,但是一看答案又开始犯困了,直接认为9.11更大。

37810

橙芯创想:香橙派AIPRO解锁升腾LLM与Stable Diffusion的创意密码

一只

​ 香橙派AI Pro,作为一款高性能的边缘计算平台,展现出非凡的扩展能力。它配备了丰富的I/O接口,包括但不限于USB、HDMI、网络接口以及GPIO端口,支...

5810

​解密prompt系列34. RLHF之训练另辟蹊径:循序渐进 & 青出于蓝

风雨中的小七

前几章我们讨论了RLHF的样本构建优化和训练策略优化,这一章我们讨论两种不同的RL训练方案,分别是基于过程训练,和使用弱Teacher来监督强Student

17530

【Datawhale AI 夏令营】Intel LLM Hackathon 天池挑战赛 本地环境搭建

IT蜗壳-Tango

NTTDATA(中国)信息技术有限公司 · 测试开发工程师 (已认证)

26500

在您现有的向量数据库中使用LLM中您自己的数据

云云众生s

向量数据库 允许您使用来自内部数据存储的数据来增强您的 LLM 模型。使用本地的事实性知识提示 LLM 可以让您获得针对组织已经了解的情况量身定制的响应。这减少...

6710

设计利用异构数据源的LLM聊天界面

云云众生s

构建有用的 LLM 聊天界面并非没有复杂性和挑战。Deepak Jayablalan 向我们展示了如何做到这一点。

8110

基于 LLM 的 AI OPS 探索系列 - 搭建支持 GPU 的 Kubernetes 集群

行者深蓝

在本次 workshop 中,我们介绍了如何使用 K3S 在 AWS 上设置支持 GPU 的 Kubernetes 集群,安装 NVIDIA 驱动和插件,以及部...

8610

DevOps在LLM时代拥抱跨栈可观测性

云云众生s

虽然没有人确切地知道人工智能将对软件开发和部署、CI/CD 以及 DevOps 产生什么影响,但在未来尘埃落定后,将取决于适当的可观察性流程、工具和实践来分析这...

8210

联邦语言模型:边缘SLM+云LLM

云云众生s

联邦语言模型是一个利用了两种人工智能趋势的想法:小型语言模型 (SLM) 和大型语言模型 (LLM) 能力的提升。

6810

腾讯云TACO推出混合序列并行USP,大幅提升LLM和DiT训练性能

腾讯云计算产品团队

腾讯云 · 产品团队 (已认证)

4Gu, Diandian, et al. "LoongTrain: Efficient Training of Long-Sequence LLMs with...

12710

让LLM“遗忘”特定知识

绿盟科技研究通讯

随着大规模语言模型(Large Language Models, LLMs)的广泛应用,隐私问题日益凸显。这些模型在训练过程中难免会记住并泄露敏感信息,如个人身...

13610

通过 Devoxx Genie IntelliJ 插件可访问本地或云端 LLM 模型

深度学习与Python

该插件支持本地 LLM 供应商,如 Ollama、LM Studio 以及 GPT4All。本地的 LLM 为不愿将源码上传至云端的公司提供了很好的解决方案。此...

10510

基于RAG的企业级代码生成系统:从数据清洗到工程化实现

brzhang

腾讯 · 高级客户端开发工程师 (已认证)

在现代软件开发中,利用大型语言模型(LLM)生成代码已成为提高开发效率的重要手段。然而,对于企业来说,如何让这些模型了解并遵循内部的代码规范、使用自定义组件和公...

23510
领券