首页
学习
活动
专区
圈层
工具
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
首页标签大模型部署

#大模型部署

【大模型学习 | LORA 原理&实现】

九年义务漏网鲨鱼

在更新过程中保留原有的参数不变为$W_0$,引入$\bigtriangledown W = BA$, 同时与输入$x$ 相乘得到:

2400

【大模型学习 | BERT 量化实战(2) 】

九年义务漏网鲨鱼

🔴 在量化过程中,发现无法采用export量化,但是 Eager Mode 成功了, Eager Mode 只对线性层进行了量化,而没有对embedding层...

1500

给Javaer看的大模型开发指南|得物技术

得物技术

伴随着大模型的性能提升、成本下降,在Web在线对话场景以外,大模型也越来越多的被集成到传统业务场景。

3610

【大模型学习 | BERT 量化实战(1)】

九年义务漏网鲨鱼

👉 这种量化方式虽然简单,但存在一个明显的问题,这是方式是 HuggingFace 基于 bitsandbytes 库 实现的轻量量化方式,背后用的是:

4410

花了50 美元,测试104个量化大模型大海捞针能力,Qwen3_14B太惊艳了

Ai学习的老章

作者在 H·G·威尔斯的《时间机器》中插入了几段荒谬对话,测试文本长达 1 万词元(约覆盖小说前 5 章内容),并附带简短系统提示要求大模型定位这些荒谬对话并复...

2700

跑模型被挤了?立即查看服务器GPU/CPU占用,别再误杀他人进程!

程序元元

但抱怨归抱怨,作为一名有素质的“共享玩家”,学会在自己跑模型前,先看看服务器上有没有别人在跑,以及如何友好地处理资源冲突,这应该是所有人应该最先学习的!

15510

20GB 内存,本地运行 DeepSeek-R1-0528

Ai学习的老章

Reddit 看到一个帖子,探讨如何极限情况下运行 DeepSeek-R1-0528

16610

全球实时语音交互AI产品大比拼!阶跃AI和豆包问鼎,超越GPT-4o!

AGI-Eval评测社区

去年 5 月,OpenAI 发布全模态 AI 模型 GPT-4o,凭借实时处理文本、图像、音频输入的强大功能,以及像电影《Her》中一样媲美人类对话的响应速度、...

11910

​【大模型学习 | 量化】pytorch量化基础知识(1)

九年义务漏网鲨鱼

11210

新版 DeepSeek-R1 实测,我们发现了这些没写在宣传页的细节

AGI-Eval评测社区

近期,DeepSeek 发布其旗舰推理模型 R1 的最新迭代版本——DeepSeek-R1-0528。尽管官方将此次更新界定为“小幅试验性升级”,但该版本已在全...

20510

Rokid Glasses上线全球第一个智能眼镜支持支付宝“看一下支付”功能,计划6月底交付

PoloaiAPI

Rokid Glasses 智能眼镜作为全球首款实现支付功能的智能眼镜,通过与支付宝合作推出“看一下支付”功能,标志着智能穿戴设备进入支付新时代,计划于2025...

9500

MiniMax发布MiniMax-M1推理模型,支持100万Token上下文,降低成本。

PoloaiAPI

MiniMax是一家成立于2021年12月的中国人工智能科技公司,专注于多模态大模型研发,其核心团队由前商汤科技高管闫俊杰领衔。公司以创新的MoE(混合专家)架...

22410

开源大模型, 重量级选手+1

Ai学习的老章

MiniMax-M1 采用了创新的混合专家模型(MoE)架构结合闪电注意力机制(Lightning Attention),优势有三:

21620
领券