首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

#量化

RAG+内容推荐,应该如何实践?

掘金安东尼

这里使用TF-IDF向量化器将文档和查询向量化,并通过计算余弦相似度找到与查询最相关的文档。

6410

【工程应用十】基于十六角度量化的夹角余弦相似度模版匹配算法原理解析。

用户1138785

  这是一个累加公式,对于原图的每一个有效像素位置,以其为中心或左上角起点(图像中的坐标一般是X方向从左向右,Y方向从上到下),在原图中覆盖模板宽度和高度大小的...

5910

复合索引:向量搜索的高级策略

用户3578099

粗量化的关键优势在于它通过向量“聚类”来实现非详尽搜索,例如IVF中的倒排索引,这可以显著提高搜索效率。而细量化则关注于通过编码技术减少向量的存储需求,同时最小...

6210

乘积量化PQ:将高维向量压缩 97%

用户3578099

乘积量化(Product Quantization, PQ)主要用于减少索引的内存占用,这在处理大量向量时尤为重要,因为这些向量必须全部加载到内存中才能进行比较...

11110

信贷风控中是如何做策略收紧的?

Python数据科学

策略收紧是通过有贷后表现的样本分析后制定的,和A类调优的阈值放松相比,有更好的量化分析条件基础,分析过程更容易。

6410

大模型的模型压缩与有效推理综述

算法进阶

本文对大型语言模型的压缩和效率推理进行了综述。大型语言模型基于Transformer架构,具有强大的性能,但也带来了巨大的内存和计算成本。本文从算法角度对大型语...

10410

Meta-AI再出神作 | 借力打力!设计跨模态量化蒸馏方法,直接白嫖VLP模型的丰富语义信息

AIGC 先锋科技

一种针对大规模跨模态检索系统的有效搜索方法至关重要,鉴于多模态数据的指数级增长,这些数据涵盖了诸如文本、图像、音频和视频等不同格式。在各种方法中,哈希方法(也称...

9010

上交大 & 上海 AI 实验室 & ViVO 强势推出 TerDiT ,极低比特量化感知训练和和高效部署方案 !!!

AIGC 先锋科技

大规模预训练文本到图像扩散模型的进展导致了成功生成具有复杂性和对输入条件高保真的图像。特别是基于 Transformer 架构的扩散模型的出现,在这一研究领域中...

12510

高效轻量级LLM | Imp模型,通过低比特量化分辨率和降低实现高通骁龙8Gen3 芯片高性能部署 !

AIGC 先锋科技

通过低比特量化技术和分辨率降低技术,作者的Imp模型可以部署在高通骁龙8Gen3移动芯片上,具有高达约13个 Token /秒的高推理速度。

12010

北航提出 PTQ4SAM | 一种高效的分割任何模型训练后量化框架,实现了无损精度,速度提高了3.9 倍 !

AIGC 先锋科技

具有卓越的零样本能力和用户友好的灵活提示技术,Segment Anything Model(SAM)最近已成为一系列通用视觉应用中的新型基础模型,包括图像分割、...

20010

空间单细胞|在Seurat中对空间数据进行分析(4)

数据科学工厂

在这篇指南[1]中,我们介绍了Seurat的一个新扩展功能,用以分析新型的空间解析数据,将重点介绍由不同成像技术生成的三个公开数据集。

10810

DiAtom 共生菌固氮作用产生的碳输出(ANACONDAS)

此星光明

亚马逊对大西洋的影响:DiAtom 共生菌固氮作用产生的碳输出(ANACONDAS)

7510

goldfish loss:减少训练数据泄漏,提高大语言模型输出的多样性

deephub

LLMs(大型语言模型)能够记忆并重复它们的训练数据,这可能会带来隐私和版权风险。为了减轻记忆现象,论文作者引入了一种名为"goldfish loss"的微妙修...

5510

CARE2024——真实世界医学图像的综合分析与计算之MyoPS++

医学处理分析专家

许多用于医学图像分析的基础模型,例如分段任意模型(SAM),已经发布并被证明在多种任务中是有用的。然而,它们对现实世界医学成像数据的有效性尚未得到探索。例如,针...

8910

CARE2024——真实世界医学图像的综合分析与计算之WHS++

医学处理分析专家

许多用于医学图像分析的基础模型,例如分段任意模型(SAM),已经发布并被证明在多种任务中是有用的。然而,它们对现实世界医学成像数据的有效性尚未得到探索。例如,针...

9010

CARE2024——真实世界医学图像的综合分析与计算之LAScarQS++

医学处理分析专家

许多用于医学图像分析的基础模型,例如分段任意模型(SAM),已经发布并被证明在多种任务中是有用的。然而,它们对现实世界医学成像数据的有效性尚未得到探索。例如,针...

10210

《书生·浦语大模型实战营》第5课 学习笔记:LMDeploy 量化部署 LLM 实践

流川疯

神州信息集团 · 高级算法工程师 (已认证)

这种说法是片面的,虽然计算机计算定点数和整数比计算浮点数快,但是模型的参数仅仅是以定点或者整数的方式存储,在实际计算时,还需要把定点数和整数反量化为浮点数进行数...

14910

60min!极速竞答!2024春百亿量化私募研究类笔试0521

量化投资和人工智能公众号

面向研究类的笔试题目,主要是数理统计和编程题,限时60min,一共6个题,下面给出其中的四题,更全的试题在知识星球中获取.整体难度不大,和之前发布的题目有相似的...

6610

CVPR 2024 Highlight | 北航等发布「时间特征维护」:无需训练,极致压缩加速Diffusion

新智元

基于时间特征维护的校准量化可确保 Diffusion的量化参数准确保留原始时间信息。广泛的实验证明,TFMQ-DM 在 DDIM、LDM及Stable-Diff...

9410

大模型压缩量化方案怎么选?无问芯穹Qllm-Eval量化方案全面评估:多模型、多参数、多维度

机器之心

最近,来自清华大学电子工程系、无问芯穹和上海交通大学的研究团队展开了一次量化方案的“大摸底”,在《Evaluating Quantized Large Lang...

12110
领券