首页
学习
活动
专区
圈层
工具
发布

#量化

FAISS|可扩展、高维人工智能特征搜索库

OpenCV学堂

FAISS(Facebook AI 相似性搜索)是 Meta 开发的开源库,用于以令人印象深刻的效率处理大规模、高维数据查询。它将原始数据(如图像、文本片段或交...

100

FAISS | 可扩展、高维人工智能特征搜索库

OpenCV学堂

FAISS(Facebook AI 相似性搜索)是 Meta 开发的开源库,用于以令人印象深刻的效率处理大规模、高维数据查询。它将原始数据(如图像、文本片段或交...

200

三行代码实现TensorRT10.8C++深度学习模型部署

OpenCV学堂

新课程已经发布!代码全面接口化封装,三行代码即可提供给客户端与上位机实现模型部署推理!支持YOLOv5~YOLOv12系列模型一键集成部署与量化,代码可下载直接...

100

使用NNCF(神经网络压缩框架)量化与压缩YOLO11

OpenCV学堂

NNCF提供了一系列的训练时量化与训练后量化神经网络的接口支持,支持ONNX、OpenVINO、Pytorch等多种模型格式的压缩与量化。同时NNCF不光支持C...

100

YOLO11+OpenVINO 实现药片检测

OpenCV学堂

神经网络压缩框架 (NNCF) 提供了一套训练后和训练时算法,用于优化 OpenVINO™ 中神经网络的推理,同时将准确率下降降至最低。官方代码库地址:

100

YOLO11对象检测,实例分割,姿态评估的TensorRT C++部署

OpenCV学堂

YOLO11是Ultralytics最新发布的 目标检测、实例分割、姿态评估的系列模型视觉轻量化框架,基于前代YOLO8版本进行了多项改进和优化。YOLO11...

400

2026 大模型与多模态部署四大热门框架早知道

OpenCV学堂

深度学习已经从CNN模型时代发展到大模型LLM时代到如今的MLLM与VLM时代,原有CNN为主的深度学习部署框架已经无法满足LLM与VLM模型部署的需求,最近今...

500

从接口到数据:行情 API 接入与处理实操笔记

用户12110249

在项目中接入行情 API 时,我逐渐意识到,接口本身稳定只是基础,真正决定开发效率和系统可靠性的是数据解析、请求策略、批量处理和日志管理的具体实现。以下是我在实...

800

Claude悄悄更新了Skills生成器,这绝对是一次史诗级升级。

数字生命卡兹克

可以说,现在小龙虾的能力能这么强,有一半的原因都要归功于Skills,而这些Skills能被创造出来,几乎都要归功于这个母Skills,Skill-creato...

2100

AAAI 2026| SEED:用于多变量时间序列预测的谱熵引导的时空依赖评估

时空探索之旅

TL; DR:SEED提出一种基于谱熵的多变量时间序列预测评估框架,通过量化时空依赖强度来指导模型设计。该方法能自动识别数据中的主导频率成分和跨变量关联模式,为...

1300

腾讯云即时通信IM

IT资讯研究所

腾讯科技 | 研究员 (已认证)

腾讯云即时通信IM基于腾讯超20年即时通信技术积累,提供SDK与低代码UI组件,支持Android、iOS等多端互通,具备高可靠、高安全、全球覆盖及弱网抗性优势...

3400

国产GPU全景选型与量化实践:打通大模型训推的性能与生态瓶颈

gawain2048

腾讯科技(深圳)有限公司 | 市场研究 (已认证)

本文聚焦大模型训推面临的算力、访存带宽及生态迁移瓶颈,提出基于“一云多芯”的国产GPU精细化选型矩阵(涵盖GPGPU与DSA架构)。通过覆盖真实业务场景的严格量...

6410

以下是根据提供的材料改写的结构化概要。改写过程严格遵循核心原则:忠实原文内容,聚焦量化数据,避免添加未提及的细节;采用Markdown格式组织,清晰分层;关键数据和观点使用**粗体**高亮;完整保留原文中的权威机构、专家姓名和头衔。结构基于核心方法论“病药效[托]”模型重构,主标题体现业务深度与技术确定性,章节标题采用“动词+名词”或核心观点形式,避免空洞形容词和商业废话。

IT前沿资讯站

腾讯科技(深圳)有限公司 | 数据分析 (已认证)

腾讯Tairios智能大模型赋能宇相机器人,提升场景应用可靠性50% 机器人赋能瓶颈——感知与决策能力鸿沟 文化遗产和商业服务场景中,行业普遍面临机器人缺乏...

5310

ollama v0.18.2 发布!OpenClaw 安装优化、Claude 加速、MLX 量化全面升级

福大大架构师每日一题

所有模型的嵌入层从固定的 *nn.Embedding 改为 nn.EmbeddingLayer 接口,兼容普通与量化两种嵌入实现,大幅增强量化模型的推理效率。

19610

知识库更新了,如何快速回归测试 RAG 系统的问答效果

AI智享空间

代码回归思维的团队,在完成服务层验证后,通常会抽几个问题试问一下,看看回答“感觉没问题”,就推进上线。这种做法在知识库变更规模小、内容改动局限时,偶尔能逃过惩罚...

3810

基于场景的AI模型BERT和CLIP选型对比

索旭东

→ 考虑CLIP的二值量化版本 。研究表明,通过在训练中加入伪量化损失,可以将CLIP的向量从float32压缩为二进制,内存减少32倍,同时保持约87-93%...

4810

大白话解释什么是模型微调

索旭东

模型微调(Fine-tuning)是将一个已经在海量数据上预训练好的通用模型,通过少量任务相关数据进一步训练,使其适应特定任务或领域的过程,既是大模型应用落地的...

13910

大模型测试:性能优化的5大实战策略

顾翔

三、动态量化与缓存协同:轻量级优化的黄金组合 量化不是‘一刀切’,而是与缓存机制深度耦合的系统工程。实践表明:

9910

Nat. Comput. Sci. | 大模型规模化与量化驱动网络生物学高效预测

DrugAI

随着单细胞转录组数据规模的快速增长,基于大规模预训练的基础模型正在成为网络生物学的重要工具。然而,模型规模的提升也带来了计算资源消耗的显著增加,限制了其在实际研...

10210
领券