数据科学

Reinvent Data Science

从部署到实践，即刻拥有你的专属龙虾助手

OpenClaw开发者专区🦞🦞🦞

自行/邀约他人一键搬运博客，享价值百万资源包

腾讯云自媒体同步曝光计划

往期视频·干货材料·成员作品 最新动态

腾讯技术创作特训营知识专栏

新邀入驻腾讯云开发者社区，福利多多！

面对因电力故障、网络问题或人为操作失误等导致的服务中断，数据库系统高可用能够保证系统在这些情况下仍然不间断地提供服务。如果数据库系统不具备高可用性，那么系统就需要承担停机和数据丢失等重大风险，而这些风险极有可能造成用户流失，从而使数据库系统蒙受经济和声誉上的损失。

一文剖析高可用向量数据库的本质

本文将深入探讨 Milvus 架构，分析其核心存储组件，并介绍如何有效评估 Milvus 存储系统性能。

探索 Milvus 数据存储系统：如何评估和优化 Milvus 存储性能

快看漫画创办于2014年，集漫画阅读、创作互动、线下漫画沉浸体验、周边衍生品购买等体验于一体，是年轻人的一站式漫画生活方式平台。截止到2023年底，快看总用户超过3.8亿，在中国漫画市场渗透率超过50%。经过9年的创作者生态建设，快看已汇聚超过12万注册创作者，发表漫画作品超13000部。目前，快看漫画已有超过500部作品登陆全球近200个国家和地区，成为中国文化出海的代表。

Milvus × RAG助力快看漫画多业务应用

在和社区小伙伴们交流的过程中，我们发现大家最关心的问题从来不是某个具体的功能如何使用，而是面对一个具体的实战场景时，如何选择合适的向量数据库解决方案或最优的功能组合。在 “Milvus 向量数据库进阶” 这个系列文章中，我们会聚焦回答这一类问题，如 “在 AI 应用开发的不同阶段，向量数据库应该如何选型”，“如何正确的构建 RAG 多租系统” 等。虽然这个系列名为进阶，但内容同时适用于初级和进阶用户。我们希望通过这些内容的介绍，帮助大家在向量数据库应用的过程中少走弯路。


Milvus 向量数据库进阶系列丨部署形态选型

以生产级别的搜索系统为例，该系统通常包含两个部分：离线数据索引和在线查询服务。实现该系统需要使用多种技术栈。例如，在离线处理中，如何将来源于多种渠道的非结构化数据数据高效、方便地处理并推送到向量数据库以实现在线查询，是一个充满挑战的问题。Apache Spark 和 Databricks 是应用广泛的大批量数据处理方案。Zilliz Cloud 推出了 Spark Connector。该工具将 Milvus 和 Zilliz Cloud 向量数据库 API 集成于 Apache Spark 和 Databricks 任务，大大简化数据处理和推送的实现难度。

Zilliz 推出 Spark Connector：简化非结构化数据处理流程

在此前的文章中，我们已经介绍了评估各种向量数据库时使用的关键指标和性能测试工具。本文将以 Milvus 向量数据库为例，特别关注 Milvus 2.2 或以上版本，讲解如何监控搜索性能、识别瓶颈并优化向量数据库性能。

如何定位Milvus性能瓶颈并优化

开源意味着创作者将软件、硬件甚至是大语言模型免费提供给社区使用。开源项目通常由社区中来自不同公司的开发者共同努力开发和维护。产品或软件的许可证类型明确规定了可以如何使用不同的开源产品。

一文看懂开源许可证：大语言模型和向量数据库入门指南

简介：随着非结构化数据的持续增长和人工智能（AI）以及大语言模型（LLM）的爆火，向量数据库已成为至关重要的基础设施。在这种趋势下，如何评估并挑选出最适合您的向量数据库呢？本文将深入探讨向量数据库的关键评估指标和性能测试工具。同时，本文还将介绍如何评估向量数据库性能助您做出明智的决策。

向量数据库性能测试技巧

在之前的文章《详解如何通过稀疏向量优化信息检索》中，我们已经讨论了信息检索技术从简单的关键词匹配到复杂的情境理解的发展，并提出了稀疏 Embedding 向量可以通过“学习”获得的观点。这些巧妙的 Embedding 技术融合了稠密和稀疏向量检索方法的优点。学习型的（Learned）稀疏向量不仅解决了密集检索中常见的跨领域问题，还通过融合更多的上下文信息，增强了传统稀疏向量搜索的能力。

详解 BGE-M3 与 Splade 模型

在信息检索方法的发展历程中，我们见证了从传统的统计关键词匹配到如 BERT 这样的深度学习模型的转变。虽然传统方法提供了坚实的基础，但往往难以精准捕捉文本的语义关系。如 BERT 这样的稠密检索方法通过利用高维向量捕获文本的上下文语义，为搜索技术带来了显著进步。然而，由于这些方法依赖于特定领域的知识，它们在处理领域外（out-of-domain）问题时可能会遇到困难。

详解如何通过稀疏向量优化信息检索

本教程将介绍如何设置 Grafana 和 Loki 来有效监控您的 Milvus 实例。

使用 Grafana 和 Loki 搭建 Milvus 日志查询系统

向量搜索是一个非常典型计算密集型的场景。作为世界上最快的向量数据库，Milvus的向量检索引擎Knowhere占用了超过整个系统80%的计算资源。而当我们谈论到高性能的计算，GPU总是一个绕不开的话题，在向量领域也不例外。

一起来认识 GPU-Cagra 索引！

随着RAG应用逐渐的普及，如何提高RAG应用的回答效果正在被越来越多的人关注。本文列出了各类优化RAG pipeline的方法和对应的图例说明，以帮助你快速了解目前主流的RAG优化策略。

实用指南 ｜ 如何提升 RAG Pipeline 效果？

现在，Milvus 的 Python SDK——PyMilvus 中已集成模型模块，支持直接添加 Embedding 和重排（Reranker）模型，大幅简化了将数据转化为向量以及对搜索结果进行重排的流程，十分适用于检索增强生成（RAG）应用。

PyMilvus 与 Embedding 模型集成

现在，我们很容易构建一个基于检索增强生成（RAG）的应用，但将其投入生产却非常困难，因为RAG的性能很难达到令人满意的状态。

使用RAGAs评估基于Milvus的RAG应用

OpenAI 最近官宣的多模态大模型 GPT-4o 再一次引发了热议，近年来对多模态的处理能力被认为是通往 AGI 的必经之路。虽然关于 GPT-4o 的训练方法尚未公布，但从 CLIP 双模态模型的训练上我们可以窥见端倪，将不同模态但相互关联的数据提取特征，转为固定维度的向量输入给模型，然后通过对比学习的方式调整模型参数进行模态间融合。

一文玩转 Milvus 新特性之 Hybrid Search

RAG 通常会用到三种不的AI模型，即 Embedding 模型、Rerankear模型以及大语言模型。本文将介绍如何根据您的数据类型以及语言或特定领域（如法律）选择合适的 Embedding 模型。

如何选择合适的 Embedding 模型？

大语言模型（LLM）为行业带来变革，具备强大的生成能力，在与知识库和检索器等工具相结合时，能够高效推动聊天机器人和 Agent 等高级生成式 AI（GenAI）应用的发展。与 LLMs 互动的过程中，最核心的部分是提示（prompt）。Prompt 是指用于指导这些模型执行特定任务的命令。然而，制定有效的 Prompt 是一个细致且复杂的过程，常需借助如思维链（Chain-of-Thought）和 ReAct 等高级技术。随着这些技术的发展，Prompt 的复杂性日益增加。此外，即使是相同的 Prompt ，在不同的 LLM（如 GPT-4 和 Gemini）之间也可能因其预训练方法和数据集的不同而产生差异化的结果。这一挑战引发了业内对 Prompt 工程的研究，这是一项专注于调整和优化 Prompt 以获得更佳和更定制化结果的劳动密集型任务。

Milvus 集成 DSPy：搭建高效 RAG Pipeline

然而，JSON 数据的层次结构虽然实用，但在存储、检索及数据分析时操作起来较为复杂。将 JSON 数据向量化能够提升数据处理、存储、检索及分析的效率，进而提高系统整体性能和操作便利性。

实用指南｜如何使用 Milvus 将 JSON 数据向量化并进行相似性搜索

开发人员特别重视那些易于设置、启动迅速且能在生产环境中无缝扩展的基础组件。针对这一需求，我们推出了最新的轻量级向量数据库产品——Milvus Lite。对于 Python 开发者而言，Milvus Lite 是一个极具价值的工具，尤其适用于追求高质量、易用性的搜索应用。

Jina AI + Milvus Lite：搭建 RAG 问答机器人

文章

问答

视频

教程

学习中心

腾讯云实验室

直播

竞赛

腾讯云代码分析专区

腾讯iOA零信任安全管理系统专区

腾讯云架构师技术同盟交流圈

腾讯云数据库专区

腾讯云智能顾问专区

腾讯云原生专区

腾讯混元专区

腾讯云TCE专区

腾讯云Lighthouse专区

腾讯云HAI专区

腾讯云Edgeone专区

腾讯云存储专区

腾讯云智能专区

腾讯轻联专区 

腾讯云开发专区

TAPD专区

腾讯轻量云游戏服专区

EdgeOne AI 安全实战专区

腾讯云最具价值专家

腾讯云架构师技术同盟

腾讯云创作之星

腾讯云开发者先锋

腾讯云代码助手

云原生构建

TAPD 敏捷项目管理

Cloud Studio

SDK中心

API中心

命令行工具

涵盖代码开发、场景应用、自动测试全流程，助你从零构建专属AI助手

一站式MCP教程库，解锁AI应用新玩法

聚焦“写作效率、视觉美观与运行性能”三方面进行全面升级，为您提供更高效、稳定的创作环境

社区富文本&Markdown编辑器全新改版上线，欢迎大家体验!

诚挚邀请您参与本次调研，分享您的真实使用感受与建议。您的反馈至关重要，感谢您的支持与参与！

社区新版编辑器体验调研

腾讯云开发者社区推出了Reinvent Data Science专栏，为你提供了Reinvent Data Science的相关文章，致力于帮助开发者快速成长与发展。

Reinvent Data Science

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐