前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【腾讯云云上实验室-向量数据库】腾讯,又爆一个王炸产品!

【腾讯云云上实验室-向量数据库】腾讯,又爆一个王炸产品!

原创
作者头像
纯洁的微笑
发布2023-11-27 10:26:42
2490
发布2023-11-27 10:26:42
举报
文章被收录于专栏:纯洁的微笑纯洁的微笑

AI 时代,已经来临。

未来的技术趋势一定是,朝着 AI 应用方向去的,各行各业已经紧锣密鼓的行动了起来。

1

AI 时代来临

我估计现在,已经没有人太质疑,AI时代已经来临了吧。

自大模型发布以来,整个世界都在为之沸腾,大家系统性的感受到大模型带来的威力。

紧接着国内外发布了 N 多的大模型,大家在感受到大模型的便利之后,一些企业也在思考能利用大模型做点什么。

尝试之后,多多少少都会遇到一些问题。

大模型虽然知识量庞大,但在企业侧,回答问题较有限。比如让大模型推荐相似客户,它推荐的比较泛。

或者向大模型提问企业的系统功能,这种系统功能是企业自身的产品介绍,这个大模型也无法回答。

企业数据库安全要求度高、有行业属性、实时性强,因此,不可能用大模型去解决企业内部数据支持的问题。

所以,企业如果要结合大模型搞点事情。

那就一定需要自己处理数据,然后再自己利用大模型整合,那么就会遇到第一个问题,数据怎么处理?

2

被大模型带火了

如果你在谷歌上搜一个单词,叫做“Vector Database”,你会发现这个词的趋势在今年3月以后开始爆火。

图片
图片

而今年3月发生了什么呢?OpenAI为聊天机器人发布了大模型。

Vector Database 翻译过来,叫做向量数据库

那什么是向量数据库呢?

向量数据库是一种以向量嵌入(高维向量)方式存储和管理非结构化数据(如文本、图像或音频)的数据库,以便于快速查找和检索类似对象。

在传统关系数据库中,我们总是以关键字作为查询的手段,如果我们想找一本书籍?

比如查询作者是纯洁的微笑的书籍,这种方式用关系数据库就可以搞定。

但如果我们想查询一本书籍封面是黑色还画着一个少女的书籍,这个时候用关系数据库就比较困难了,因为你可能要理解书籍封面的内容。

而向量数据库可以帮助你根据特定的查询(例如,一本关于…的书)而不是一些预定义的属性(例如,作者)来查找对象,就像图书管理员一样。

图片
图片

与传统数据库相比,向量数据库使用向量化计算,高速地处理大规模的、高维的复杂数据,例如图像、音频和视频等,并支持复杂查询操作,扩展到多个节点,以处理更大规模的数据。

可以说,几乎所有由大语言模型(LLM)驱动的 AI产品或技术都使用了向量数据库,向量数据库是 AI 的基础设施。

目前相关开源产品很不稳定,如果企业要自己去实践的话,会花费巨大的时间和精力去探索。

而最快的办法是找一个成熟的产品体系来支撑,刚好国内腾讯云向量数据库在这方面走到了前列。

3

腾讯云向量数据库

腾讯云向量数据库算是国内第一批,提供全托管分布式数据库,单索引支持 千亿级向量规模,可支持500万级 QPS 及毫秒级查询延迟。

基本上满足绝大部分企业的使用需求,不仅能为大模型提供外部知识库,提高大模型回答的准确性,还可广泛应用于推荐系统、自然语言处理等 AI 领域。

图片
图片

具体来说,Tencent Cloud VectorDB提供了文本分割、Embedding、向量存储检索的一站式解决方案,让用户使用向量数据库的全过程都能应用到 AI 能力。

原来企业接入一个大模型需要花1个月左右的时间,用腾讯云向量库后,可能仅需3天,给企业使用降低了门槛。

而且将腾讯云向量数据库用于大模型预训练数据的分类、去重和清洗相比传统方式可以实现10倍效率提升

如果将向量数据库作为外部知识库用于模型推理,则可以将成本降低2-4个数量级

最高支持1000亿级向量检索规模, 相比单机插件式索引规模提升1000倍;具备百万级每秒查询(QPS)的峰值能力。

这是什么概念?

假设想要在1000亿张图片里找到1张有狗的图片,腾讯云向量数据库可以同时支持100万个类似的请求,在1000亿规模图片里进行搜索,并且平均时延控制在百毫秒以内。

用这些参数对比同类型的产品,几乎可以得出腾讯云向量数据库是目前,AI时代的数据库首选。

另外,近期腾讯云向量数据库联合百川智发布了“AGI启航计划”!

将向大家限量开放向量数据库实例及 Baichuan2 400万免费Tokens,助力各行各业快速搭建RAG应用。

具体的领取方式,大家可以看下图:(限量供应,手慢无)

图片
图片

4

首选

回到文章开头,如果你是一个企业的技术负责人,公司现在需要借助AI的力量做一个推荐系统、或者智能问答系统。

你会怎么做技术方案?

全部从0开始自研,还是选择一套比较有成熟系统的解决方案,我估计90%的技术老板会选择后者。

因为前者面临的技术风险太大了,一般企业难有这么深的技术自研能力,很容易把项目拖黄了。

这样分析下来,腾讯云向量数据库就成为了在 AI 时代中,数据库选型的第一选项了。

腾讯云从 2019 年自研向量数据库以来,腾讯云向量数据库已经接入了腾讯集团 40+业务,每天超过 1600 亿次的请求调用。

图片
图片

今年 8 月公测以来,外部企业客户接入也超过了 1000 家。典型的客户例如搜狐、销售易、什么值得买、元象、MINIMAX、博世等,它们都基于向量数据库接入了大模型,构建了自己的 AI 业务。

那些需要使用大模型和处理大量数据的企业,特别是那些在AI、机器学习、搜索和推荐系统等领域有大量应用的公司。

在腾讯云向量数据库的帮助下,传统模式下花费大量时间进行的处理、模型选取、向量化等步骤可以大大简化,使开发者可以在更短的时间内完成工作。

从而帮助企业快速的实现相关 AI 业务,从性能、可靠性和成本效益来看,使用腾讯云向量数据库有非常明显的优势。

最后,希望在腾讯云等相关企业的带领下,我国各行各业可以尽快的享受到AI 带来的便利,让 AI 巨大的势能促进各企业快速发展,迎接崭新的未来。

这次 TechoDay 技术开放日将资料和课件都整合成了一份《腾讯云工具指南》,这份资料技术含量很高,可以帮助学习了解向量数据库的技术优势和价值应用。

资料包含数据库的发展趋势和产品价值解读,还有实打实的向量数据库应用案例和解决方案,感兴趣的小伙伴,建议不要错过这个福利!

图片
图片

(长按识别即可下载)

此外,腾讯云向量数据库x百川智能【AGI启航计】正式启动,向量数据库免费实例+ Baichuan2400万免费Tokens限量领取,帮助您快速搭建RAG应用,点击“阅读原文”即可获取,Chat With Your Data!

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1
  • AI 时代来临
  • 2
  • 被大模型带火了
  • 3
  • 腾讯云向量数据库
  • 4
  • 首选
相关产品与服务
向量数据库
腾讯云向量数据库(Tencent Cloud VectorDB)是一款全托管的自研企业级分布式数据库服务,专用于存储、检索、分析多维向量数据。该数据库支持多种索引类型和相似度计算方法,单索引支持千亿级向量规模,可支持百万级 QPS 及毫秒级查询延迟。腾讯云向量数据库不仅能为大模型提供外部知识库,提高大模型回答的准确性,还可广泛应用于推荐系统、自然语言处理等 AI 领域。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档