腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
大数据杂货铺
专栏作者
举报
305
文章
431659
阅读量
45
订阅数
订阅专栏
申请加入专栏
全部文章(305)
apache(65)
数据库(60)
大数据(59)
sql(57)
hive(54)
数据(46)
存储(38)
kafka(36)
专用宿主机(33)
编程算法(29)
node.js(28)
hbase(27)
api(26)
spark(26)
kerberos(25)
TDSQL MySQL 版(22)
网络安全(22)
hadoop(22)
yarn(21)
https(21)
uml(18)
flink(18)
腾讯云测试服务(16)
模型(16)
机器学习(15)
数据迁移(14)
数据分析(13)
神经网络(12)
工具(12)
html(11)
tcp/ip(11)
数据湖(11)
搜索(11)
java(10)
人工智能(10)
迁移(10)
python(9)
深度学习(9)
jdk(8)
php(7)
postgresql(7)
unix(7)
访问管理(7)
SSL 证书(7)
索引(7)
bash(6)
.net(6)
xml(6)
linux(6)
mapreduce(6)
网站(6)
数据处理(6)
数据管理(6)
性能(6)
文件存储(5)
企业(5)
开源(5)
缓存(5)
sas(5)
解决方案(5)
对象存储(4)
自动驾驶(4)
云数据库 SQL Server(4)
全文检索(4)
lucene/solr(4)
parcel(4)
自动化(4)
shell(4)
无人驾驶(4)
jdbc(4)
windows(4)
虚拟化(4)
data(4)
dp(4)
产品(4)
LLM(4)
javascript(3)
nosql(3)
github(3)
容器镜像服务(3)
知识图谱(3)
云推荐引擎(3)
容器(3)
kubernetes(3)
ssh(3)
yum(3)
zookeeper(3)
clickhouse(3)
event(3)
测试(3)
管理(3)
集群(3)
架构(3)
系统(3)
私有网络(2)
oracle(2)
jar(2)
DevOps 解决方案(2)
dns(2)
决策树(2)
rpc(2)
安全(2)
数据可视化(2)
物联网(2)
mqtt(2)
密钥管理服务(2)
airflow(2)
elasticsearch(2)
mesh(2)
代理(2)
服务(2)
工作流(2)
架构模式(2)
数据仓库(2)
推送(2)
优化(2)
向量数据库(2)
云镜(主机安全)(1)
其他(1)
tensorflow(1)
c++(1)
jquery(1)
json(1)
android(1)
单片机(1)
access(1)
打包(1)
命令行工具(1)
混合云解决方案(1)
日志数据(1)
数据安全(1)
http(1)
分布式(1)
jvm(1)
keras(1)
pytorch(1)
markdown(1)
机器人(1)
安全漏洞(1)
数据结构(1)
微服务(1)
nat(1)
腾讯云开发者社区(1)
防火墙(1)
聚类算法(1)
emr(1)
腾讯云图数据可视化(1)
数据库管理(1)
数据集成(1)
图像分析(1)
chatgpt(1)
cloudera(1)
com(1)
core(1)
debezium(1)
enterprise(1)
fabric(1)
messaging(1)
mysql(1)
olap(1)
shuffle(1)
streamlit(1)
text(1)
tls(1)
ui(1)
编码(1)
表格(1)
大数据处理(1)
工作(1)
技巧(1)
可视化(1)
论文(1)
日志(1)
入门(1)
视频(1)
同步(1)
序列化(1)
语法(1)
最佳实践(1)
结构化数据(1)
数据管道(1)
数据流(1)
搜索文章
搜索
搜索
关闭
全文检索、向量检索和混合检索的比较分析
模型
搜索
数据库
全文检索
解决方案
畅游当今的信息海洋既是一个奇迹,又是一个迷宫。全文和矢量搜索使我们能够构建搜索体验,使用户能够找到相关的产品、内容等。随着我们对搜索精度和上下文的追求不断发展,出现了一个问题:我们能否平衡全文搜索的词汇灵活性和向量搜索的语义深度?
大数据杂货铺
2024-04-24
26
0
深入研究向量数据库
索引
向量数据库
数据库
模型
数据
有一天,我请我最喜欢的大型语言模型(LLM)帮助我向我快 4 岁的孩子解释向量。几秒后,它就催生了一个充满神话生物、魔法和向量的故事。瞧!我为一本新的儿童读物绘制了草图,它给人留下了深刻的印象,因为独角兽被称为"LuminaVec"。
大数据杂货铺
2024-04-22
144
0
掌控心理学:使用 Mistral-7B 和 LangChain 构建专家 RAG
测试
技巧
模型
数据
数据库
信息访问:大语言模型无法快速访问其训练集之外的数据。想象一下,你最喜欢的人工智能助手无法为你提供有帮助的答案,但却喋喋不休地告诉你如何获得问题的答案。
大数据杂货铺
2024-04-22
108
0
RAG-Fusion 提高 LLM 生成文本的质量和深度
人工智能
模型
搜索
系统
LLM
检索增强生成(RAG)显着先进了人工智能。它结合了预训练的密集检索和序列到序列模型的功能来生成响应。在此基础上,出现了一种称为RAG-Fusion的新方法,旨在弥合传统搜索范式与人类查询的多方面维度之间的差距。
大数据杂货铺
2024-04-15
196
0
提高大型语言模型 (LLM) 性能的四种数据清理技术
性能
LLM
text
模型
数据
搜索增强生成(RAG)过程彻底增强对大语言模型(LLM)的理解、为它们提供上下文并帮助防止幻觉的潜力而受到欢迎。RAG 过程涉及几个步骤,从分块供应文档提取到上下文,再到用该上下文提示 LLM 模型。虽然 RAG 可以显着改善预测,但有时也会导致错误的结果。几个文档的方式在此过程中发挥了至关重要的作用。例如,如果我们的"上下文文档" " 包含大语言模型的拼写错误或不相似的字符(例如表情符号),则可能会混淆大语言模型对所提供的上下文的理解。
大数据杂货铺
2024-04-15
99
0
数据仓库与数据湖与湖仓一体:概述及比较
数据
数据仓库
存储
数据湖
表格
随着越来越多的公司依靠数据来推动关键业务决策、改进产品供应并更好地服务客户,公司捕获的数据量比以往任何时候都多。Domo 的这项研究估计,2017 年每天会生成 2.5 百亿字节的数据,到 2025 年,这一数字将增加到 463 艾字节。但如果公司不能快速利用这些数据,那么这些数据又有什么用呢?针对数据分析需求的最佳数据存储这一话题长期以来一直存在争议。
大数据杂货铺
2024-04-15
126
0
Langchain入坑
系统
LLM
存储
模型
数据
本指南(以及文档中的大多数其他指南)使用Jupyter 笔记本,并假设读者也使用 Jupyter 笔记本。Jupyter 笔记本非常适合学习如何使用 LLM 系统,因为事情经常可能会出错(意外输出、API 关闭等),而在交互式环境中阅读指南是更好地理解它们的好方法。
大数据杂货铺
2024-04-15
136
0
企业生成式AI:2024 年企业的 10 多个用例和最佳实践
人工智能
企业
模型
数据
最佳实践
与中型市场公司或初创公司相比,生成式人工智能(GenAI)为企业提供了新的机遇,包括:
大数据杂货铺
2024-04-15
208
0
知识图谱和 LLM:多跳问答
数据
搜索
LLM
知识图谱
工具
检索增强生成(RAG)应用程序通过将外部来源的数据集成到 LLM 中,擅长回答简单的问题。但他们很难回答涉及将相关信息之间的点连接起来的多部分问题。这是因为 RAG 应用程序需要一个数据库,该数据库旨在存储数据,以便轻松找到回答这些类型问题所需的所有内容。
大数据杂货铺
2024-04-15
191
0
Data Fabric 2024:现代数据集成组件指南
数据集成
data
fabric
数据
数据管理
数据管理和数据集成是任何组织数字化转型战略的关键组成部分。在当今的全渠道业务环境中,组织必须实时访问和分析来自各种来源的大规模数据。然而,传统的数据管理方法对于这些要求来说常常太慢。数据编织架构可以帮助克服这些问题。
大数据杂货铺
2024-04-15
85
0
使用知识图谱实现 RAG 应用
数据
搜索
索引
知识图谱
微服务
《福布斯》最近将 RAG 应用程序评为人工智能领域最热门的事物。这并不奇怪,因为检索增强生成需要最少的代码,并有助于建立用户对大语言模型的信任。构建出色的 RAG 应用程序或聊天机器人时面临的挑战是处理结构化文本和非结构化文本。
大数据杂货铺
2024-04-03
178
0
利用知识图谱提高 RAG 应用的准确性
知识图谱
模型
数据
搜索
索引
在 RAG 应用中使用 Neo4j 和 LangChain 构建和检索知识图谱信息的实用指南
大数据杂货铺
2024-04-02
202
0
正确完成检索增强生成 (RAG):数据库数据
数据库
机器人
数据
搜索
索引
当我们在生成式 AI 的背景下讨论数据库时,总是首先想到的问题之一是:“我不能告诉数据库我需要什么,而不必制作一个复杂(通常是多页)的 SQL 查询吗?
大数据杂货铺
2024-04-02
257
0
使用检索增强生成 (RAG) 增强 SQL 代理
sql
代理
工具
语法
数据库
与其他数据库不同,Teradata 通过提供大量高级分析功能而脱颖而出,从数据清理和数据探索到模型训练、文本分析以及路径和模式分析功能。
大数据杂货铺
2024-04-02
81
0
LangChain+SQL-彻底改变您的数据探索
数据库
sql
代理
模型
数据
在不断发展的数据科学和机器学习世界中,有一个改变游戏规则的LangChain承诺让与你的数据交谈变得轻而易举——进入。这个动态工具不仅仅是另一个玩家;它是您的伙伴,使棘手的数据分析世界变得更简单。和我一起踏上这段旅程,开始我们的设置,对我们的数据说一声“Hello World”,解开LangChain的魔力,并进行一些故障排除。
大数据杂货铺
2024-03-21
128
0
使用上下文策略极大提高AI SQL 准确性
测试
模型
数据
数据库
sql
拥有一个能够回答商业用户简单的语言问题的自主人工智能智能体的承诺是一个有吸引力的提议,但迄今为止仍难以实现。许多人尝试过让 ChatGPT 进行写入,但成效有限。失败的主要原因是大语言模型对其要求查询的特定数据集缺乏了解。
大数据杂货铺
2024-03-11
124
0
Gartner目录数据研究指南:如何阅读市场指南、魔力象限和同行评审
解决方案
数据
数据管理
搜索
工具
以下是本文的 2 分钟摘要,其中包含 Gartner 关于在数据目录中查找内容的关键建议:
大数据杂货铺
2024-03-11
102
0
AI 数据目录:探索人工智能为元数据应用和数据交互带来的可能性
人工智能
自动化
工作流
数据
搜索
AI数据目录会在您的数据资产中搜索元数据,然后对其进行处理以实现数据工作流程自动化,并提供智能建议来丰富数据发现、探索、文档记录和治理。
大数据杂货铺
2024-03-11
138
0
数据沿袭与数据溯源:7 个关键区别
系统
管理
可视化
数据
数据管理
数据沿袭揭示了数据从何而来以及它在生命周期中如何演变。另一方面,数据溯源更侧重于通过对数据和元数据的审计跟踪来验证数据的准确性、质量和可靠性的能力。
大数据杂货铺
2024-03-11
140
0
向量数据库101-非结构化数据入门
入门
数据
结构化数据
向量数据库
数据库
本博客主要是基于文本的非结构化数据概述。我知道,这听起来不是一个很性感的话题,但在你按下浏览器标签上的 x 按钮之前,先听我们说完。
大数据杂货铺
2024-02-22
116
0
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
立即发文
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档