腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
腾讯云架构师技术同盟
文章/答案/技术大牛
搜索
搜索
关闭
发布
首页
学习
活动
专区
工具
TVP
腾讯云架构师技术同盟
返回腾讯云官网
大数据杂货铺
专栏成员
举报
312
文章
507512
阅读量
45
订阅数
订阅专栏
申请加入专栏
全部文章(312)
apache(65)
数据库(61)
大数据(59)
sql(57)
hive(54)
数据(50)
存储(39)
kafka(36)
专用宿主机(33)
编程算法(29)
node.js(28)
hbase(27)
api(26)
spark(26)
kerberos(25)
TDSQL MySQL 版(22)
网络安全(22)
hadoop(22)
yarn(21)
https(21)
模型(19)
uml(18)
flink(18)
腾讯云测试服务(16)
机器学习(15)
数据迁移(14)
搜索(14)
数据分析(13)
工具(13)
神经网络(12)
人工智能(12)
html(11)
tcp/ip(11)
数据湖(11)
java(10)
迁移(10)
python(9)
深度学习(9)
jdk(8)
索引(8)
php(7)
postgresql(7)
unix(7)
访问管理(7)
SSL 证书(7)
性能(7)
bash(6)
.net(6)
xml(6)
linux(6)
mapreduce(6)
网站(6)
开源(6)
数据处理(6)
数据管理(6)
文件存储(5)
企业(5)
缓存(5)
sas(5)
测试(5)
产品(5)
解决方案(5)
对象存储(4)
自动驾驶(4)
云数据库 SQL Server(4)
全文检索(4)
lucene/solr(4)
知识图谱(4)
parcel(4)
自动化(4)
shell(4)
无人驾驶(4)
jdbc(4)
windows(4)
虚拟化(4)
data(4)
dp(4)
系统(4)
LLM(4)
javascript(3)
nosql(3)
github(3)
容器镜像服务(3)
云推荐引擎(3)
容器(3)
kubernetes(3)
ssh(3)
yum(3)
zookeeper(3)
clickhouse(3)
elasticsearch(3)
event(3)
代理(3)
服务(3)
管理(3)
集群(3)
架构(3)
优化(3)
私有网络(2)
oracle(2)
jar(2)
DevOps 解决方案(2)
dns(2)
决策树(2)
markdown(2)
rpc(2)
安全(2)
数据可视化(2)
物联网(2)
mqtt(2)
密钥管理服务(2)
airflow(2)
mesh(2)
pdf(2)
表格(2)
工作流(2)
架构模式(2)
数据仓库(2)
推送(2)
语法(2)
向量数据库(2)
云镜(主机安全)(1)
其他(1)
tensorflow(1)
c++(1)
jquery(1)
json(1)
android(1)
单片机(1)
access(1)
打包(1)
命令行工具(1)
混合云解决方案(1)
日志数据(1)
数据安全(1)
http(1)
分布式(1)
jvm(1)
keras(1)
pytorch(1)
机器人(1)
安全漏洞(1)
数据结构(1)
微服务(1)
nat(1)
腾讯云开发者社区(1)
防火墙(1)
聚类算法(1)
emr(1)
腾讯云图数据可视化(1)
数据库管理(1)
数据集成(1)
图像分析(1)
agent(1)
chatgpt(1)
cloudera(1)
com(1)
core(1)
debezium(1)
enterprise(1)
fabric(1)
messaging(1)
mysql(1)
olap(1)
shuffle(1)
streamlit(1)
text(1)
tls(1)
ui(1)
编码(1)
大数据处理(1)
工作(1)
技巧(1)
可视化(1)
论文(1)
日志(1)
入门(1)
设计(1)
视频(1)
同步(1)
线程(1)
序列化(1)
最佳实践(1)
结构化数据(1)
数据管道(1)
数据流(1)
搜索文章
搜索
搜索
关闭
PDF 如何高效的转换成 Markdown
markdown
pdf
表格
工具
语法
将PDF转换为Markdown文件格式不仅提高了文档的可读性和结构化程度,还提升了处理效率和准确性,适用于多种应用场景。 Markdown与其他文档格式(如Word、HTML)相比,在处理PDF时有哪些具体的优势和劣势? Markdown在处理PDF时相比其他文档格式(如Word、HTML)具有以下具体的优势和劣势:
大数据杂货铺
2024-06-27
467
0
将生成式AI 投入生产
模型
设计
人工智能
开源
服务
生成式人工智能和大型语言模型 (LLM) 是人工智能的新革命,为世界带来了不到两年前我们只能梦想的能力。与深度学习等之前的里程碑不同,在当前的人工智能革命中,一切都发生得比以往任何时候都快。
大数据杂货铺
2024-06-27
115
0
图与矢量 RAG — 基准测试、优化手段和财务分析示例
搜索
优化
测试
产品
数据
Neo4j 和 WhyHow.AI 团队探索了图和矢量搜索系统如何协同工作以改进检索增强生成 (RAG) 系统。使用财务报告 RAG 示例,我们探索了图和矢量搜索之间的响应差异,对两种类型的答案输出进行了基准测试,展示了如何通过图结构优化深度和广度,并探索了为什么将图和矢量搜索结合起来是 RAG 的未来。
大数据杂货铺
2024-06-06
148
0
遗留和现代数据库中的向量搜索
数据库
模型
数据
搜索
索引
向量数据库是一种将数据(包括文本、图像、音频和视频)存储为向量的数据库,向量是高维空间中对象或概念的数学表示。
大数据杂货铺
2024-05-27
138
0
AI Agent的类型、优势及应用
代理
模型
系统
人工智能
agent
AI 代理是重塑商业动态的关键技术进步。了解这些代理的运作方式,发现它们的关键优势包括效率、可扩展性和成本效益。我们将探索代理的实例及它们在各领域的应用,为未来的人工智能趋势和对客户体验的影响铺平道路。
大数据杂货铺
2024-05-27
344
0
使用 LlamaParse 进行 PDF 解析并创建知识图谱
线程
知识图谱
存储
pdf
数据
此 Python 笔记本提供了有关利用 LlamaParse 从 PDF 文档中提取信息并随后将提取的内容存储到 Neo4j 图数据库中的综合指南。本教程在设计时考虑到了实用性,适合对文档处理、信息提取和图形数据库技术感兴趣的开发人员、数据科学家和技术爱好者。
大数据杂货铺
2024-05-27
803
0
Elasticsearch 与 OpenSearch:扩大性能差距
测试
数据
搜索
性能
elasticsearch
对于任何依赖快速、准确搜索数据的组织来说,强大、快速且高效的搜索引擎是至关重要的元素。对于开发人员和架构师来说,选择正确的搜索平台可以极大地影响您的组织提供快速且相关结果的能力。在我们全面的性能测试中,Elasticsearch® 成为明智的选择。Elasticsearch 比 OpenSearch 快 40%--140%,同时使用更少的计算资源。
大数据杂货铺
2024-05-09
312
0
全文检索、向量检索和混合检索的比较分析
模型
搜索
数据库
全文检索
解决方案
畅游当今的信息海洋既是一个奇迹,又是一个迷宫。全文和矢量搜索使我们能够构建搜索体验,使用户能够找到相关的产品、内容等。随着我们对搜索精度和上下文的追求不断发展,出现了一个问题:我们能否平衡全文搜索的词汇灵活性和向量搜索的语义深度?
大数据杂货铺
2024-04-24
2.7K
0
深入研究向量数据库
索引
向量数据库
数据库
模型
数据
有一天,我请我最喜欢的大型语言模型(LLM)帮助我向我快 4 岁的孩子解释向量。几秒后,它就催生了一个充满神话生物、魔法和向量的故事。瞧!我为一本新的儿童读物绘制了草图,它给人留下了深刻的印象,因为独角兽被称为"LuminaVec"。
大数据杂货铺
2024-04-22
264
0
掌控心理学:使用 Mistral-7B 和 LangChain 构建专家 RAG
测试
技巧
模型
数据
数据库
信息访问:大语言模型无法快速访问其训练集之外的数据。想象一下,你最喜欢的人工智能助手无法为你提供有帮助的答案,但却喋喋不休地告诉你如何获得问题的答案。
大数据杂货铺
2024-04-22
415
0
RAG-Fusion 提高 LLM 生成文本的质量和深度
人工智能
模型
搜索
系统
LLM
检索增强生成(RAG)显着先进了人工智能。它结合了预训练的密集检索和序列到序列模型的功能来生成响应。在此基础上,出现了一种称为RAG-Fusion的新方法,旨在弥合传统搜索范式与人类查询的多方面维度之间的差距。
大数据杂货铺
2024-04-15
1.1K
0
提高大型语言模型 (LLM) 性能的四种数据清理技术
性能
LLM
text
模型
数据
搜索增强生成(RAG)过程彻底增强对大语言模型(LLM)的理解、为它们提供上下文并帮助防止幻觉的潜力而受到欢迎。RAG 过程涉及几个步骤,从分块供应文档提取到上下文,再到用该上下文提示 LLM 模型。虽然 RAG 可以显着改善预测,但有时也会导致错误的结果。几个文档的方式在此过程中发挥了至关重要的作用。例如,如果我们的"上下文文档" " 包含大语言模型的拼写错误或不相似的字符(例如表情符号),则可能会混淆大语言模型对所提供的上下文的理解。
大数据杂货铺
2024-04-15
480
0
数据仓库与数据湖与湖仓一体:概述及比较
数据
数据仓库
存储
数据湖
表格
随着越来越多的公司依靠数据来推动关键业务决策、改进产品供应并更好地服务客户,公司捕获的数据量比以往任何时候都多。Domo 的这项研究估计,2017 年每天会生成 2.5 百亿字节的数据,到 2025 年,这一数字将增加到 463 艾字节。但如果公司不能快速利用这些数据,那么这些数据又有什么用呢?针对数据分析需求的最佳数据存储这一话题长期以来一直存在争议。
大数据杂货铺
2024-04-15
3.1K
0
Langchain入坑
系统
LLM
存储
模型
数据
本指南(以及文档中的大多数其他指南)使用Jupyter 笔记本,并假设读者也使用 Jupyter 笔记本。Jupyter 笔记本非常适合学习如何使用 LLM 系统,因为事情经常可能会出错(意外输出、API 关闭等),而在交互式环境中阅读指南是更好地理解它们的好方法。
大数据杂货铺
2024-04-15
544
0
企业生成式AI:2024 年企业的 10 多个用例和最佳实践
人工智能
企业
模型
数据
最佳实践
与中型市场公司或初创公司相比,生成式人工智能(GenAI)为企业提供了新的机遇,包括:
大数据杂货铺
2024-04-15
759
0
知识图谱和 LLM:多跳问答
数据
搜索
LLM
知识图谱
工具
检索增强生成(RAG)应用程序通过将外部来源的数据集成到 LLM 中,擅长回答简单的问题。但他们很难回答涉及将相关信息之间的点连接起来的多部分问题。这是因为 RAG 应用程序需要一个数据库,该数据库旨在存储数据,以便轻松找到回答这些类型问题所需的所有内容。
大数据杂货铺
2024-04-15
818
0
Data Fabric 2024:现代数据集成组件指南
数据集成
data
fabric
数据
数据管理
数据管理和数据集成是任何组织数字化转型战略的关键组成部分。在当今的全渠道业务环境中,组织必须实时访问和分析来自各种来源的大规模数据。然而,传统的数据管理方法对于这些要求来说常常太慢。数据编织架构可以帮助克服这些问题。
大数据杂货铺
2024-04-15
390
0
使用知识图谱实现 RAG 应用
数据
搜索
索引
知识图谱
微服务
《福布斯》最近将 RAG 应用程序评为人工智能领域最热门的事物。这并不奇怪,因为检索增强生成需要最少的代码,并有助于建立用户对大语言模型的信任。构建出色的 RAG 应用程序或聊天机器人时面临的挑战是处理结构化文本和非结构化文本。
大数据杂货铺
2024-04-03
1.3K
1
利用知识图谱提高 RAG 应用的准确性
知识图谱
模型
数据
搜索
索引
在 RAG 应用中使用 Neo4j 和 LangChain 构建和检索知识图谱信息的实用指南
大数据杂货铺
2024-04-02
730
0
正确完成检索增强生成 (RAG):数据库数据
数据库
机器人
数据
搜索
索引
当我们在生成式 AI 的背景下讨论数据库时,总是首先想到的问题之一是:“我不能告诉数据库我需要什么,而不必制作一个复杂(通常是多页)的 SQL 查询吗?
大数据杂货铺
2024-04-02
1.4K
0
点击加载更多
社区活动
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·干货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档