腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
山行AI
山行AI(原开发架构二三事),后续专注于AI应用领域
专栏作者
举报
291
文章
642483
阅读量
56
订阅数
订阅专栏
申请加入专栏
全部文章(291)
模型(77)
https(69)
网络安全(54)
数据(52)
java(50)
编程算法(47)
开源(34)
http(28)
数据库(26)
node.js(23)
javascript(17)
存储(17)
大数据(16)
sql(15)
github(15)
工具(15)
flink(14)
spring(13)
代理(13)
html(12)
linux(12)
机器人(12)
搜索(12)
gpt(11)
云数据库 Redis(10)
容器(10)
数据结构(10)
Elasticsearch Service(10)
php(9)
网站(9)
dubbo(9)
部署(9)
系统(9)
测试(8)
教程(8)
开发(8)
配置(8)
go(7)
bash(7)
云数据库 SQL Server(7)
git(7)
api(7)
bash 指令(7)
人工智能(7)
缓存(7)
服务器(7)
框架(7)
nginx(6)
hashmap(6)
socket编程(6)
com(6)
openai(6)
脚本(6)
视频(6)
索引(6)
vue.js(5)
access(5)
ide(5)
分布式(5)
chatgpt(5)
pdf(5)
论文(5)
自动驾驶(4)
bootstrap(4)
搜索引擎(4)
金融(4)
jvm(4)
kotlin(4)
windows(4)
翻译(4)
工作(4)
开发者(4)
优化(4)
原理(4)
LLM(4)
python(3)
css(3)
unix(3)
apache(3)
文件存储(3)
知识图谱(3)
jdk(3)
数据分析(3)
kafka(3)
迁移(3)
prompt(3)
编码(3)
插件(3)
服务(3)
函数(3)
基础(3)
解决方案(3)
连接(3)
量化(3)
内存(3)
软件工程(3)
设计(3)
性能(3)
比特币(2)
ios(2)
c#(2)
servlet(2)
json(2)
android(2)
composer(2)
tomcat(2)
lucene/solr(2)
批量计算(2)
SSL 证书(2)
腾讯云测试服务(2)
yarn(2)
serverless(2)
自动化(2)
hadoop(2)
面向对象编程(2)
jdbc(2)
tcp/ip(2)
spring cloud(2)
processing(2)
unicode(2)
agent(2)
aigc(2)
产品(2)
程序(2)
客户端(2)
可视化(2)
浏览器(2)
图表(2)
网络(2)
音频(2)
语音(2)
终端(2)
负载均衡(1)
其他(1)
官方文档(1)
区块链(1)
数据挖掘(1)
tensorflow(1)
c 语言(1)
c++(1)
actionscript(1)
.net(1)
scala(1)
xml(1)
typescript(1)
memcached(1)
打包(1)
jar(1)
maven(1)
analyzer(1)
负载均衡缓存(1)
容器镜像服务(1)
深度学习(1)
laravel(1)
mapreduce(1)
访问管理(1)
云数据库 MongoDB(1)
TDSQL MySQL 版(1)
数据加密服务(1)
文字识别(1)
医疗(1)
运维(1)
压力测试(1)
spark(1)
强化学习(1)
正则表达式(1)
spring boot(1)
npm(1)
二叉树(1)
pytorch(1)
aop(1)
selenium(1)
scrapy(1)
markdown(1)
rpc(1)
kernel(1)
iis(1)
安全(1)
小程序(1)
数据处理(1)
hbase(1)
云计算(1)
utf8(1)
raft(1)
es(1)
智能识别(1)
图像标签(1)
auto(1)
chat(1)
chrome(1)
click(1)
cloud(1)
count(1)
deployment(1)
embedding(1)
figure(1)
marker(1)
migrate(1)
ocr(1)
pid(1)
plugin(1)
ram(1)
rank(1)
search(1)
sentinel(1)
streamlit(1)
system(1)
ui(1)
umi(1)
web(1)
笔记(1)
编程(1)
编辑器(1)
变量(1)
编译(1)
表格(1)
布局(1)
操作系统(1)
地图(1)
动画(1)
对象(1)
管理(1)
行业(1)
互联网(1)
计算机(1)
架构(1)
加密(1)
接口(1)
镜像(1)
开源框架(1)
流量(1)
命令行(1)
前端(1)
日志(1)
软件开发(1)
算法(1)
同步(1)
图数据库(1)
压缩(1)
隐私(1)
硬件(1)
源码(1)
原型(1)
字符串(1)
自然语言处理(1)
搜索文章
搜索
搜索
关闭
langchain中的Advanced RAG和ReRank技术一览
search
模型
搜索
算法
搜索引擎
在人工智能盛起的当下,前有ChatGPT珠玉在前,后有Sora(聊聊火出圈的世界AI大模型——Sora)横空出世的消息铺天盖地,笔者作为一名资深数据科学从业者,也进行了很多的探索。最近梳理了一些关于Advanced RAG和ReRank相关的资料,整理到本文中和大家一起分享。
山行AI
2024-03-06
1K
0
AI跑车引擎之向量数据库一览
数据库
搜索引擎
数据
搜索
索引
1.Milvus:一个开源的向量相似性搜索引擎,专为人工智能和机器学习应用程序设计。它支持多种相似性度量标准,并且具有很高的可扩展性,使其成为大规模部署的热门选择。2.Pinecone:一个关注简单易用的托管向量数据库服务。它提供了一个完全托管的、无服务器的环境,用于实时向量相似性搜索和推荐系统,减轻了运维负担。3.Vespa:一个实时大数据处理和搜索引擎,适用于各种应用场景,包括搜索、推荐和广告。Vespa 具有灵活的数据模型和内置的机器学习功能,可以处理大规模数据集。4.Weaviate:一个开源的知识图谱向量搜索引擎,它使用神经网络将实体和关系映射到高维空间,以实现高效的相似性搜索。Weaviate 支持自然语言处理、图查询和模型训练等功能。5.Vald:一个高度可扩展的、云原生的分布式向量搜索引擎,旨在处理大规模的向量数据。Vald 支持多种搜索算法,并通过 Kubernetes 部署和管理,提供高可用性和弹性。6.GSI:Global State Index (GSI) 是一个分布式、可扩展的向量搜索引擎,用于全球状态估计。GSI 利用不同节点间的局部信息,通过一致性哈希和向量近似搜索来实现高效的全球状态查询。7.Qdrant:一个开源的、高性能的向量搜索引擎,支持大规模数据集。Qdrant 提供了强大的索引、过滤和排序功能,以及丰富的 API,使其成为构建复杂应用程序的理想选择。
山行AI
2023-06-14
1.9K
0
elasticsearch之Roaring Bitmaps的结构
缓存
lucene/solr
编程算法
搜索引擎
如果你是刚刚接触搜索引擎,你可能会感到奇怪,构建搜索引擎中存储块的一个很重要的原因是搜索引擎能够有效地压缩和快速解码有序的数字集合。 为什么这个很有用?你可能知道elasticsearch的分片,是基于lucene的索引基础上的,将数据分割成一个个小片段(segment)进行存储的, 然后有规律地将这些小片段进行合并。在每个片段里面,每个文档都会有一个从0到2的31次方减1之间的唯一标识。这种结构像是数组的下标一样: 它存储在任何地方,而且足以标识一个条目。文档有序地存储在片段中,而且doc ID就是文档在存储片段中的索引。所以存储片段中的第一篇文档 的doc ID为0,第二篇为1。直到最后一篇文档,它的doc ID和这个存储片段中所有文档的数量减一是一样的。
山行AI
2019-06-28
4K
2
elasticsearch深入搜索一之近似匹配
搜索引擎
1. 从上面几种分词器的对比中可以看出,拼音分词器主要是把中文转换成拼音的方式进行分词; 2. ik_max_word分词和ik_smart分词器主要是索引单词而不是索引独立的单词; 3. standard分词器主要是索引独立的单词而不对词项进行索引。
山行AI
2019-06-28
2.5K
0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
立即发文
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档