首页
学习
活动
专区
工具
TVP
发布

大数据生态

本专栏为您分享各种大数据技术和实践经验,无论您是初学者还是资深从业者,都能在这里找到丰富的知识资源和实践分享。
专栏作者
116
文章
196256
阅读量
336
订阅数
「最佳实践」腾讯云 ES 8 向量化语义混合检索测试指南
本文描述问题及解决方法同样适用于 腾讯云 Elasticsearch Service(ES)。
岳涛
2024-04-11
2321
「EMR 开发指南」之 Sqoop 常见问题处理
Sqoop是一种用于在Apache Hadoop和结构化数据存储(如关系数据库)之间传输数据的开源工具。它允许用户在Hadoop分布式文件系统(HDFS)和外部结构化数据存储之间进行数据导入和导出操作。Sqoop的主要优势在于,它可以有效地将大量数据从关系数据库迁移到Hadoop环境中,以便进行大数据分析和处理。
岳涛
2024-03-01
2380
Docker的资源隔离(NameSpace)
Docker通过namespace(命名空间)实现资源隔离。Namespace是Linux系统提供的资源隔离机制,只有在同一个namespace下的进程可以互相联系,但无法感受外部进程的存在,从而实现资源隔离。
空洞的盒子
2024-02-28
1490
「最佳实践」借助网关双写,实现 Elasticsearch 的无缝在线迁移
本文描述问题及解决方法同样适用于 腾讯云 Elasticsearch Service(ES)。
岳涛
2024-02-23
4866
「最佳实践」腾讯云 Elasticsearch 8 向量化语义检索:使用自建 GPU 机器学习节点进行高效推理
本文描述问题及解决方法同样适用于 腾讯云 Elasticsearch Service(ES)。
岳涛
2024-01-16
1.3K28
关注专栏作者,随时接收最新技术干货
岳涛
腾讯大数据SRE研发工程师
王旭平
腾讯科技有限公司产品架构工程师
用户8411147
卡奥斯产品经理
「最佳实践」腾讯云 Elasticsearch 8:预训练模型与一站式向量化语义检索的完美结合
本文描述问题及解决方法同样适用于 腾讯云 Elasticsearch Service(ES)。
岳涛
2023-12-28
1.8K16
【2023腾讯·技术创作特训营】第四期发文挑战赛来袭,一起来慧眼识好文
大家好,为了帮助大家持续提升创作能力,腾讯云开发者社区【2023腾讯·技术创作特训营】最新一期有奖征文来袭啦~
岳涛
2023-12-01
52525
AWS/华为云Opensearch到Elasticsearch迁移方案
Elasticdump工具只能同步index mapping,settings无法同步。
沈小翊
2023-12-01
3030
「EMR 开发指南」之 Oozie 作业调度
本文将使用oozie组件自带的例子,详细介绍如何在oozie workflow上提交一个MapReduce jar。 本文以oozie 4.3.1版本为例。
岳涛
2023-11-30
1270
「EMR 开发指南」之 Kylin 存算分离方案
在大数据领域,数据量持续增长,数据类型和来源也变得越来越复杂。传统的数据仓库和分析工具很难满足大规模数据处理和实时分析的需求。为了解决这些问题,Apache Kylin应运而生。
岳涛
2023-11-29
3181
「EMR 运维指南」之 Kylin 迁移方案
在大数据领域,数据量持续增长,数据类型和来源也变得越来越复杂。传统的数据仓库和分析工具很难满足大规模数据处理和实时分析的需求。为了解决这些问题,Apache Kylin应运而生。
岳涛
2023-11-28
3701
Pipelines使用
在Kibana的Stack Management > Ingest Node Pipelines路径下可以
沈小翊
2023-11-28
1370
「EMR 开发指南」之 Kylin 快速构建 Cube
在大数据领域,数据量持续增长,数据类型和来源也变得越来越复杂。传统的数据仓库和分析工具很难满足大规模数据处理和实时分析的需求。为了解决这些问题,Apache Kylin应运而生。
岳涛
2023-11-27
3330
Mysql To ES By Flink-CDC
CDC是(Change Data Capture 变更数据获取)的简称。核心思想是,监测并捕获数据库的变动(包括数据 或 数据表的插入INSERT、
沈小翊
2023-11-27
4460
「EMR 运维指南」之 Kerberos 跨域互信配置
本文以Cluster-A跨域去访问Cluster-B中的服务为例。配置完成后,Cluster-A在获取到本集群KDC授予的TGT(Ticket Granting Ticket)后,能够跨域访问Cluster-B中的服务。本文配置的跨域互信是单向的,即Cluster-B无法跨域访问Cluster-A上的服务,如果需要实现双向跨域互信,按照同样的方法交换配置即可。 在两个集群在emr-header-1节点上,执行 hostname 命令获取hostname。在emr-header-1节点的/etc/krb5.conf文件中获取realm。本文使用的两个集群信息示例如下:
岳涛
2023-11-24
4890
ES监控链路搭建 Elasticsearch_exporter + Prometheus + Grafana
Elasticsearch_exporter 下载地址:Elasticsearch_exporter 下载地址
沈小翊
2023-11-24
3150
记录一次 Elasticsearch 聚合结果不准确的问题
惜儿
2023-11-23
1930
「EMR 运维指南」之 Kerberos 跨域认证方案
多个开启 kerberos 的 hadoop 集群之间要做通信(跨集群的数据迁移等),因为 Kerberos 原因无法正常进行,本文档说明了多 kerberos 集群下做跨域认证的方法。
岳涛
2023-11-23
3520
logstash迁移索引数据自动添加@version和@timestamp字段
使用Logstash迁移ES数据时发现有个索引数据无法迁移过来(其他索引正常),事先已经同步过mapping,settings,两边一致。
沈小翊
2023-11-23
3100
ES集群任务查杀场景指南
Elasticsearch Service 内核版本发布记录-ES 内核增强-文档中心-腾讯云
沈小翊
2023-11-22
1830
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档