云HDFS新年活动_云HDFS新年促销_云HDFS活动 - 腾讯云开发者社区

您找到你想要的搜索结果了吗？

是的

没有找到

首届Apache Hadoop技术社区中国Meetup在京举办(内附完整PPT)

将 Kudu 数据迁移到 CDP

当您将 Kudu 数据从 CDH 迁移到 CDP 时，您必须使用 Kudu 备份工具来备份和恢复您的 Kudu 数据。

直播报名中 | 湖存储第七期数据湖加速器 GooseFS 数据安全篇

“ 雁栖学堂-湖存储专题直播是腾讯云主办的国内首个湖存储百科知识直播节目，是一个围绕湖存储技术领域，基于存储加速服务，覆盖了前沿趋势，时事热点，客户案例，大咖分享，开发者成长路径等内容的直播交流平台。 ” 雁栖学堂-湖存储专题直播第七期将邀请到腾讯云存储高级产品经理“林楠”，介绍数据湖加速器 GooseFS 数据成本篇。分享内容本次分享内容主要探讨如何通过数据湖加速器 GooseFS，对象存储 COS 等服务搭建冷热分层的数据湖存储服务。数据湖加速器 GooseFS 可以为用户提供高性能

在腾讯云CVM上搭建Hadoop集群

本教程将介绍如何在腾讯云CVM上搭建Hadoop集群。Hadoop中是一个Apache的框架，可以让你通过基本的编程处理跨服务器集群的分布式方式的大型数据集。Hadoop提供的可扩展性允许你从单个服务器扩展到数千台计算机。它还在应用层提供故障检测，因此它可以检测和处理故障，作为高可用性服务。

腾讯云开发者社区创作者年度总结暨新年活动说明

云+社区于2020年1月16日发布了《2019云+社区创作者年度总结》，各位创作者可以在2020.1.16之后登录云+社区，通过活动入口进入查看自己的H5报告。

021

新年第一天，带你去追光！

告别“多舛”的2020年， 2021年的第一天，从日出到日落，让我们守时观看， 840分钟不间断直播。面向梅里雪山、苍山洱海...... 联动云南10个城市40个景区一起追逐新年之光，带你一起“云祈福”，迎接崭新的2021年。观万物有光，盼山河无恙！腾讯文旅联合游云南在2021年1月1日发起“2021新年追光计划”活动。以“直播+短视频”的形式，在腾讯云视频号、腾讯文旅视频号、游云南App、微信视频号在5个时段，发起多地串联直播。在直播中发起新年倒计时、新年第一缕阳光、祈福许愿等活动，记

叮~~2020年度创作者报告已生成，快来赢取新年好礼！

爆竹声中一岁除，春风送暖入屠苏。千门万户曈曈日，总把新桃换旧符。2020年，云+社区总共举办了大大小小近30场活动。2020年，云+社区以2019云+社区创作者年度总结暨新年活动划出一个新的开始，以圣诞活动和杂货摊第二季落下一个完美的句号。现在，2021年已经被【技术创作101训练营】第二季激活了，《2020云+社区创作者年度总结》当然也不能落后！云+社区在2021年1月14号发布了《2020云+社区创作者年度总结》，各位创作者大大可以在2021年1月14号之后登录云+社区，通过活动入口进入查看自己的H5报告！

0110

带你“云祈福”！腾讯文旅联合“游云南”发起“2021新年追光计划”

将数据迁移到CDP 私有云基础的数据迁移用例

您可以使用 authzmigrator 工具将 Hive 对象和 URL 权限以及 Kafka 权限从 CDH 集群迁移到 CDP 私有云基础集群。您可以使用 DistCp 工具将 HDFS 数据从安全的 HDP 集群迁移到安全或不安全的CDP 私有云基础集群。

CDP 多Namenode配置

此功能为 CDP Private Cloud Base 提供了使用多个备用名称节点的能力。

基于腾讯云CVM搭建Hadoop集群及数据迁移最佳实践

本文主要介绍如何在腾讯云CVM上搭建Hadoop集群，以及如何通过distcp工具将友商云Hadoop中的数据迁移到腾讯云自建Hadoop集群。

012

Sentry到Ranger—简明指南

Cloudera Data Platform (CDP)通过合并来自Cloudera Enterprise Data Hub (CDH)和Hortonworks Data Platform (HDP)这两个传统平台的技术，为客户带来了许多改进。CDP 包括新功能以及一些先前存在的安全和治理功能的替代方案。CDH 用户的一项重大变化是将 Sentry 替换为 Ranger 以进行授权和访问控制。

搜狐智能媒体基于腾讯云大数据 EMR 的降本增效之路

2022年，搜狐智能媒体完成了迁移腾讯云的弹性计算项目，其中大数据业务整体都迁移了腾讯云，上云之后的整体服务性能、成本控制、运维效率等方面都取得了不错的效果，达到了预期的降本增效目标。

CDP私有云基础版7.1.6版本概要

Cloudera于2021年3月宣布发布Cloudera Data Platform（CDP）私有云（PvC）基本版本7.1.6和Cloudera Manager版本7.3.1。这些版本引入了从HDP 3到CDP私有云基础版的直接升级路径，同时添加了许多增强功能以简化从CDH 5和HDP 2的升级和迁移路径，并汇总了先前版本中的所有先前维护增强功能。

腾讯云EMR&Elasticsearch中使用ES-Hadoop&云HDFS进行数据交换和备份

腾讯云EMR和ES是两款非常火热的大数据分析产品，长期以来一直是分别在客户场景下使用的，不过随着云上CHDFS产品的上线，以及ES-Hadoop等插件的完善，两者结合使用有了比较成熟的方案，下面就介绍一下相关使用的方式：

从 Hadoop 到云原生，大数据平台如何做存算分离

作者 | 苏锐策划 | Tina Hadoop 的诞生改变了企业对数据的存储、处理和分析的过程，加速了大数据的发展，受到广泛的应用，给整个行业带来了变革意义的改变；随着云计算时代的到来，存算分离的架构受到青睐，企业开开始对 Hadoop 的架构进行改造。今天与大家一起简单回顾 Hadoop 架构以及目前市面上不同的存算分离的架构方案，他们的利弊各有哪些，希望可以给正在存算分离架构改造的企业一些参考和启发。 Hadoop 存算耦合架构回顾 2006 年 Hadoop 刚发布，这是一个 all-i

腾讯云直播新年新定价！

随着新年的倒计时，2019年终于来临。过去的一年里，腾讯云直播不断地进行功能的迭代更新和技术的升级，竭力为客户提供更加优质、稳定、安全的直播服务。感谢过去一年云直播客户的支持和理解，在此腾讯云特意在新年伊始献上大礼：流量套餐优惠享不停 100GB套餐 1年有效期 24.6 元/年原价30元/年支持一场约100人在线的活动分享（约4h） 500GB套餐 1年有效期 118 元/年原价148元/年支持一场约500人在线的小型活动（约4h） 1TB套餐 1年有效期

区块链还可以这么玩？“点亮莫高窟”背后的腾讯云区块链

1分钟带你了解“点亮莫高窟”活动视频地址：http://mpvideo.qpic.cn/0bf2muaaiaaaemaix2a3rrqfazodarsqabaa.f10002.mp4? 疫情的反复，

元数据性能大比拼：HDFS vs OSS vs JuiceFS

存储是大数据的基石，存储系统的元数据又是它的核心大脑，元数据的性能对整个大数据平台的性能和扩展能力非常关键。本文选取了大数据平台中 3 个典型的存储方案来压测元数据的性能，来个大比拼。

腾讯云大数据技术介绍-云 HDFS

大数据虽然是一个比较宽泛的词，但对于我们来说其实可以简单理解为“海量数据的存储与处理”。之所以人们专门大数据这个课题，是因为海量数据的处理和较小量级数据的处理是不一样的，例如我们对一个mysql表中的数据进行查询，如果是100条数据，那对于mysql来说毫无压力，但如果是从十亿条数据里面定位到一条呢？情况就变得复杂了，换个角度想，十亿条数据是否适合存在mysql里也是尚待讨论的。实时上从功能角度的出发，我们完全可以使用以往的一些技术栈去处理这些问题，只不过高并发高可用高实时性这些都别想了。接下来要介绍的这些腾讯大数据组件就是在这一个问题背景下一个个诞生的。

012

使用 HDFS 协议访问对象存储服务

原生对象存储服务的索引是扁平化的组织形式，在传统文件语义下的 List 和 Rename 操作性能表现上存在短板。腾讯云对象存储服务 COS 通过元数据加速功能，为上层计算业务提供了等效于 HDFS 协议的操作接口和操作性能。

快手EB级HDFS挑战与实践

导读：作为快手内部数据规模和机器规模最大的分布式文件存储系统，HDFS一直伴随着快手业务的飞速发展而快速成长。

使用Apache Kudu和Impala实现存储分层

当为应用程序的数据选择一个存储系统时，我们通常会选择一个最适合我们业务场景的存储系统。对于快速更新和实时分析工作较多的场景，我们可能希望使用Apache Kudu，但是对于低成本的大规模可伸缩性场景，我们可能希望使用HDFS。因此，需要一种解决方案使我们能够利用多个存储系统的最佳特性。本文介绍了如何使用Apache Impala的滑动窗口模式，操作存储在Apache Kudu和Apache HDFS中的数据，使用此模式，我们可以以对用户透明的方式获得多个存储层的所有优点。

使用 HDFS 协议访问对象存储服务

背景介绍原生对象存储服务的索引是扁平化的组织形式，在传统文件语义下的 List 和 Rename 操作性能表现上存在短板。腾讯云对象存储服务 COS 通过元数据加速功能，为上层计算业务提供了等效于 HDFS 协议的操作接口和操作性能。（一）什么是元数据加速器？元数据加速功能是由腾讯云对象存储（Cloud Object Storage，COS）服务提供的高性能文件系统功能。元数据加速功能底层采用了云 HDFS 卓越的元数据管理功能，支持用户通过文件系统语义访问对象存储服务，系统设计指标可以达到2.4

HDFS知识点总结

HDFS是什么：HDFS即Hadoop分布式文件系统（Hadoop Distributed Filesystem），以流式数据访问模式来存储超大文件，运行于商用硬件集群上，是管理网络中跨多台计算机存储的文件系统。

HDFS HA原理与理解

我们了解HDFS的HA和Federation是从Hadoop1.0和Hadoop2.0的区别开始的。那么HA是代表什么？

HDFS集群缩容案例: Decommission DataNode

在HDFS集群运维过程中，常会碰到因为实际业务增长低于集群创建时的预估规模；集群数据迁出,数据节点冗余较多；费用控制等原因，需要对集群进行缩容操作。Decommission DataNode是该过程中关键的一步，就是把DataNode从集群中移除掉。那问题来了，HDFS在设计时就把诸如机器故障考虑进去了，能否直接把某台运行Datanode的机器关掉然后拔走呢？理论上可行的，不过在实际的集群中，如果某份数据只有一份副本而且它就在这个机器上，那么直接关掉并拔走机器就会造成数据丢失。本文将介绍如何Decommission DataNode以及可能会遇到Decommission超时案例及其解决方案。

云+精选喊你来领好礼啦

时间悄悄流逝，距离我们云+精选的发布也有一段时间啦，相信大家对于咱们这个新上线的产品都已经体验得差不多了，好礼也拿到了手软。但是嚯，这次咱们又给大家准备了大礼（咱们社区从来不差钱[doge]~）

0210

大数据不再是大数据，大数据依然是大数据--我的一篇严肃总结

由于各种原因，我似乎缺了一篇严肃的文章，来阐述我本人对大数据这个领域的看法，以至于有人看到我这篇文章里的这个观点，就扩展到了我认为的那个领域里的那个观点。我还是决定严肃的写一篇文章，阐述一下我个人的观点。这样一来，多少有据可查。

基于Hadoop的云盘系统客户端技术选型说明

伴随云计算技术的发展，云盘系统不断涌现，百度、360、金山等都推出了各自的云盘产品，而云盘存储的模式也越来越被用户所接受，也有越来越多的公司跃跃欲试，想在云存储领域大展拳脚，有一番作为。但是开源Hadoop平台实现语言Java和操作系统Linux的限制，Windows用户桌面版云盘客户端的开发成为了一道不可逾越的屏障。

腾讯云加速构建云原生数据仓库，助力企业数字化转型

在企业数字化转型的当下，数据仓库的云端构建成为主流趋势，Gartner 预测，到2023年全球3/4的数据库都会跑在云上。

新技术层出不穷，HDFS还是存储的王者吗？

Google大数据“三驾马车”的第一驾是GFS（Google 文件系统），而Hadoop的第一个产品是HDFS（Hadoop分布式文件系统），可以说分布式文件存储是分布式计算的基础，由此可见分布式文件存储的重要性。如果我们将大数据计算比作烹饪，那么数据就是食材，而Hadoop分布式文件系统HDFS就是烧菜的那口大锅。厨师来来往往，食材进进出出，各种菜肴层出不穷，而不变的则是那口大锅，大数据也是如此。这些年来，各种计算框架、各种算法、各种应用场景不断推陈出新，让人眼花缭乱，但是大数据存储的王者依然是HDF

存算分离下写性能提升10倍以上，EMR Spark引擎是如何做到的？

引言随着大数据技术架构的演进，存储与计算分离的架构能更好的满足用户对降低数据存储成本，按需调度计算资源的诉求，正在成为越来越多人的选择。相较 HDFS，数据存储在对象存储上可以节约存储成本，但与此同时，对象存储对海量文件的写性能也会差很多。腾讯云弹性 MapReduce(EMR) 是腾讯云的一个云端托管的弹性开源泛 Hadoop 服务，支持 Spark、Hbase、Presto、Flink、Druid 等大数据框架。近期，在支持一位 EMR 客户时，遇到典型的存储计算分离应用场景。客户使用了 EMR

TBDS大数据集群迁移实践总结

这次迁移算是TBDS集群的第一次完整迁移案例，包括用户的业务数据，平台应用，从项目启动到最后完成迁移差不多耗费了1个月的时间。

GooseFS 统一命名空间 | 加速存储业务访问

GooseFS是腾讯云存储团队推出的分布式缓存方案，主要针对需要缓存加速的数据湖业务场景，提供基于对象存储COS服务的近计算端数据加速层。

大数据科普文一篇

大数据是指其大小和复杂性无法通过现有常用的工具软件，以合理的成本，在可接受的时限内对其进行捕获、管理和处理的数据集。这些困难包括数据的收入、存储、搜索、共享、分析和可视化。大数据要满足三个基本特征（3V），数据量（volume）、数据多样性（variety）和高速（velocity）。数据量指大数据要处理的数据量一般达到TB甚至PB级别。数据多样性指处理的数据包括结构化数据、非结构化数据（视频、音频、网页）和半结构化数据（xml、html）。高速指大数据必须能够快速流入并且能得到快速处理。

CDP中的Hive3系列之保护Hive3

作为管理员，您需要了解运行 Hive 查询的 Hive 默认授权是不安全的，以及您需要做什么来保护您的数据。您需要了解您的安全选项：设置 Ranger 或基于存储的授权 (SBA)，它基于模拟和 HDFS 访问控制列表 (ACL)，或这些方法的组合。

GooseFS 统一命名空间 | 加速存储业务访问

GooseFS是腾讯云存储团队推出的分布式缓存方案，主要针对需要缓存加速的数据湖业务场景，提供基于对象存储COS服务的近计算端数据加速层。

Hortonworks正式发布HDP3.0

7月13日，Hortonworks在其官网宣布发布HDP3.0，包括Ambari2.7和SmartSense1.5。包括下载仓库与配套文档都正式GA。

环球易购数据平台如何做到既提速又省钱？

环球易购创建于 2007 年，致力于打造惠通全球的 B2C 跨境电商新零售生态，2014 年通过与百圆裤业并购完成上市，上市公司「跨境通（SZ002640）」是 A 股上市跨境电商第一股。经过多年的努力，在海外市场建立了广阔的销售网络，得到了美国、欧洲等多国客户的广泛认可，公司业务多年来一直保持着 100% 的增长速度。

云原生数据湖101

导语 | 云原生数据湖致力于扩大公有云市场总量：一方面以低成本优势推动客户上云，另一方面云上客户得以低成本撬动更多结构化和非结构化数据的价值，是一场云厂商的自我革命，本文将为大家洞悉云原生数据湖的神秘面纱，并且首次推出腾讯云的云原生数据湖产品。文章作者：于华丽，腾讯TEG数据平台部研发工程师。一、云上架构大数据平台的挑战和机遇选择 Cloud 还是 Local 的诸多讨论和实践中，成本一直是绕不开的话题。“公有云太贵了，一年机器就够托管三五年了”，这基本上是刚开始接触公有云的企业，在进行了详细价格

深度解析（二）：大快大数据智能分析平台的监控功能介绍

在上一篇的文章中已经明确说过DKM作为大快发行版DKhadoop的管理平台，它的四大功能分别是：管理功能，监控功能，诊断功能和集成功能。管理功能已经给大家列举了一些做了说明，今天就DKM平台的监控功能再给大家做细致的分享分析。

GooseFS助力大数据业务数倍提升计算能力

GooseFS是由腾讯云推出的一款分布式缓存方案，主要针对包括需要缓存加速的数据湖业务场景，提供基于对象存储COS服务的近计算端数据加速层。

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐