腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
木东居士的专栏
专栏成员
举报
222
文章
424482
阅读量
178
订阅数
订阅专栏
申请加入专栏
全部文章(222)
大数据(60)
编程算法(49)
数据分析(45)
机器学习(38)
神经网络(30)
深度学习(25)
sql(24)
人工智能(21)
数据挖掘(15)
数据可视化(15)
java(14)
数据库(14)
https(13)
其他(12)
网络安全(12)
数据处理(11)
python(10)
决策树(8)
spark(7)
hive(7)
数据结构(7)
hadoop(5)
api(4)
企业(4)
数据安全(4)
存储(4)
开源(4)
线性回归(4)
微服务(4)
html(3)
腾讯云开发者社区(3)
数据湖(3)
app(3)
费用中心(2)
官方文档(2)
oracle(2)
mapreduce(2)
电商(2)
游戏(2)
爬虫(2)
推荐系统(2)
特征工程(2)
报表(2)
产品(2)
产品经理(2)
设计(2)
事件(2)
数据仓库(2)
node.js(1)
jquery(1)
json(1)
单片机(1)
云数据库 SQL Server(1)
nosql(1)
git(1)
github(1)
搜索引擎(1)
apache(1)
命令行工具(1)
TDSQL MySQL 版(1)
检测工具(1)
知识图谱(1)
腾讯云测试服务(1)
金融风控(1)
http(1)
分布式(1)
自动化(1)
缓存(1)
运维(1)
正则表达式(1)
erp(1)
面向对象编程(1)
jdbc(1)
监督学习(1)
scrapy(1)
dubbo(1)
scikit-learn(1)
windows(1)
系统架构(1)
hbase(1)
云计算(1)
flink(1)
腾讯云图数据可视化(1)
数据集成(1)
bi(1)
bitmap(1)
el(1)
event(1)
excel(1)
find(1)
model(1)
pmp(1)
publish(1)
text(1)
管理(1)
开发(1)
优化(1)
搜索文章
搜索
搜索
关闭
如何评价数据模型的好坏?
java
hadoop
最常见提到的有四种:范式、维度、DataVault、Anchor。在传统行业中,范式很流行,在互联网行业中,维度很流行,另外两种就“只闻其名,不见其人”了。
木东居士
2020-08-19
2.1K
0
MapReduce 编程模型极简篇
mapreduce
hive
hadoop
0x00 前言 回想自己最初学 Hadoop 的时候,初衷是写MapReduce程序,但是搭建单机环境折腾一周,搭建分布式环境折腾一周,跑个Demo解决一下Bug又一周过去了。最后都忘了自己是想学 MapReduce 的。 感觉自己虽然是搞Hadoop的,但是写MR比自己想的要少很多。初期是花了很多精力在安装以及集群的各种日常维护,熟悉Hive后就经常用Hive来解决问题,然后逐渐地各种任务过度到了Spark上,因此对MapReduce的重视就少了很多。 细想起来,MapReduce本身是很简洁易学的,因此
木东居士
2018-05-25
685
0
聊一聊数据倾斜那些坑
spark
大数据
hadoop
hive
sql
0x00 前言 数据倾斜是大数据领域绕不开的拦路虎,当你所需处理的数据量到达了上亿甚至是千亿条的时候,数据倾斜将是横在你面前一道巨大的坎。 迈的过去,将会海阔天空!迈不过去,就要做好准备:很可能有几周甚至几月都要头疼于数据倾斜导致的各类诡异的问题。 文章结构 先大致解释一下什么是数据倾斜 再根据几个场景来描述一下数据倾斜产生的情况 详细分析一下在Hadoop和Spark中产生数据倾斜的原因 如何解决(优化)数据倾斜问题? 0x01 什么是数据倾斜 简单的讲,数据倾斜就是我们在计算数据的时候,数据的
木东居士
2018-05-25
1.1K
0
用MPI进行分布式内存编程(入门篇)
分布式
hadoop
spark
0x00 前言 本篇是MPI的入门教程,主要是为了简单地了解MPI的设计和基本用法,方便和现在的Hadoop、Spark做对比,并尝试理解它们之间在设计上有什么区别。 身处Hadoop、Spark这些优秀的分布式开发框架蓬勃发展的今天,老的分布式编程模型是否没有必要学习?这个很难回答,但是我更倾向于花一个下午的时候来学习和了解它。 关于并发和并行编程系列的文章请参考文章集合 文章结构 举个最简单的例子,通过这个例子让大家对MPI有一个基本的理解。 解释一些和MPI相关的概念。 列举一些MPI的常用函数
木东居士
2018-05-25
4K
0
Hadoop之父Doug Cutting在清华的讲座记录
hadoop
大数据
0x00 前言 2014年,Hadoop之父Doug Cutting在清华开了一次讲座,当时三个小伙伴一起翘班骑自行车到现场听了这场讲座,很认真地做了笔记。 现在翻出来回顾一下感觉还是有不少感触的,稍加整理分享出来。 0x01 讲座记录 整个讲座约一个小时,两点半左右开始,前半个小时左右Doug Cutting 总共大概7张PPT,后半个小时互动。 Doug Cutting总共讲了大概7张PPT,每张PPT只有一个标题,正文是一张图片,内容主要讲的是自己的开源事业、Lucene、Hadoop等。 PPT O
木东居士
2018-05-25
671
0
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
立即查看
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档