前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >大数据入门,什么是分布式系统?

大数据入门,什么是分布式系统?

作者头像
加米谷大数据
发布2020-03-10 11:11:25
9790
发布2020-03-10 11:11:25
举报
文章被收录于专栏:加米谷大数据

简介

分布式系统(Distributed System)是由集中式系统演化来的,先来看下传统的集中式系统:

就是把所有的程序、功能都集中到一台主机上,从而往外提供服务的单体应用。集中式系统的优点是便于维护、操作简单。

但这样的系统也有缺陷,不出问题还好,一出问题,就容易造成单点故障,所有功能就都不能正常工作了。另外,集中式系统的性能瓶颈就是单机性能的上限,横向扩展比较困难。为了解决集中式系统存在的缺陷问题,分布式系统诞生并逐渐演化。

定义

关于分布式系统的定义有很多,这里引用《分布式系统原理和范型》中的定义:

分布式系统是若干独立计算机的集合,这些计算机对于用户来说就像是单个相关系统。

说的直白点,分布式系统就是一组通过网络进行通信、为了完成共同任务而协调工作的计算机节点(Node)组成的系统。系统中的各个节点对于用户是透明的,用户感知不到背后的逻辑,就像访问单个计算机一样。

目标

分布式系统的目标就是要解决集中式系统的各种缺陷,实现整个系统的高性能、高可用、可扩展。

大数据里常见的分布式系统

HDFS是分布式文件系统的其中一种(目前用得最广泛的一种),在使用HDFS的时候是非常简单的:虽然HDFS是将文件存储到不同的机器上,但是我去使用的时候是把这些文件当做,是存储在一台机器的方式去使用(背后却是多台机器在执行)。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-03-06,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 加米谷大数据 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
大数据
全栈大数据产品,面向海量数据场景,帮助您 “智理无数,心中有数”!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档