首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    从入门到实战Hadoop分布式文件系统

    当数据集的大小超过一台独立物理计算机的存储能力时,就有必要对它进行分区并存储到若干台独立的计算机上。管理网络中跨多台计算机存储的文件系统成为分布式文件系统。该系统架构与网络之上,势必会引入网络编程的复杂性,因此分布式文件系统比普通磁盘文件系统更为复杂。例如,使文件系统能够容忍节点故障且不丢失任何数据,就是一个极大的挑战。   Hadoop有一个成为HDFS的分布式系统,全程为hadoop distrubuted filesystem.在非正式文档中,有时也成为DFS,它们是一会儿事儿。HDFS是Hadoop的旗舰级文件系统,同事也是重点,但事件上hadoop是一个综合性的文件系统抽象。   **HDFS的设计**   HDFS以[流式数据访问模式](http://www.zhihu.com/question/30083497)来存储超大文件,运行于商用硬件集群上。关于超大文件:   一个形象的认识:   荷兰银行的20个数据中心有大约7PB磁盘和超过20PB的磁带存储,而且每年50%~70%存储量的增长,当前1T容量硬盘重约500克,计算一下27PB大约为 27648个1T容量硬盘的大小,即2万7千斤,约270个人重,上电梯要分18次运输(每次15人)。  1Byte = 8 Bit  1 KB = 1,024 Bytes   1 MB = 1,024 KB    1 GB = 1,024 MB  1 TB = 1,024 GB   **1 PB = 1,024 TB**   **1 EB = 1,024 PB**   **1 ZB = 1,024 EB**   **1 YB = 1,024 ZB** = 1,208,925,819,614,629,174,706,176 Bytes

    04

    08.构建根文件系统

    终于自动挂载文件系统成功了!!!出错的地方两个!!!   第一,恢复出厂设置一定要用eop下载uboot,dnw下载的不行!!!最后记得erase nand params!!   第二,set bootargs noinitrd root=/dev/nfs nfsroot=202.193.61.195:/work/nfs_root/first_fs ip=202.193.61.196:202.193.61.195:202.193.61.1:255.255.255.0::eth0:off init=/linuxrc console=ttySAC0 参数解读:  nfsroot=202.193.61.195: ubuntu ip地址  /work/nfs_root/first_fs要挂载的目录  ip=202.193.61.196: 单板ip(恢复出厂设置后记得先配置ip,手动挂载下能不能成功,可以成功的话再修改bootargs自动挂载!)  202.193.61.195: 依然是ubuntu ip !!!!!注意!!!  202.193.61.1: 网关,只要处于同一网段就好。  255.255.255.0:: 子网掩码  eth0: 网卡,一般都是0  off 是否自动配置 off就可以

    01
    领券