當前位置:秀美範 >

生活 >經驗 >

hadoop是做什麼的 hadoop的資料

hadoop是做什麼的 hadoop的資料

hadoop是做什麼的 hadoop的資料

1、Hadoop主要是分佈式計算和存儲的框架,所以Hadoop工作過程主要依賴於HDFS(Hadoop Distributed File System)分佈式存儲系統和Mapreduce分佈式計算框架。

2、分佈式存儲系統HDFS中工作主要是一個主節點namenode(master)(hadoop1.x只要一個namenode節點,2.x中可以有多個節點)和若干個從節點Datanode(數據節點)相互配合進行工作。

3、HDFS主要是存儲Hadoop中的大量的數據,namenode節點主要負責的是:接收client用户的操作請求,這種用户主要指的是開發工程師的Java代碼或者是命令客户端操作。維護文件系統的目錄結構,主要就是大量數據的關係以及位置信息等。管理文件系統與block的關係。

4、Hadoop中大量的數據為了方便存儲和管理主要是以block塊(64M)的形式儲存。一個文件被分成大量的block塊存儲之後,block塊之間都是有順序關係的,這個文件與block之間的關係以及block屬於哪個datanode都是有namenode來管理。

標籤: hadoop
  • 文章版權屬於文章作者所有,轉載請註明 https://xiumeifan.com/shenghuo/jingyan/7w6ng3.html