首頁技術(shù)文章正文

HBase數(shù)據(jù)庫物理存儲的存儲方式介紹【大數(shù)據(jù)文章】

更新時(shí)間:2020-12-17 來源:黑馬程序員 瀏覽量:

1577370495235_學(xué)IT就到黑馬程序員.gif

  HBase分布式數(shù)據(jù)庫最重要的就是存儲數(shù)據(jù),下面,從四個(gè)方面詳細(xì)介紹HBase的物理存儲。

  1.HBase表的數(shù)據(jù)按照行鍵RowKey的字典序進(jìn)行排列,并且切分多個(gè)HRegion存儲,存儲方式如圖1所示。

1608171682637_1.jpg

   圖1 Region在行方向上的存儲

  2.每個(gè)Region存儲的數(shù)據(jù)是有限的,如果當(dāng)Region增大到一個(gè)閥值(128)時(shí),會被等分切成兩個(gè)新的Region,切分方式如圖2所示。

1608171690578_2.jpg

   圖2 HRegion的切分

  3.一個(gè)HRegion Server上可以存儲多個(gè)Region,但是每個(gè)Region只能被分布到一個(gè)HRegion Server上,分布方式如圖3所示。

1608171699111_3.jpg

  圖3 HRegion的分布

  4.MemStore中存儲的是用戶寫入的數(shù)據(jù),一旦MemStore存儲達(dá)到閾值時(shí),里面存儲的數(shù)據(jù)就會被刷新到新生成的StoreFile中(底層是HFile),該文件是以HFile的格式存儲到HDFS上,具體如圖4所示。

1608171707892_4.jpg

   圖4 HBase表的存儲



猜你喜歡:

Linux系統(tǒng)如何配置虛擬機(jī)網(wǎng)絡(luò)?

HDFS分布式文件系統(tǒng)的優(yōu)點(diǎn)缺點(diǎn)有哪些?

黑馬程序員大數(shù)據(jù)培訓(xùn)課程 

分享到:
在線咨詢 我要報(bào)名
和我們在線交談!