這篇文章給大家分享的是有關HBase中的基本概念是什么的內容。小編覺得挺實用的,因此分享給大家做個參考,一起跟隨小編過來看看吧。
HBase是Google Bigtable的開源實現。HBase是一個開源的、分布式的、多版本的、面向列的存儲模型。HBase利用HDFS作為其文件系統(或本地),還可以通過MapReduce計算模型來并行處理大數據。
HBase中的基本概念:
Row Key
1) Row key是檢索記錄的主鍵。
2) Row key行鍵 (Row key)可以是任意字符串(長度是 64KB,實際應用中長度一般為 10-100bytes),在hbase內部,row key保存為字節數組。
3) 數據按照Row key的字典序(byte order)排序存儲。設計key時,要充分排序存儲這個特性,將經常一起讀取的行存儲放到一起。(位置相關性)
4) 行的讀寫是原子操作。
Column family (列族)
1) HBase表中的每個列都屬于某個列族,列族必須作為表模式(schema)定義的一部分預先給出,必須在使用表之前定義。列名都是以列族作為前綴,中間以冒號(:)隔開,如:courses:math。
2) 訪問控制、磁盤和內存的使用統計都是在列族層面進行的。實際應用中,列族上的控制權限能幫助我們管理不同類型的應用:我們允許一些應用可以添加新的基本數據、一些應用可以讀取基本數據并創建繼承的列族、一些應用則只允許瀏覽數據(甚至可能因為隱私的原因不能瀏覽所有數據)。
Cell (存儲單元)
由{row key, column(=<family> + <label>), version}唯一確定的單元。cell中的數據是沒有類型的,全部是字節碼形式存貯。
Timestamp(時間戳)
1) 每個cell都保存著同一個數據的多個版本,版本通過時間戳來索引。
2) 時間戳為64位整型。
3) 可以自動賦值(當前系統時間),也可以用戶自己指定。
4) 不同版本數據按照時間戳倒序排。
5) HBase提供了兩種數據版本回收機制:a. 保存數據最后n個版本;b. 保存最近一段時間內的版本。用戶可以針對每個列族去設置。
感謝各位的閱讀!關于“HBase中的基本概念是什么”這篇文章就分享到這里了,希望以上內容可以對大家有一定的幫助,讓大家可以學到更多知識,如果覺得文章不錯,可以把它分享出去讓更多的人看到吧!
新聞名稱:HBase中的基本概念是什么
URL地址:http://m.kartarina.com/article0/cpcjoo.html
成都網站建設公司_創新互聯,為您提供網站營銷、商城網站、自適應網站、小程序開發、建站公司、網站策劃
聲明:本網站發布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創新互聯