HBase 深入浅出

- HBase Database

1. HBase 核心组件源码深度解析

1.1 HMaster

源码路径org.apache.hadoop.hbase.master.HMaster

源码关键点

面试题

1.2 RegionServer

源码路径org.apache.hadoop.hbase.regionserver.HRegionServer

源码关键点

面试题

1.3 Region

源码路径org.apache.hadoop.hbase.regionserver.HRegion

源码关键点:

面试题

1.4 WAL(Write Ahead log)

源码路径org.apache.hadoop.hbase.wal.WAL

源码关键点

面试题

2. HBase 读写流程源码深度解析

2.1 写流程

  1. 客户端向 RegionServer 发送写请求
  2. RegionServer 将数据写入 WAL(Write Ahead Log)
  3. 数据写入 MemStore
  4. 当 MemStore 达到一定大小时,数据刷写到 HFile

源码关键点

面试题:

2.2 读流程

  1. 客户端向 RegionServer 发送请求
  2. RegionServer 首先从 BlockCache 中查找数据
  3. 如果 BlockCache 未命中,则从 MemStore 和 HFile 中读取数据
  4. 返回查询结果

源码关键点

面试题:

3. HBase 高级特性源码深度解析

3.1 协处理器(Coprocessor)

源码路径org.apache.hadoop.hbase.coprocessor

源码关键点

面试题

3.2 数据压缩与编码

源码路径org.apache.hadoop.hbase.io.compressorg.apache.hadoop.hbase.io.encoding

源码关键点

面试题