相关概念
Louds Tries
Louds Tries是一种基于Succinct Data Structure的trie树,对该树进行合理的编码,从而降低占用内存的大小,同时保留查询能力,既支持point query,也支持range query。这种方式是基于LOUDS(Level-Ordered Unary Degree Sequence)提出来的。
HBase
HBase是一个分布式的、面向列的开源数据库,该技术来源于Fay Chang所撰写的Google论文“Bigtable:一个结构化数据的分布式存储系统。”就像Bigtable利用了Google文件系统(File System)所提供的分布式数据存储一样,HBase在Hadoop之上提供了类似于Bigtable的能力。HBase是Apache的Hadoop项目的子项目。HBase不同于一般的关系数据库,它是一个适合于非结构化数据存储的数据库。另一个不同的是HBase基于列的而不是基于行的模式。
HFile
HFile是HBase中重要的一个存在,可以说是HBase架构中最小的结构,HBase的数据都在HFile中。HFile就是表的物理存储形式。HFile中的数据是按键值对形式存储的。
Lru Cache
Lru Cache采用的缓存算法为LRU(Least Recently Used),LRU缓存翻译成中文的通用说法是“近期最少使用算法”。其核心机制是当缓存满或者超过设置的最大值时,优先删除掉近期最少使用的缓存对象。
LEAF Index
HFile里面所有的数据存放在DataBlock里,由于DataBlock数量太多,为了加速检索效率,HFile使用多级Index检索方式实现检索加速。其中Leaf Index的作用如下图所示。
父主题: 产品描述