鲲鹏社区首页
中文
注册
开发者
我要评分
获取效率
正确性
完整性
易理解
在线提单
论坛求助

数据压紧

概述

在Ceph系统中,数据块落盘按照4KB大小对齐。如果输入的数据块不为4KB,则剩余的部分按照补零处理,这样就浪费了存储空间,尤其是在HDD/SSD混合型存储场景,压缩按照64KB对齐,在数据压缩后,不对齐的部分空间浪费更大。数据压紧特性是将不同的数据块按照字节级压紧,按照4KB落盘,减少空间的浪费。

技术原理

数据压紧特性通过对数据块不对齐的部分压紧处理,使存储空间更加紧凑,达到节省空间的目的。在压缩场景因为压缩后的数据块基本都是不对齐的,通过压紧功能可以很好的达到节省空间、提高压缩率的目的。

图1 数据压紧流程

预期效果

压缩率提升20%以上,同时保证数据落盘性能不降低。