HDFS冷存场景性能已经达到磁盘带宽上限,因此通过压缩特性以进一步提升带宽。
调整Hadoop自带的TestDFSIO工具生成测试文件的逻辑,TestDFSIO会在DataNode本地生成指定大小的规律的测试文件,这种按照特定规律生成的文件拥有很大的压缩率,会影响压缩测试的结果。需要对其进行修改,以达成下方目的。
cd ..\hadoop-3.1.0-src\
patch -p1 < hdfs-testdfsio-0001.patch
mkdir -p ../hadoop/testFiles
mv target_file ../hadoop/testFiles cd ../hadoop/testFiles ln -s target_file test_io_file
/usr/local/hadoop/sbin/stop-all.sh /usr/local/hadoop/sbin/start-all.sh hdfs dfsadmin -safemode leave