鲲鹏社区首页
中文
注册
我要评分
文档获取效率
文档正确性
内容完整性
文档易理解
在线提单
论坛求助

其他调优

1
2
3
4
5
6
7
echo cfq > /sys/block/sd$i/queue/scheduler
echo 512 > /sys/block/sd$i/queue/nr_requests
echo 8192 > /sys/block/sd$i/queue/read_ahead_kb
echo 4 > /sys/block/sd$i/queue/iosched/slice_idle
echo 0 > /sys/module/scsi_mod/parameters/use_blk_mq
echo 500 > /proc/sys/vm/dirty_expire_centisecs
echo 100 > /proc/sys/vm/dirty_writeback_centisecs
  • 该场景下采用3-5倍总核数作为数据分片的Partitions和Parallelism进行数据分片,减小单Task文件大小,对性能有正面提升。可以使用以下分片设置:
    1
    2
    spark.sql.shuffle.partitions 1000
    spark.default.parallelism 2000
    
  • HiBench在配置文件中指定的运行核数、内存大小可以根据实际环境来做调整,来达到最优性能。比如对于鲲鹏920 5220处理器,Terasort场景建议以下Executor参数:
    1
    2
    3
    4
    yarn.executor.num 27
    yarn.executor.cores 7
    spark.executor.memory 25G
    spark.driver.memory 36G