介绍
本实践中先使用鲲鹏性能定界工具KSYS快速定界问题,初步识别到DDRC读带宽处于异常高值,存在性能瓶颈,再使用系统性能分析工具Tuner的访存统计分析、Miss事件分析,发现应用中存在缓存命中率低的性能问题,结合源码进一步发现是内存数据大量复制导致。通过块处理的手段,提高缓存命中率,优化程序性能。
组网环境
本实践以CentOS 7.6为例,在鲲鹏平台其他操作系统上的操作类似。
调优思路
- 先使用鲲鹏性能定界工具定界,定位应用问题。
- 进一步使用系统性能分析工具对应用进行访存统计分析、Miss事件分析,发现内存DDRC读带宽异常高值问题,对问题进行详细分析后,优化源码文件并验证优化后的效果。
父主题: 实践1:访存统计分析