矩阵化检查用于对可矩阵化片段进行检查,并提供矩阵化修改建议。
矩阵化检查工具包含Stencil、GEMV和FFT三个技术点的检查与优化。工具支持C/C++/Fortran源码的检查与优化,检查流程在AST(抽象语法树Abstract Syntax Tree的缩写)上进行。其中,C/C++源码使用Clang进行AST的生成,Fortran源码使用Fparser进行AST的生成,优化流程则与各计算模式强相关。三个技术点简介如下:
快速傅里叶变换优化的技术点是基于FFTW(Fastest Fourier Transform in the West)加速库实现优化的,在扫描中需要在待识别文件所在目录下添加对应的FFTW加速库头文件(fftw3.h、fftw3-mpi.h),这样才能够有对应优化建议结果。
C/C++支持以下10种领域优化技术,具体如表1所示。
领域优化技术 |
描述 |
---|---|
数学恒等变换 |
通过乘方展开的方式,替换为乘法运算使能向量化。 |
精度一致除转乘 |
外提计算倒数,将除法转为同精度的乘法计算。 |
通信隐藏优化 |
识别到代码中阻塞性通信函数调用前后,与通信变量无关的代码片段,提示将该无关片段移至函数后,并将阻塞性通信函数修改为非阻塞性通信函数,以提高代码并行性。 |
截断半径判断消除 |
将循环中依赖于循环变量的条件分支语句替换为条件表达式,从而消减分支预测失败带来的惩罚。 |
迭代算查拆分 |
针对循环中的条件分支语句,在代码结构复杂时,难以直接使用截断半径判断消除进行优化的代码,给出一个将循环结构按照条件分支进行拆分的优化建议示例代码。 |
粒子作用力迭代流程优化 |
针对循环中的条件分支语句,引入临时数组保存条件分支成立的结果,将原循环改写成两个,并将条件判断移至前一个循环改写成三目条件运算,后一个循环基于临时数组中存放的结果继续处理。 |
分子间作用力迭代展开 |
识别典型的分子间作用力核函数计算,对循环迭代进行展开,提高指令并行度。 |
定长循环完全展开 |
对上下界确定的最内层循环,自动添加编译制导语句进行循环完全展开,节省循环分支开销。 |
邻接表聚合 |
将处于同一计算阈值范围内的粒子聚合在同一分组,进而可对同一分组的粒子采用同种计算方式,消除计算前对粒子距离的判断。 |
邻接粒子作用力计算向量化 |
通过移动、拷贝或定义临时数组操作对循环内的代码进行重写,并对向量化循环添加制导语句,指导编译器实现向量化。 |
Fortran支持以下12种领域优化技术,具体如表2所示。
领域优化技术 |
描述 |
---|---|
数学恒等变换 |
通过乘方展开的方式,替换为乘法运算使能向量化。 |
消除冗余公共算子 |
提取公共子序列,通过临时数组存储该公共计算,实现跨Block的公共子序列提取,消除冗余计算。 |
单位阶跃计算优化 |
将循环中的判断及赋值语句中的sign函数,转为阶跃函数(max/min/merge)调用,使能向量化 。 |
精度一致除转乘 |
外提计算倒数,将除法转为同精度的乘法计算。 |
查找算法领域优化 |
识别出代码中实现查找功能的代码,替换为二分查找算法,提高查找算法性能。 |
超大数据降维优化 |
检查代码中定义n维的数组,但只使用了m(m<n)维数组,此时存在访存优化机会重新定义为m维数组 。 |
通信隐藏优化 |
识别到代码中阻塞性通信函数调用前后,与通信变量无关的代码片段,提示将该无关片段移至函数后,并将阻塞性通信函数修改为非阻塞性通信函数,以提高代码并行性。 |
归约计算并行化 |
当循环内存在归约计算时,通过循环展开,减少变量对自身依赖,增加并行度。 |
制导语句优化 |
通过制导语句,指导编译器实现向量化和预取优化。 |
sin/cos算子融合 |
通过合并sin/cos计算,减少函数调用,实现性能加速。 |
exp计算化简 |
将多个exp函数的乘法计算替换为单个exp函数内的加法计算,减少对exp函数的调用,进而减少计算量,实现性能加速。 |
循环合并 |
通过合并相邻循环,减少循环开销,提高数据局部性,实现性能加速。 |
参数 |
说明 |
---|---|
任务名称 |
矩阵化检查任务名称,工具默认会自动生成任务名称,也可根据实际情况进行自定义修改。 |
源码文件存放路径 |
|
扫描文件或文件夹 |
指定需扫描的文件或文件夹。 支持树形结构路径选择,可通过树形结构选择所需扫描的文件或文件夹。 |
优化方法 |
选择优化方法。可选择:
|
编译选项 |
选择编译方式。可选择:
|
构建工具 |
选择构建工具。可选择:
|
参数 |
说明 |
---|---|
源码文件统计 |
|
需修改文件数 |
源码文件路径下扫描出需要修改的文件总数。 |
需修改代码行 |
需要修改的代码行数。 |
建议项总数 |
建议修改的项目总数。为了更好更快地在鲲鹏平台上运行程序,我们建议您按照建议项进行修改。 |
需修改的源码文件 |
显示需要修改的源码文件和建议项数量,通过单击操作列“查看建议源码”可以快速进入对应的源码文件建议页面。 |