矩阵化检查

矩阵化检查用于对可矩阵化片段进行检查,并提供矩阵化修改建议。

简介

矩阵化检查工具包含Stencil、GEMV和FFT三个技术点的检查与优化。工具支持C/C++/Fortran源码的检查与优化,检查流程在AST(抽象语法树Abstract Syntax Tree的缩写)上进行。其中,C/C++源码使用Clang进行AST的生成,Fortran源码使用Fparser进行AST的生成,优化流程则与各计算模式强相关。三个技术点简介如下:

C/C++/Fortran支持以下12种领域优化技术,其中C/C++支持数学恒等变换、精度一致除转乘、通信隐藏优化,Fortran全部支持,具体如下:

前提条件

已成功登录鲲鹏DevKit。
  • “/opt”为工具默认安装目录,下文以此默认路径为例,请根据实际情况替换。
  • 当前特性在Web界面中需要手动上传文件或压缩包;在插件工具中支持扫描本地工程,若源码为压缩包格式,请先解压然后选择解压后文件夹。

操作步骤

  1. 在页面左侧,“亲和分析”下拉选项中选择“矩阵化检查”,单击创建任务,如图1所示。

    图1 矩阵化检查
    表1 矩阵化检查参数说明

    参数

    说明

    任务名称

    矩阵化检查任务名称,工具默认会自动生成任务名称,也可根据实际情况进行自定义修改。

    源码文件存放路径

    • 选择“已上传的源码”:单击填写框选择下拉框中的源码路径即可,也可以手动填写源码路径。
    • 选择“上传源码”:单击“上传”按钮上传压缩包(上传过程中自动解压)或文件夹。
    说明:
    • 支持上传tar,tar.bz,tar.bz2,tar.gz,tar.xz,tbz,tbz2,tgz,txz,zip格式的压缩包,只允许同时上传一个压缩包。源码文件压缩包小于或等于1GB,解压后小于或等于剩余磁盘空间的一半。
    • 只允许同时上传一个文件夹,文件夹小于或等于剩余磁盘空间的一半。
    • 手动上传软件包时,需先检查是否存在上传目录,若不存在,则需创建工具指定路径,并给devkit用户开通读写和执行权限。

    扫描文件或文件夹

    指定需扫描的文件或文件夹。

    支持树形结构路径选择,可通过树形结构选择所需扫描的文件或文件夹。

    优化方法

    选择优化方法。可选择:

    • SME矩阵化
      • Stencil
      • GEMV
      • FFT
    • 领域优化
      • 计算优化:包括数学恒等变换、消除冗余公共算子、单位阶跃计算优化、精度一致除转乘、查找算法领域优化、归约计算并行化、制导语句优化、sin/cos算子融合、exp计算化简和循环合并。
      • 访存优化:超大数据降维优化。
      • 通讯优化:通信隐藏优化。

    编译选项

    选择编译方式。可选择:

    • 填写编译命令
    • 上传compile_commands.json。关于如何上传json文件请参见生成json文件

    构建工具

    选择构建工具。可选择:

    • make
    • cmake

  2. 单击“开始检查”,开始矩阵化检查。检查完成后,自动跳转至检查报告界面。如图2所示。单击顶部的“任务信息”进入任务信息页面可查看任务的详细信息。

    图2 矩阵化检查报告

  1. 若检查结果中存在需要修改的源码文件,则可单击“查看建议源码”进入源码修改建议页面,如图3所示。

    图3 源码修改建议
    • 支持多个用户同时创建矩阵化检查任务。
    • 用户可在任务进行过程中单击关闭,取消任务。
    • 用户可以单击原始源代码模块右上角的上下键,进行上下切换。
    • 检查失败或检查结果为无需修改时,会产生空白报告。