NVC/NVC++/NVFORTRAN编译参数如表1所示,可在编译时添加。
表1 NVC/NVC++/NVFORTRAN编译参数编译选项
|
优化原理
|
-Mcache_align
|
cache字节对齐。
|
-Mfpapprox
|
使用低精度行为执行除、平方根等操作。
|
-Mautoinline
|
配置自动化内联的参数。
|
-Minline
|
让多次调用的简单函数内联化。
|
-Mipa
|
进行过程分析优化。
|
-Munroll
|
循环展开。
|
-fast
|
使能向量化、cache对齐、FTZ等内容。
|
-gpu=fastmath
|
指定GPU选项使用快速数学库。
|
-gpu=flushz
|
指定GPU选项打开FTZ。
|
-O 0 1 2 3 4
|
代码优化级别,建议O4。
|