我要评分文档获取效率文档正确性内容完整性文档易理解0/200提交在线提单论坛求助 NVC/NVC++/NVFORTRAN编译参数优化 NVC/NVC++/NVFORTRAN编译参数如表1所示,可在编译时添加。 表1 NVC/NVC++/NVFORTRAN编译参数编译选项 优化原理 -Mcache_align cache字节对齐。 -Mfpapprox 使用低精度行为执行除、平方根等操作。 -Mautoinline 配置自动化内联的参数。 -Minline 让多次调用的简单函数内联化。 -Mipa 进行过程分析优化。 -Munroll 循环展开。 -fast 使能向量化、cache对齐、FTZ等内容。 -gpu=fastmath 指定GPU选项使用快速数学库。 -gpu=flushz 指定GPU选项打开FTZ。 -O 0 1 2 3 4 代码优化级别,建议O4。 父主题: GPU编译参数优化