文档首页评分提单论坛小智 NVC/NVC++/NVFORTRAN编译参数优化 NVC/NVC++/NVFORTRAN编译参数如表1所示,可在编译时添加。 表1 NVC/NVC++/NVFORTRAN编译参数 编译选项 优化原理 -Mcache_align cache字节对齐。 -Mfpapprox 使用低精度行为执行除、平方根等操作。 -Mautoinline 配置自动化内联的参数。 -Minline 让多次调用的简单函数内联化。 -Mipa 进行过程分析优化。 -Munroll 循环展开。 -fast 使能向量化、cache对齐、FTZ等内容。 -gpu=fastmath 指定GPU选项使用快速数学库。 -gpu=flushz 指定GPU选项打开FTZ。 -O 0 1 2 3 4 代码优化级别,建议O4。 父主题: GPU编译参数优化 搜索结果找到“0”个结果当前产品无相关内容未找到相关内容,请尝试其他搜索词