kml_fft(f)_mpi_local_size_2d_transposed
描述了本地进程数据的大小和位置,以及计算需要分配的空间。
接口定义
C interface:
ptrdiff_t kml_fft_mpi_local_size_2d_transposed(ptrdiff_t n0, ptrdiff_t n1, MPI_Comm comm, ptrdiff_t *local_n0, ptrdiff_t *local_0_start, ptrdiff_t *local_n1, ptrdiff_t *local_1_start);
ptrdiff_t kml_fftf_mpi_local_size_2d_transposed(ptrdiff_t n0, ptrdiff_t n1, MPI_Comm comm, ptrdiff_t *local_n0, ptrdiff_t *local_0_start, ptrdiff_t *local_n1, ptrdiff_t *local_1_start);
ptrdiff_t kml_ffth_mpi_local_size_2d_transposed(ptrdiff_t n0, ptrdiff_t n1, MPI_Comm comm, ptrdiff_t *local_n0, ptrdiff_t *local_0_start, ptrdiff_t *local_n1, ptrdiff_t *local_1_start);
返回值
函数返回一个ptrdiff_t类型的值,表示要分配的元素的数量。
参数
参数名 |
数据类型 |
描述 |
输入/输出 |
|---|---|---|---|
n0 |
|
待处理数据第1维度大小,约束:n0 ≥ 1。 |
输入 |
n1 |
|
待处理数据第1维度大小,约束:n1 ≥ 1。 |
输入 |
comm |
|
MPI通信器的句柄。 |
输入 |
local_n0 |
|
本地进程数据大小。 |
输出 |
local_0_start |
|
本地进程数据相对全局数据起点偏移量。 |
输出 |
local_n1 |
|
本地进程输出数据大小。 |
输出 |
local_1_start |
|
本地进程输出数据相对全局数据起点偏移量。 |
输出 |
依赖
C: "kfft-mpi.h"
示例
const ptrdiff_t N0 = 4, N1 = 4;
kml_fft_plan plan;
ptrdiff_t alloc_local, local_n0, local_0_start, local_n1, local_1_start;
MPI_Init(&argc, &argv);
MPI_Comm comm = MPI_COMM_WORLD;
kml_fft_mpi_init();
double *in = NULL;
double *out = NULL;
/* get local data size and allocate */
alloc_local = kml_fft_mpi_local_size_2d_transposed(N0, N1, comm, &local_n0, &local_0_start,
&local_n1, &local_1_start);
if (alloc_local == -1) {
printf("[%s][%d] allocate size fail!!!\n", __func__, __LINE__);
}
in = (double *)kml_fft_malloc(sizeof(double) * alloc_local * 2);
if (in == NULL) {
printf("[%s][%d] malloc memory fail!!!\n", __func__, __LINE__);
}
out = (double *)kml_fft_malloc(sizeof(double) * alloc_local * 2);
if (out == NULL) {
printf("[%s][%d] malloc memory fail!!!\n", __func__, __LINE__);
}
/* create plan for in-place forward DFT */
plan = kml_fft_mpi_plan_transpose(N0, N1, in, out, comm, KML_FFT_ESTIMATE);
/* compute transforms, in-place, as many times as desired */
kml_fft_execute(plan);
kml_fft_destroy_plan(plan);
kml_fft_mpi_cleanup();
MPI_Finalize();