MaCh3/gpuMCMCProcessorUtils_8cuh_source.html

 #pragma once

 // MaCh3 utils for processing/diagnostic MCMC

 // Written by Kamil Skwarczynski

 //

 // Contains code to run on CUDA GPUs. Right now only can calculate autocorrelations

 // Potential extensions:

 // -Covariance matrix calculations and other matrix operations

 // -Effective Sample Size evaluation


 #include "Manager/gpuUtils.cuh"


 __host__ void InitGPU_AutoCorr(

                           float **ParStep_gpu,

                           float **NumeratorSum_gpu,

                           float **ParamSums_gpu,

                           float **DenomSum_gpu,


                           int n_Entries,

                           int n_Pars,

                           const int n_Lags);


 __host__ void CopyToGPU_AutoCorr(

                             float *ParStep_cpu,

                             float *NumeratorSum_cpu,

                             float *ParamSums_cpu,

                             float *DenomSum_cpu,


                             float *ParStep_gpu,

                             float *NumeratorSum_gpu,

                             float *ParamSums_gpu,

                             float *DenomSum_gpu);


 __global__ void EvalOnGPU_AutoCorr(

     const float* __restrict__ ParStep_gpu,

     const float* __restrict__ ParamSums_gpu,

     float*  NumeratorSum_gpu,

     float*  DenomSum_gpu);


 __host__ void RunGPU_AutoCorr(

     float*  ParStep_gpu,

     float*  ParamSums_gpu,

     float*  NumeratorSum_gpu,

     float*  DenomSum_gpu,

     float*  NumeratorSum_cpu,

     float*  DenomSum_cpu);


 __host__ void CleanupGPU_AutoCorr(

     float *ParStep_gpu,

     float *NumeratorSum_gpu,

     float *ParamSums_gpu,

     float *DenomSum_gpu);

EvalOnGPU_AutoCorr
__global__ void EvalOnGPU_AutoCorr(const float *__restrict__ ParStep_gpu, const float *__restrict__ ParamSums_gpu, float *NumeratorSum_gpu, float *DenomSum_gpu)
Eval autocorrelations based on Box and Jenkins.
Definition: gpuMCMCProcessorUtils.cu:110

InitGPU_AutoCorr
__host__ void InitGPU_AutoCorr(float **ParStep_gpu, float **NumeratorSum_gpu, float **ParamSums_gpu, float **DenomSum_gpu, int n_Entries, int n_Pars, const int n_Lags)
KS: Initialiser, here we allocate memory for variables and copy constants.
Definition: gpuMCMCProcessorUtils.cu:23

CopyToGPU_AutoCorr
__host__ void CopyToGPU_AutoCorr(float *ParStep_cpu, float *NumeratorSum_cpu, float *ParamSums_cpu, float *DenomSum_cpu, float *ParStep_gpu, float *NumeratorSum_gpu, float *ParamSums_gpu, float *DenomSum_gpu)
KS: Copy necessary variables from CPU to GPU.
Definition: gpuMCMCProcessorUtils.cu:75

RunGPU_AutoCorr
__host__ void RunGPU_AutoCorr(float *ParStep_gpu, float *ParamSums_gpu, float *NumeratorSum_gpu, float *DenomSum_gpu, float *NumeratorSum_cpu, float *DenomSum_cpu)
KS: This call the main kernel responsible for calculating LagL and later copy results back to CPU.
Definition: gpuMCMCProcessorUtils.cu:160

CleanupGPU_AutoCorr
__host__ void CleanupGPU_AutoCorr(float *ParStep_gpu, float *NumeratorSum_gpu, float *ParamSums_gpu, float *DenomSum_gpu)
KS: free memory on gpu.
Definition: gpuMCMCProcessorUtils.cu:197

gpuUtils.cuh
Common CUDA utilities and definitions for shared GPU functionality.