Accueil > > > UN EXAMPLE D'APPLICATION EN CUDA DE L'ALGORITHME DE SCAN POUR LE CALCUL DES INTÉGRALES
UN EXAMPLE D'APPLICATION EN CUDA DE L'ALGORITHME DE SCAN POUR LE CALCUL DES INTÉGRALES
Information sur la source
Description
Utilisation de l'algorithme de scan pour le calcul de l'aire sous la courbe d'une fonction f ===> intégrale. L'algorithme de scan est le plus basique j'ajouterais plus tard des versions plus performants. C'est un code fait rapidement qui fonctionne correctement. Dans cet example je calcule l'intégrale de x² entre 0..1 avec un pas de 0.001, mais vous pouvez modifier ces paramètres et prendre une autre fonction.
Source
- #include <cuda.h>
- #include <cuda_runtime.h>
- #include <stdlib.h>
- #include <iostream>
-
-
- __device__ double f( double const x )
- {
- double res = x*x;
- return res;
- }
-
- __device__ double Trap( double const h, double const a, double const b)
- {
- double Base = f(b);
- double base = f(a);
- double Aire = h*( Base + base )/2;
- return Aire;
- }
-
-
- template<int BLOCKSIZE>
- __global__ void scan( double* vect, double* sum, int n)
- {
- int i = threadIdx.x + blockDim.x*blockIdx.x;
- int tx = threadIdx.x;
- __shared__ double shared_mem[BLOCKSIZE];
-
- if( tx < BLOCKSIZE && i < n )
- shared_mem[threadIdx.x] = vect[i];
- __syncthreads();
- for(int step = 1 ; step < BLOCKSIZE; step *= 2)
- {
- int index = tx + step;
- if( tx%2 == 0 && i < n && index < BLOCKSIZE )
- {
- shared_mem[tx] += shared_mem[index];
- }
- __syncthreads();
- }
- if( tx == 0)
- sum[blockIdx.x] = shared_mem[tx];
- __syncthreads();
- }
-
-
- __global__ void InitVect(double* vect, double a, double b, double h, int n)
- {
- int i = threadIdx.x + blockDim.x*blockIdx.x;
- double x = a + i*h;
- if( i < n )
- vect[i] = Trap(h, x, x + h);
- }
-
-
- double CalculIntegrale( double a, double b, int n)
- {
- double h = (b - a )/n;
- double* vect;
- double* sum_h, *sum_d;
- double res = 0;
- int size = ceil( (float)n/256);
- sum_h = new double[size];
- cudaMalloc( (void**)&vect, n*sizeof(double));
- if( cudaGetLastError() != cudaSuccess )
- std::cout << "Malloc 1 "<<cudaGetErrorString(cudaGetLastError()) << std::endl;
- cudaMalloc( (void**)&sum_d, size*sizeof(double));
- if( cudaGetLastError() != cudaSuccess )
- std::cout << "Malloc 2 "<<cudaGetErrorString(cudaGetLastError()) << std::endl;
-
- dim3 grid(ceil( (float)n/256),1,1 );
- dim3 block( 256,1,1);
- InitVect<<<grid, block>>>(vect, a, b, h, n);
- cudaThreadSynchronize();
- if( cudaGetLastError() != cudaSuccess )
- std::cout << "Vect Init "<<cudaGetErrorString(cudaGetLastError()) << std::endl;
- scan<256><<<grid, block >>>(vect, sum_d,n);
- cudaThreadSynchronize();
- if( cudaGetLastError() != cudaSuccess )
- std::cout << "Scan "<<cudaGetErrorString(cudaGetLastError()) << std::endl;
-
- cudaMemcpy( sum_h, sum_d, size*sizeof(double), cudaMemcpyDeviceToHost);
- if( cudaGetLastError() != cudaSuccess )
- std::cout << "Memcpy 1 "<<cudaGetErrorString(cudaGetLastError()) << std::endl;
-
-
- for(int i = 0; i < size; ++i)//Boucle pour finir la somme
- res += sum_h[i];
-
- cudaFree( vect );
- cudaFree( sum_d );
- delete[] sum_h;
- return res;
- }
-
- int main(int argc, char* argv[])
- {
-
- double integral = CalculIntegrale(0.,1.,1000);
- std::cout << integral << std::endl;
- return 0;
- }
-
-
#include <cuda.h>
#include <cuda_runtime.h>
#include <stdlib.h>
#include <iostream>
__device__ double f( double const x )
{
double res = x*x;
return res;
}
__device__ double Trap( double const h, double const a, double const b)
{
double Base = f(b);
double base = f(a);
double Aire = h*( Base + base )/2;
return Aire;
}
template<int BLOCKSIZE>
__global__ void scan( double* vect, double* sum, int n)
{
int i = threadIdx.x + blockDim.x*blockIdx.x;
int tx = threadIdx.x;
__shared__ double shared_mem[BLOCKSIZE];
if( tx < BLOCKSIZE && i < n )
shared_mem[threadIdx.x] = vect[i];
__syncthreads();
for(int step = 1 ; step < BLOCKSIZE; step *= 2)
{
int index = tx + step;
if( tx%2 == 0 && i < n && index < BLOCKSIZE )
{
shared_mem[tx] += shared_mem[index];
}
__syncthreads();
}
if( tx == 0)
sum[blockIdx.x] = shared_mem[tx];
__syncthreads();
}
__global__ void InitVect(double* vect, double a, double b, double h, int n)
{
int i = threadIdx.x + blockDim.x*blockIdx.x;
double x = a + i*h;
if( i < n )
vect[i] = Trap(h, x, x + h);
}
double CalculIntegrale( double a, double b, int n)
{
double h = (b - a )/n;
double* vect;
double* sum_h, *sum_d;
double res = 0;
int size = ceil( (float)n/256);
sum_h = new double[size];
cudaMalloc( (void**)&vect, n*sizeof(double));
if( cudaGetLastError() != cudaSuccess )
std::cout << "Malloc 1 "<<cudaGetErrorString(cudaGetLastError()) << std::endl;
cudaMalloc( (void**)&sum_d, size*sizeof(double));
if( cudaGetLastError() != cudaSuccess )
std::cout << "Malloc 2 "<<cudaGetErrorString(cudaGetLastError()) << std::endl;
dim3 grid(ceil( (float)n/256),1,1 );
dim3 block( 256,1,1);
InitVect<<<grid, block>>>(vect, a, b, h, n);
cudaThreadSynchronize();
if( cudaGetLastError() != cudaSuccess )
std::cout << "Vect Init "<<cudaGetErrorString(cudaGetLastError()) << std::endl;
scan<256><<<grid, block >>>(vect, sum_d,n);
cudaThreadSynchronize();
if( cudaGetLastError() != cudaSuccess )
std::cout << "Scan "<<cudaGetErrorString(cudaGetLastError()) << std::endl;
cudaMemcpy( sum_h, sum_d, size*sizeof(double), cudaMemcpyDeviceToHost);
if( cudaGetLastError() != cudaSuccess )
std::cout << "Memcpy 1 "<<cudaGetErrorString(cudaGetLastError()) << std::endl;
for(int i = 0; i < size; ++i)//Boucle pour finir la somme
res += sum_h[i];
cudaFree( vect );
cudaFree( sum_d );
delete[] sum_h;
return res;
}
int main(int argc, char* argv[])
{
double integral = CalculIntegrale(0.,1.,1000);
std::cout << integral << std::endl;
return 0;
}
Sources de la même categorie
Commentaires et avis
Discussions en rapport avec ce code source dans le forum
Algorithme de compression STAR amélioré [ par hi_vivie2 ]
Bonjour à tous,Je dois réaliser de manière urgente l'implémentation en java de l'algorithme de compression STAR amélioré appliqué aux images en mouvem
Algorithme de compression STAR amélioré [ par hi_vivie2 ]
Bonjour à tous,Je dois réaliser de manière urgente l'implémentation en java de l'algorithme de compression STAR amélioré appliqué aux images en mouvem
un programme à creer [ par yoyo ]
je dois creer un programme permettant d trouver les nombres premiers.l'algorithme est donné, et il utilise des tableaux dont les cases sont remplies p
Qui sait l'algorithme pour calculer les racines? [ par TMT ]
Aidez-moi!
conversion de la partie fractionnaire en base n [ par Alucard ]
J'ai vu qu'il y avait beaucoup d'algorithme de la partie entière (int) d'un nombre en n'importe quel base mais je voulais savoir si quelqu'un avait un
Algorithme de mélange [ par C2S ]
bonjour, j'aimerais connaitre un algorithme de mélange d'un tableau... (aléatoire) ... c'est pour simuler une fonction "mélanger" relative a un paquet
aide sur l'algorithme AMR [ par semecurbep ]
Votre texte iciVotre texte ICIVotre texte ICI
map basic?????? [ par Sfoued2003 ]
slt tout le monde,je me demande si je peux faire implémenter un algorithme de Electre1 sur map basic, pour pouvoir l'utiliser aprés sur map info? et ç
algorithme de gauss et decomposition LU [ par speedamine ]
bonjour a tous.je voudrai avoir des algorithmes ,ecrits en borland pascal,suivants:methode de gauss ordinaire pour la resolution d'un systeme .la deco
Algorithme conversion Noms longs <-> Noms courts [ par franck406 ]
Je suis à la recherche de l'algorithme qui permet d'obtenir un nom fichier court à partir d'un nom de fichier long comme le fait Dos. Je dois écrire u
|
Derniers Blogs
INTéGRATION YAMMER ET SHAREPOINT ONLINE (OFFICE 365), éTAPE 1 .INTéGRATION YAMMER ET SHAREPOINT ONLINE (OFFICE 365), éTAPE 1 . par Patrick Guimonet
#Yammer Certains s'en sont déjà fait l'écho (ici en allemand par exemple : Yammer Integration in Office 365 Phase 1) ou bien sûr sur le blog SharePoint : Make Yammer your default social network in Office 365 en anglais. Mais c'e...
Cliquez pour lire la suite de l'article par Patrick Guimonet [DYNAMICS CRM] AJOUTER LES DOSSIERS DE CRM AU DOSSIER FAVORIS D'OUTLOOK[DYNAMICS CRM] AJOUTER LES DOSSIERS DE CRM AU DOSSIER FAVORIS D'OUTLOOK par bianca
Objectif
Pour aller plus rapidement dans les menus de Dynamics CRM depuis votre client CRM pour Outlook, vous pouvez utiliser le dossier des Favoris d'Outlook. En effet, par simple glisser/déplacer, vous pouvez déposer un éléme...
Cliquez pour lire la suite de l'article par bianca VISUAL STUDIO 2013VISUAL STUDIO 2013 par Etienne Margraff
Ahh, ENFIN ! c'est officiel, il va y avoir un VS et un TFS 2013. De nouvelles fonctionnalités qui vont à mon sens assoir la maturité de TFS qui est maintenant l'outil incontournable pour tout projet (.NET, mais pas seulement !). Si vous n'avez pas jet...
Cliquez pour lire la suite de l'article par Etienne Margraff CONFIGURER LA COLLATION SQL SERVER POUR SHAREPOINT CONFIGURER LA COLLATION SQL SERVER POUR SHAREPOINT par JeremyJeanson
Note : Je poste cet article à titre de pense-bête. Cela fait des années que je me trimballe avec une capture d'écran, car je ne me rappel jamais comment choisir la collation d'un SQL Server pour SharePoint. Pour SharePoint, il est conseillé de choisir la ...
Cliquez pour lire la suite de l'article par JeremyJeanson ETENDRE LE TEAM WEB ACCESS DE TFS 2012 - STEP 1: CRéATION DU PLUGINETENDRE LE TEAM WEB ACCESS DE TFS 2012 - STEP 1: CRéATION DU PLUGIN par Philess
Dans cet article nous allons créer un plugin installable sur le Team Web Access qui s'intègrera dans l'architecture du site et se chargera au moment où on le décidera.
Avant de lire ce billet et si cela n'est pas encore fait j...
Cliquez pour lire la suite de l'article par Philess
Logiciels
Nego Facturation (1.85)NEGO FACTURATION (1.85)Nego Facturation est un logiciel complet qui permet de gérer vos factures et devis très simplemen... Cliquez pour télécharger Nego Facturation Devis-Factures PHMSD (2.2.0.1)DEVIS-FACTURES PHMSD (2.2.0.1)Configuration minimale
Nécessite Windows™ 2000, XP, Windows 7, 8, Vista (Service Pack à... Cliquez pour télécharger Devis-Factures PHMSD WDmemoCode (2.0.0.1)WDMEMOCODE (2.0.0.1)WDmemoCode a été conçu pour aider les développeurs Windev à créer/compléter et conserver une base... Cliquez pour télécharger WDmemoCode ProtoMedic (4.0.0.11)PROTOMEDIC (4.0.0.11)ProtoMedic est un logiciel destiné principalement aux médecins généralistes.
ProtoMedic permet d... Cliquez pour télécharger ProtoMedic MyCurriculum 2011 (7.4.1.12)MYCURRICULUM 2011 (7.4.1.12)Rédigez votre Curriculum Vitae mais également ceux de votre famille ou de vos amis très facilemen... Cliquez pour télécharger MyCurriculum 2011
|