Boucles parallèles en C++

Question

Je me demande s’il existe un moyen léger et simple de calculer des boucles telles que for et range for for basées en parallèle en C++. Comment mettriez-vous en œuvre une telle chose? De Scala, je connais la carte, les filtres et les fonctions pour chaque fonction. Peut-être serait-il également possible d’exécuter ces fonctions en parallèle? Existe-t-il un moyen simple d’atteindre cet objectif en C++ . Ma plate-forme principale est Linux, mais ce serait bien si cela fonctionnait sur plusieurs plates-formes.

Daniel Langr · Accepted Answer

Quelle est votre plateforme? Vous pouvez regarder OpenMP, bien que cela ne fasse pas partie de C++. Mais il est largement soutenu par les compilateurs.

Pour en savoir plus sur les boucles for basées sur une plage, voir, par exemple, Utilisation de OpenMP avec C++ 11 sur des boucles for basées sur une plage? .

J'ai également vu peu de documents sur http://www.open-std.org qui indiquent des efforts pour incorporer des constructions/algorithmes parallèles dans le futur C++, mais je ne sais pas quel est leur statut actuel.

METTRE &AGRAVE; JOUR

Ajoutons juste un code exemplaire:

template <typename RAIter> void loop_in_parallel(RAIter first, RAIter last) { const size_t n = std::distance(first, last); #pragma omp parallel for for (size_t i = 0; i < n; i++) { auto& elem = *(first + i); // do whatever you want with elem } }

Le nombre de threads peut être défini au moment de l'exécution à l'aide de la variable d'environnement OMP_NUM_THREADS.

Exagon · Answer

Avec les algorithmes parallèles en C++ 17, nous pouvons maintenant utiliser:

std::vector<std::string> foo; std::for_each( std::execution::par_unseq, foo.begin(), foo.end(), [](auto&& item) { //do stuff with item });

calculer des boucles en parallèle. Le premier paramètre spécifie la politique d’exécution

bobah · Answer

std::async peut être un bon choix ici, si vous êtes prêt à laisser le runtime C++ contrôler le parallélisme.

Exemple tiré de cppreference.com:

#include <iostream> #include <vector> #include <algorithm> #include <numeric> #include <future> template <typename RAIter> int parallel_sum(RAIter beg, RAIter end) { auto len = end - beg; if(len < 1000) return std::accumulate(beg, end, 0); RAIter mid = beg + len/2; auto handle = std::async(std::launch::async, parallel_sum<RAIter>, mid, end); int sum = parallel_sum(beg, mid); return sum + handle.get(); } int main() { std::vector<int> v(10000, 1); std::cout << "The sum is " << parallel_sum(v.begin(), v.end()) << '
'; }

arkan · Answer

Avec C++ 11, vous pouvez paralléliser une boucle for avec seulement quelques lignes de codes . Cela divise une boucle for en fragments plus petits et affecte chaque sous-boucle à un thread:

/// Basically replacing: void sequential_for(){ for(int i = 0; i < nb_elements; ++i) computation(i); } /// By: void threaded_for(){ parallel_for(nb_elements, [&](int start, int end){ for(int i = start; i < end; ++i) computation(i); } ); }

Ou en classe:

struct My_obj { /// Replacing: void sequential_for(){ for(int i = 0; i < nb_elements; ++i) computation(i); } /// By: void threaded_for(){ parallel_for(nb_elements, [this](int s, int e){ this->process_chunk(s, e); } ); } void process_chunk(int start, int end) { for(int i = start; i < end; ++i) computation(i); } };

Pour ce faire, il vous suffit de placer le code ci-dessous dans un fichier d’en-tête et de l’utiliser à volonté:

#include <algorithm> #include <thread> #include <functional> #include <vector> /// @param[in] nb_elements : size of your for loop /// @param[in] functor(start, end) : /// your function processing a sub chunk of the for loop. /// "start" is the first index to process (included) until the index "end" /// (excluded) /// @code /// for(int i = start; i < end; ++i) /// computation(i); /// @endcode /// @param use_threads : enable / disable threads. /// /// static void parallel_for(unsigned nb_elements, std::function<void (int start, int end)> functor, bool use_threads = true) { // ------- unsigned nb_threads_hint = std::thread::hardware_concurrency(); unsigned nb_threads = nb_threads_hint == 0 ? 8 : (nb_threads_hint); unsigned batch_size = nb_elements / nb_threads; unsigned batch_remainder = nb_elements % nb_threads; std::vector< std::thread > my_threads(nb_threads); if( use_threads ) { // Multithread execution for(unsigned i = 0; i < nb_threads; ++i) { int start = i * batch_size; my_threads[i] = std::thread(functor, start, start+batch_size); } } else { // Single thread execution (for easy debugging) for(unsigned i = 0; i < nb_threads; ++i){ int start = i * batch_size; functor( start, start+batch_size ); } } // Deform the elements left int start = nb_threads * batch_size; functor( start, start+batch_remainder); // Wait for the other thread to finish their task if( use_threads ) std::for_each(my_threads.begin(), my_threads.end(), std::mem_fn(&std::thread::join)); }

Enfin, vous pouvez définir une macro pour obtenir une expression encore plus compacte:

#define PARALLEL_FOR_BEGIN(nb_elements) tbx::parallel_for(nb_elements, [&](int start, int end){ for(int i = start; i < end; ++i) #define PARALLEL_FOR_END()}) TBX_PARALLEL_FOR_BEGIN(nb_edges) { computation(i); }TBX_PARALLEL_FOR_END();

uSeemSurprised · Answer

Cela peut être fait en utilisant la fonction de bibliothèque threads spécifiquement pthreads qui peut être utilisée pour effectuer des opérations simultanément.

Vous pouvez en savoir plus à leur sujet ici: http://www.tutorialspoint.com/cplusplus/cpp_multithreading.htm

std :: thread peut également être utilisé: http://www.cplusplus.com/reference/thread/thread/

Ci-dessous, un code dans lequel j'utilise l'identifiant de thread de chaque thread pour diviser le tableau en deux moitiés:

#include <iostream> #include <cstdlib> #include <pthread.h> using namespace std; #define NUM_THREADS 2 int arr[10] = {0, 1, 2, 3, 4, 5, 6, 7, 8, 9}; void *splitLoop(void *threadid) { long tid; tid = (long)threadid; //cout << "Hello World! Thread ID, " << tid << endl; int start = (tid * 5); int end = start + 5; for(int i = start;i < end;i++){ cout << arr[i] << " "; } cout << endl; pthread_exit(NULL); } int main () { pthread_t threads[NUM_THREADS]; int rc; int i; for( i=0; i < NUM_THREADS; i++ ){ cout << "main() : creating thread, " << i << endl; rc = pthread_create(&threads[i], NULL, splitLoop, (void *)i); if (rc){ cout << "Error:unable to create thread," << rc << endl; exit(-1); } } pthread_exit(NULL); }

Rappelez-vous également que lors de la compilation, vous devez utiliser le drapeau -lpthread.

Lien vers une solution sur Ideone: http://ideone.com/KcsW4P

justyy · Answer

Concurrency :: parallel_for (PPL) est également l’une des options de Nice pour effectuer le parallélisme des tâches.

Tiré de Exercice de codage C++ - Parallèle pour - Calcul du PI de Monte Carlo

int main() { srand(time(NULL)); // seed const int N1 = 1000; const int N2 = 100000; int n = 0; int c = 0; Concurrency::critical_section cs; // it is better that N2 >> N1 for better performance Concurrency::parallel_for(0, N1, [&](int i) { int t = monte_carlo_count_pi(N2); cs.lock(); // race condition n += N2; // total sampling points c += t; // points fall in the circle cs.unlock(); }); cout < < "pi ~= " << setprecision(9) << (double)c / n * 4.0 << endl; return 0; }