Programmation multicœurs en bio-informatique
Lille, 11 et 12 Juin 2012
Les nouvelles technologies de biologie moléculaire à haut débit
conduisent à la production massive de données, avec de nouveaux besoins
en calcul intensif pour l'analyse de séquences, la
protéomique,... Les architectures multicoeurs, en particulier les cartes graphiques (GPU), permettent
de répondre à ces beoins en offrant un fort parallélisme à un faible coût. Depuis quelques années, avec l'avènement
des langages de programmation CUDA et OpenCL, de nombreuses
applications bio-informatiques sur GPU ont vu le jour.
Le PPF
Bio-informatique de l'Université Lille 1, associé à Renabi-Lille,
propose une formation à la programmation et l'utilisation des
processeurs multicoeurs, notamment GPU, dans le monde de la bio-informatique.
Cette formation a pour objectif de présenter les concepts et outils nécessaires à l'exploitation de
programmes GPU existants, ainsi que d'apporter les bases de la programmation GPU en
OpenCL. Elle s'organise en trois volets,
alliant théorie et pratique :
- Cours et exposés: découverte des GPU, exemples de développements bio-informatiques
- TP: installation d'un environnement CUDA et utilisation d'outils
existants, notamment grâce à l'environnement biomanycores
- TP: initiation à la programmation GPU/multicoeurs sous OpenCL
La formation s'adresse à un public de chercheurs, ingénieurs ou
doctorants en bio-informatique ayant la maîtrise d'au moins un langage
de programmation (C, Java,...) et une bonne connaissance de
l'environnement Linux. Il n'est pas nécessaire d'avoir des connaissances en
parallélisme.
A l'issue de la formation, vous devriez être capable de déployer des
applications GPU au sein de votre laboratoire et
d'écrire des petits programmes afin de réaliser vous-même des tâches sur
processeurs multicoeurs.
Sur ces sujets, un soutien après la formation sera proposé aux personnes inscrites.
Programme
lundi 11 juin – Exposés/Cours – 13h30 à 17h30, amphi Appert, Polytech'Lille
- 13h15-13h30: accueil
- 13h30-14h15:
Architecture des processeurs classiques (CPU) et multi-coeurs.
Exemples des cartes graphiques (GPU) (Mathieu Giraud, LIFL) slides
- 14h15-15h: Principes de la programmation parallèle CUDA
et OpenCL, GPUs et bioinformatique
(Jean-Stéphane Varré, LIFL), slides: exemples , applications
- 15h-15h30: pause
- 15h30-16h30: Using Graphics Processors to Accelerate Protein Docking Calculations (Dave Ritchie, LORIA) slides
Abstract: Protein docking is the computationally intensive task of calculating the three-dimensional structure of a protein complex starting from the individual structures of the constituent proteins. In order to make the calculation tractable, most docking algorithms begin by assuming that the structures to be docked are rigid. This talk describes some recent developments we have made to adapt our FFT-based rigid-body docking algorithm (Hex) to exploit the computational power of modern graphics processors (GPUs). The Hex algorithm is very efficient on conventional central processor units (CPUs), yet significant further speed-ups have been obtained by using GPUs. Thus, FFT-based docking calculations which formerly took several hours to complete using CPUs may now be carried out in a matter of seconds using GPUs. Although adapting Hex to run on the GPU involved writing only a few new GPU kernels, quite a lot of preparation and planning was required to re-structure the CPU-based code in order to achieve a stasfactory speed-up. Therefore, as well as giving some small examples of GPU programming using CUDA, this talk will also recommend some general programming strategies for successfully porting a non-trivial piece of code to the GPU. Binaries of the Hex program are can be downloaded from
hex.loria.fr.
- 16h30-17h30: Comparaison intensive de séquences ( Dominique Lavenier, IRISA) slides
La comparaison de séquences génomiques reste une tâche de base de la
bioinformatique. Avec les volumes de données croissants, elle peut même
devenir un goulot d'étranglement, notamment pour l'analyse de données
métagénomiques lorsqu'il s'agit, par exemple, de comparer un métagénome
(centaines de millions de fragments d'ADN) contre une banque protéique afin
de mettre en évidence des voies métaboliques, ou caractériser les
espèces qui composent ce métagénome.
Le logiciel PLAST a été conçu pour optimiser la comparaison de banques
de séquences. Son architecture logicielle se base sur une structure de
données favorisant un modèle de programmation SIMD pour les parties
de l'algorithme coûteuses en calcul. L'exposé montrera la philosophie de
l'implémentation de PLAST sur GPU et les performances obtenues.
mardi 12 juin – TP: CUDA, Biomanycores, OpenCL – 9h00 à 17h00, salle E304, Polytech'Lille
- 9h-12h: CUDA, Biomanycores (Jean-Frédéric Berthelot, Stéphane Janot)
- Présentation de l'environnement CUDA
- Installation et compilation d'applications CUDA (GPUBlast, CudaSW++, etc...)
- Utilisation de Biopython,
et BioPerl avec
Biomanycores
- Cas d'utilisation
- Sujet TP
- 14h-17h: OpenCL (Tuan Tu Tran, Mathieu Giraud)
- Programmation sur processeurs manycores/GPU
- Initiation à OpenCL, compilation et exécution, avec SDK NVIDIA et ATI
- Optimisations: mémoires, kernels
- Sujet TP - Solution possible
Dates et lieu
La formation se déroulera lundi 11 Juin après-midi et mardi 12 juin à
Polytech'Lille, à Villeneuve d'Ascq, sur le campus de l'Université Lille 1.
Le site est desservi par le métro, ligne 1, station Quatre Cantons (plan d'accès, plan du campus ), compter environ 20 minutes depuis la gare Lille-Flandres.
Inscription
La date limite d'inscription est fixée au mercredi 16 mai 2012.
L'inscription est gratuite mais obligatoire pour l'organisation (occupation de la salle TP, pauses, déjeuner du mardi
midi).Le nombre de place pour les séances de TP du mardi est limité à 16.
Il est possible de n'assister qu'à la session de
cours/exposés du lundi, ouverte à tous.
Pour vous inscrire, merci d'envoyer un courrier électronique à stephane.janot@univ-lille1.fr
avec les informations suivantes :
Nom:
Prénom:
Courriel:
Fonction:
Laboratoire d'appartenance:
Adresse:
Présence à la session cours/exposés du lundi 11 juin: oui/non
Présence aux TP du mardi 12 juin: oui/non
Hébergement
L'office du Tourisme de Lille propose un moteur de
réservation d'hôtels (sélectionner Lille centre). Ci-dessous
quelques hôtels situés à Lille. Il faut compter une vingtaine de
minutes en métro pour rejoindre le campus à partir du centre-ville. Il
existe également un hôtel situé sur le campus même : Ascotel autour de 100 euros la nuit.
- B&B Lille centre Grand Palais – 2 étoiles
– rue Berthe Morisot, 59000 Lille
– 64-74 € –
métro Lille Grand Palais –
http://www.hotel-bb.com/hotel_info?hotelId=4514
- Hôtel du moulin d'or – 2 étoiles
– 15 rue du Molinel, 59800 Lille
– 75-90 € –
métro Lille Flandres –
http://www.hotelmoulindor.com/
- Hôtel Balladins Lille centre – 2 étoiles
– 24 place de la gare, 59800 Lille
– 90-100 € –
métro Lille Flandres –
https://www.balladins.com/fr/reservation-hotel-balladins-lille-_R_216_41_.php
- Hotel Brueghel – 2 étoiles
– 3-5 Parvis St Maurice, 59000 Lille
– 60-140 € –
métro Lille Flandres –
http://www.hotel-brueghel-lille.com/
- Première Classe Lille centre
19 Place Des Reignaux, 59000 Lille
– 60 € –
métro Lille Flandres –
http://www.premiere-classe-lille-centre.fr/fr/index.aspx
- Best Hôtel Lille – 2 étoiles
– 66, rue Littré, 59000 Lille
– 49-70 € –
métro Gambetta –
http://www.besthotel.fr/LILLE/
- Etap Hotel Lille centre
– 10, Rue de Courtrai, 59000 Lille
– 47-53 € –
à 10 min. du métro Gambetta –
http://www.etaphotel.com/fr/hotel-5208-etap-hotel-lille-centre/index.shtml
- Inter Hotel Parc des expositions Lille – 2 étoiles
– 53-57 rue Christophe Colomb, 59800 Lille
– 70 € –
métro Caulier –
http://inter-expositions-lille.h-rez.com/
Contact
Pour toute question, merci de contacter Stéphane Janot : stephane.janot@univ-lille1.fr.
Last modified: Tue May 29 14:25:07 CET 2012