vendredi, février 24, 2006

Internet Computing : quel grid ?

Le grid fait intervenir un grand nombre de termes spécifiques. Certains concepts sont encore flou ou mal compris c'est pourquoi ce mois-ci sera consacré à l'explication de certains termes.

L'internet computing, qu'est-ce ? Quel rapport avec le Grid ? Mes articles n 'apporteront pas de réponses complete mais plutot des références et citations diverses trouvées sur le net.

L'internet computing ou Desktop Grid se distingue du Virtual Computing (article suivant). L'Internet Computing c'est tout d'abord exploiter les périodes de latence d'un pc.

T.PRIOL, INRIA : "une combinaison d'un très grand nombre de PC (jusqu'a 1 million)". Il s'' agit d'exploiter les pc inutilisés, récupérer les cycles CPU via un économiseur d'ecran par exemple. (exemple : SETI@home).
Source : Grid Computing approches et tendances

L'internet computing "cela marche bien pour un spectre étroit d’applications" (INRIA, Cosnard et Priol). Est-ce plus généralisable ? (Source)

Dans sa présentation d'XtremWeb (source), O. Lodygensky
distingue lui aussi l'Internet Computing de part le nombre de ressources mais ajoute également :
  • Pas d'identification individuelle
  • Pas de confiance
  • Partage égalitaire
  • PC plutot que grands sites de calcul (ndlr : une tendance ?)
Je suis plutot prudent par rapport à ces affirmations, car leur sens d'une part est douteux, d'autres part il s'agit à mes yeux plus d'une tendance (d'XtremWeb?) plutot que des faits.
Ce que je retiens de la présentation, c'est plutot ce don de ressources unilatérale ("PC volontaire).

Poursuivant mes lectures, je peux maintenant affirmer avec plus de certitude que la traduction reconnue pour Internet Computing est bien "calcul global".

Je continue avec un présentation de Esnard, Deprez sur le calcul global . (un bon nombre de transparents sont les memes que ceux de T.Priol).
Grande nouveauté : la distinction de 3 grands types de grid...

"- Bas niveau :
Cluster computing avec des réseaux hétérogènes de PCs et de stations de travail
Supercalculateur du pauve.

Utilise toutes les ressources disponibles
- Haut niveau : ordinateur les plus puissants
- Intermédiaire : meta computing"
Il y a ensuite des transparents qui valent vraiment la peine (lisez ce document)

Une des grosses tendances lues dans les documents jusqu'à présent est de vouloir passer de l'internet computing centralisé vers un systeme de type P2P.

Dans CGP2P Calcul Global Pair à Pair on présente encore l'Internet Computing comme un systeme distribué A GRANDE ECHELLE (mais on ne le qualifie pas de grid).

Par contre on ajoute ici :
- Modèle Client-Serveur inversé : 1 client et n serveurs
- L’application exécutée sur les serveurs est fournie par le client

Au passage, dans le meme document je lis la meilleure définition jamais lue du P2P : " Un système dans lequel toutes les ressources peuvent agir comme des clients, des serveurs et maintiennent le système lui même ".

Enfin, dans certaines lectures on avance :
- pas de communication entre machines/noeuds (j'ai des doutes que ce point isolé distingue l'internet computing des autres)

Dans un exposé de M Soberman (source) réapparait ce contexte de don de ressources qui vraisemblablement est inévitable. Cela constitue le facteur majeur de la facilité de deploiement et de fonctionnement des systemes pour internet computing.

Par contre, dans le document deux tendances (souvent sous-entendues dans d'autres documents) sont soulignées :
- volonté pour les plateformes de ce type de passer au mode P2P (maintenance distribuée du systeme)
- possibilité d'exécuter des jobs différents / par des utilisateurs différents (mais aucune moyen alternatif pour controler les consommations n'est pour abordé)

Conclusions :

L'Internet Computing offre des resssources (principalement PCs) offertes volontairement. La plupart des systemes existants visent à l'execution d'une seule tache pour un seul utilisateur/client.

Défauts principaux :
- debit des reseaux, tailles des (petites) machines utilisées
- sécurité faible : les entreprises réservent cette technologie à un usage interne
- fiabilité (critere de choix pour les intergiciels disponibles)

1 commentaire:

Anonyme a dit…

Bonjour,

Votre site me semble tres interessant surtout en ce qui conçerne le calcul distribué.
Neanmoins en mentionnant Seti@home vous n'évoquez pas l'évolution de ce projet.
En effet il a été integré à un gestionnaire de grid computing:
Boinc (Berkeley Open Infrastructure for Network Computing) dans le lequel on trouve d'autres projets
comme un etude climatique, des calculs 'biologie' et bien d'autres

Je pense que c'est l'infrastructure la plus fédératrice avec plusieurs centaine de millier d'utilisateurs du monde entier representant une puissance de calcul supérieur à 100 Téraflops.

Bonne lecture

Team France Initiativ