mercredi, avril 06, 2005

Avril = qualité

Le mois d'avril sera pour moi plein de qualités... principalement de la qualité logicielle :)

Je dois mettre de côté pour un mois mes projets de moteur de recherche celui d'HPC4U. Il s'agira de définir les tests de vérification et de validation d'un middleware Grid, orienté gestion des pannes.

lundi, avril 04, 2005

Moteurs : dernières nouvelles

Quelques news dans le monde des moteurs de recherche :

* ULTRALINGUA
Quel que soit le pays d’origine et donc la langue d’indexation des photos, l’ensemble des image du site seront accessibles via une recherche par mot-clé dans toutes les langues disponibles.
>>Tester la version web du traducteur Ultralingua

* DIR.COM
Le moteur de recherche 'Dir.com' développé par Free depuis deux ans refait surface (320 millions de pages indexées)
http://www.boursier.com/vals/FR/news.asp?id=132414

* YAHOO et Creative Commons
Voilà une initiative non encore étrennée par Google ou Microsoft : Yahoo! adapte son moteur Yahoo Search à un nouveau domaine de recherche. Il s’agira cette fois non de scruter aveuglément ici et là, mais de fouiller uniquement des contenu étiquetés Creative Commons (CC). D'ailleurs "Creative Commons Search" est le petit nom de cet outil idéal pour de futurs travaux (école, dossier, etc.).
http://www.pcinpact.com/actu/newsg/20312.htm

vendredi, avril 01, 2005

Les communautés d'intérêt

Phénomène (+-nouveau) à la mode dans le domaine des moteurs de recherche : les communautés d'intérêt méritait bien un petit article...

Tandis que l'on approche des limites de la recherche textuelle (Google, MSN Search) des documents webs, et que les moteurs sémantiques semblent bien complexes à mettre en oeuvre, certains voient en ces communautés une façon simple, économique et moderne de passer de l'échelon du référencement des informations à celui de partage des connaissances.

L'intérêt est flagrant : pourquoi ne pas utiliser le cerveau humain pour établir le ranking des pages webs. Effectivement, l'idée est bonne, mais pas sans difficultés...

Sans entrer dans les détails, les difficultés résident dans la facon de mettre en oeuvre une stratégie permettant d'obtenir de bons résultats.

Parmis d'autres choses, je pense qu'il serait par exemple très utile de distinguer deux groupements majeurs :
- les communautés qui recherchent la meme chose : les résultats doivent être donnés en fonction de ce que ces personnes recherches
- les communautés qui connaissent la meme chose : un informaticien établira plus facilement un classement de site parlant des failles de course critique qu'un biologiste !

Pour conclure, j'adhère complètement au système des communautés d'intérêt, mais je ne suis enthousiaste face à aucun des projets qui m'ont été présenté...

Aussi, dans quelques mois, aurai-je peut-etre l'occasion de vous présenter ma trouvaille en cette matière.