Les algorithmes ne suffisent plus ?
Le mercredi 6 septembre 2006 à 23:23 :: Technologies :: #19
Les algorithmes sont et ont toujours été le cœur et l’âme des moteurs de recherche. Ils sont leurs substantifique moelle et leur bien le plus précieux. Il suffit pour s’en convaincre de voir comment leurs secrets sont gardés.
Néanmoins, certaines initiatives récentes laissent à penser que, peut être, un interventionnisme humain accru, permettrait un gain en pertinence. Et pour un moteur, la pertinence, c’est la clef.
Vous avez sans doute déjà entendu parler de Google Image Labeler , le dernier jeu de Google Images. Si ce n’est pas le cas, je vous invite à lire l’excellent billet que lui a consacré TOMHTML sur Zorgloob.
Pour résumer, il permet à 2 internautes de s’affronter en direct.
Google affiche des images choisies de manière aléatoire, les joueurs ont 90 secondes pour proposer des labels à associer à ces images.
Si les deux joueurs proposent le même mot, on passe à l’image suivante. Voilà pour le principe. Il n’y a rien à gagner si ce n’est des points qui, a priori, ne servent à rien.
Il faut reconnaître que c’est assez divertissant.
(Même si ce n'est pas l’avis de tout le monde, SEO Black Hat a rédigé un post hilarant de son expérience avec Google Images Labeler.)
Mais le réel vainqueur à ce jeu est Google.
Il lui permet, à peu de frais, d’associer des mots-clef aux images de sa monumentale base. On sait à quel point il est difficile pour un moteur de catégoriser les images récupérées sur le web. Il peut bien sur se baser sur les attributs « alt » et « title » associés aux images ainsi qu’au texte qui les entourent. Mais les attributs, tout comme le texte, peuvent être absents ou trompeurs.
Dans un registre différent, mais participant à mon avis du même phénomène, Yahoo! a depuis peu commencé à présenter aux internautes effectuant des recherche sur son moteur, des résultats issus de son service Yahoo! Answers.
Pour rappel, Yahoo! Answers (désormais disponible en français) permet à des utilisateurs de poser des questions auxquelles d’autres internautes peuvent répondre.
De tels services ne sont pas nouveaux, mais l’innovation est que des réponses issues de se service sont désormais proposées en complément des résultats naturels du moteur.
Voir la capture ci-dessous, les résultats de Yahoo! Answers apparaissent après le dernier résultat du moteur.
(Ce n’est pour l’instant disponible semble t-il que sur la version US.)
Ajoutons à cela un brevet récemment accordé à Google et dont l’intitulé peut approximativement se traduire par : Système et méthode pour la prise en compte d’une opinion éditoriale dans le classement des résultats de recherche.
Une analyse détaillée de ce brevet a été réalisée par William Slawski sur son blog.
Les moteurs deviendrait ils donc plus humains ? Ils ont sans doute à y gagner.
Mais l’approche humaine, comme l’approche purement technique présentent toutes deux inconvénients et limitations.
Pour la première, les principaux handicaps sont la capacité de traitement de grandes quantités de données et le manque d’objectivité ou biais éditorial pouvant en résulter. (Voir les débats entourant le fonctionnement de l’annuaire DMOZ par exemple)
Quand à la seconde, beaucoup continuent de penser que les machines, aussi perfectionnées soient-elles, n’égalerons jamais l’intelligence et la sensibilité de l’homme lorsqu’il s’agit d’analyser un document pour juger de sa pertinence ou de son bien fondé. (Le spamindexing a encore, je le crains, de beaux jours devant lui)
La solution est donc peut être une collaboration et un ajustement de ses deux approches. Cela est bien dans l’ère du temps Web 2.0, avec les internautes acteurs, non plus seulement passif mais contribuant à la production de l’information.
Les algorithmes fournissent le volume et dégrossissent le travail, tandis que les utilisateurs impliqués affinent les résultats, leur nombre croissant permettant en partie de s’affranchir du problème de subjectivité.
Est-ce là l’avenir des moteurs ? Peut être. Mais ils continueront sans nul doute a explorer les deux voies.
Google a certes fait un pas vers « l’humain » avec Google Images Labeler, mais peu de temps auparavant, il avait racheté la société Neven Vision, pionnère dans la reconnaissance et l’extraction d’informations d’images.
mercredi 6 septembre 2006 | 23:23, Sergi
Blogmarks
Delicious
Scoopeo
Fuzz
Technorati
Mister Wong
English
Commentaires
Aucun commentaire pour le moment.
Ajouter un commentaire