Moteurs News

mercredi 28 juin 2006

Google AdSense test le mélange images + texte

Peut être avez vous vu récemment, des publicités AdSense comportant des images ?

C'est le nouveau format testé par Google AdSense, il se présente sous la forme d'une bannière verticale (skyscraper) de 120x600 avec une image au sommet, entre le "Ads by Goooooogle" et le texte des publicités.

Apparemment, de tels formats apparaissent même pour des comptes AdSense dont les préférences sont définies pour afficher des annonces au format texte uniquement.

D'après Jennifer Slegg sur JenSense, l'image se comporte comme un ensemble thématique, vous amenant sur une page de publicité en relation avec le thème d'origine. Ce beta test a une portée internationale et n'est donc pas réservé aux webmasters américains ou à ceux affichant des annonces uniquement en anglais. On a pu voir certaines de ces annonces sur des sites francophones.

Jusqu'à maintenant, AdSense demandait aux webmasters désirant afficher des images à proximité de leurs publicités afin d'attirer l'oeil de l'internaute, de séparer assez nettement l'image du texte de l'annonce.

C'est sans doute une bonne nouvelle pour les éditeurs, dans la mesure ou il est à peu près reconnu comme certain qu'une image proche d'une annonce tend à générer un taux de clic supérieur.

Mais ce n'est pour l'instant qu'un test et il est à souhaiter que s'il se généralise, une plus grande latitude sera offerte aux webmasters, en leur permettant de choisir ou non d'afficher ce type d'annonce.

Pour plus d'informations, on en parle sur les forums de Web Rank Info

lundi 26 juin 2006

L'étude du comportement des utilisateurs pour améliorer les résultats de recherche

Dans un de ses récent billet, William Slawski, nous livre de nouveau une analyse éclairante et pertinente d'un brevet déposé par Yahoo! intitulé : System and methods for ranking the relative value of terms in a multi-term search query using deletion prediction

Ce qui peut se traduire par : Système et méthodes pour déterminer la valeur relative d'un terme à l'aide de la probabilité d'effacement dans une requête multi-termes.

L'idée de cette technique est que, lors de leurs recherches sur un moteur, les internautes effectuant une requête comportant plusieurs mots vont parfois supprimer un ou plusieurs termes lors des recherches suivantes. Si la première recherche ne donne pas de résultat par exemple.

Ainsi, les moteurs, en plus d'analyser les requêtes et les choix des internautes dans les résultats de recherches, pourraient également s'intéresser aux comportements des utilisateurs dans leurs méthodes de recherche. L'analyse d'un grand nombre de ces données pourrait permettre aux moteurs d'affecter à certaines recherches multi-termes, ou plus exactement, à certains mots de ces recherches, un indice de probabilité d'effacement.
Ils seraient ainsi capable de déterminer lequel (ou lesquels) parmi ces termes sont susceptibles d'être les plus pertinents, et fournir des résultats mieux ciblés.

En fait, la portée de ce brevet, dans sa description, semble plus être axée sur le ciblage publicitaire, mais il est dit également que cette méthode pourrait s'appliquer aux moteurs afin d'améliorer la pertinence des résultats.

Pour une analyse plus approfondie, je vous invite à lire le billet de Jean-Marie le Ray sur Adscriptor, ainsi que celui de Willam Slawski, User Behaviour: Deletion Predictions sur SEO by the SEA.

samedi 24 juin 2006

Ask.com pousse-t-il la censure trop loin ?

Dans son dernier billet, Google System blog parle du fait que Ask censure activement certaines recherches, notamment celles relatives à la pédophilie et plus généralement à la sexualité.

La recherche "pedophilia" sur Ask.com ou "pédophilie" sur la version française vous amène par exemple sur une page vous informant que :

Cette recherche n'est pas conforme aux modalités du service Ask.com France.

Là où d'autres moteurs comme Google ou Yahoo!, affichent en tête des résultats des liens vers Wikipedia ou vers des associations de lutte contre les maltraitances à enfants, Ask a choisit de censurer purement et simplement ces termes.

Il faut d'ailleurs noter que la recherche : "lutte contre la pédophilie" ou "association de lutte contre la pédophilie" aboutit aux même résultats.

Ce n'est qu'un exemple parmi d'autres car la liste de termes banni semble assez longue.

On peut s'interroger sur le bien fondé d'une telle démarche.

Les associations de lutte, ou les sites proposant des textes de lois relatifs à ces crimes ne devraient pas, parce que Ask en à décidé ainsi, être visibles sur le net ?

Tous les efforts pour lutter contre de telles pratiques sont louables, mais je ne suis pas certain que la méthode utilisée par Ask soit la plus efficace ou la plus pertinente.

jeudi 22 juin 2006

Google test AdSense "affiliation"

Sur SeekingAlpha, David Jackson nous apprends que Google test un programme d'AdSense au CPA (cost per action) où le paiement s'effectue non plus à l'affichage, ou au clic, mais sur la base d'une action après le clic (comme une vente par exemple).

Autrement dit, Google se lance dans l'affiliation.

Ce programme ne s'adresse pour l'instant qu'a quelques annonceurs AdSense invités par Google. ( Une copie du mail original est disponible sur SeekingAlpha )

Il s'agit apparemment d'un programme totalement distinct de celui du réseau AdSense tel que nous le connaissons aujourd'hui. Le choix entre les deux systèmes resterait ouvert et ils pourraient co-exister.

Il semblerait même que les annonces à afficher pourraient être choisies individuellement par le webmaster.

Sans doute est-ce là un moyen pour Google de s'éviter les fraudes et abus inhérents aux systèmes de "paiement au clic" et "paiement à l'affichage".

Mais l'un des problèmes avec ce type de publicité, est que la "conversion" se fait hors de portée du site ayant affiché l'annonce. Et cela rend le webmaster dépendant du site de destination, car c'est la qualité de ce dernier site, et sa compétence à promouvoir ces produits et services, qui générera ou non les revenus.

Malgré toute votre science pour afficher les meilleures annonces aux meilleurs endroits et obtenir un taux de clic important, si le site de destination n'est pas convaincant pour l'internaute, vos efforts seront vains.

Est-ce l'avenir de la publicité sur internet ? Difficile à dire même si certains, notamment les publicitaires, aimeraient sans doute qu'il en soit ainsi.

Si tel est bien le cas, alors la publicité sur internet se démarque très nettement des systèmes existant dans les médias traditionnels où l'affichage et la diffusion ont toujours étaient majoritairement à la base du revenu de l'annonceur.

samedi 17 juin 2006

Quaero vu de l'intérieur

Le CNRS vient de publier un entretien sur Quaero avec Jean-Luc Gauvain, directeur de recherche à Limsi (Laboratoire d'informatique pour la mécanique et les sciences de l'ingénieur). Limsi est l'un des laboratoires à l'initiative du projet Quaero.

Il nous en dit plus sur Quaero, que certains ont défini, ( et que certains définissent encore ) comme le "futur Google européen".

Pour lui, Quaero est avant tout un programme industriel fédérant de nombreux partenaires. Aussi bien des industriels (Thomson, pilote du projet en France), que des PME, ou des laboratoires de recherche publics (CNRS) et universitaires (université de Karlsruhe, Aix-la-Chapelle).

Il explique que "le but de Quaero n'est pas tant de remplacer Google que d'offrir de nouveaux moyens de recherche", notamment pour des données multimédia.

Il détail également l'organisation du programme autour des projets "technologiques" (recherche d'information, indexation, traitement des données...) sur lesquels s'appuieront les projets "applicatifs" (portail grand public, moteur de recherche multimédia, vidéo à la demande...).

La distribution des tâches entre les partenaires est particulière dans la mesure ou "plusieurs partenaires travailleront sur un même domaine et avec un même objectif". Après évaluation, les pistes les plus prometteuses seront alors mises en commun. Cette approche, selon lui, favorisant l'excellence.

Pour ce qui est de la date de lancement de Quaero, Jean-Luc Gauvain rappelle que le projet doit avant tout obtenir l'aval de la Commission européenne.

Le projet, prévu pour s'étendre sur cinq ans, devrait lancer les premières applications dès sa première année, notamment le moteur de recherche multimédia.

Indexation et qualité selon Google

Dans un de ses récents post Matt Cutts aborde le sujet des nouveaux critères d'indexation et notamment la détermination par l'algorithme de BigDaddy de la confiance pouvant être accordée aux liens entrants et sortant en fonction de leurs qualités.

Matt Cutts mets en avant l'importance du réseaux de liens autour d'un site dans l'indexation de celui-ci. Bien sur, il ne fait que confirmer ce que l'on savait déjà : il faut privilégier la qualité des liens plutôt que leur nombres. Ce n'est plus seulement l'apport important et rapide de nouveaux liens (comme une inscription massive dans de nombreux annuaires à la fois) qui est pénalisante, mais bien la qualité de la toile tissée autour d'un site.

Les conseils que l'on peut en retirer sont :
  • Privilégiez les sites de qualité (réputation, autorité dans leur domaine, longévité ...) et en relation étroite avec votre activité.
  • Evitez ceux dont la seule raison d'être est de fournir des liens à d'autres sites, ceux dont les pratiques ou le voisinage pourraient vous sembler douteuse (à vous et à Google).

Toujours d'après Matt Cutts, seraient particulièrement pénalisant les trop nombreux liens réciproques, les liens vers/depuis des réseaux de sites spammeurs...

Des sites ayant de telles fréquentations s'exposent à être crawlés moins profondément, voir à ne pas être visités du tout.

Certains y voient les prémices d'un mécanisme assez similaire à celui de la fameuse SandBox de Google qui empêche les nouveaux sites, ou ceux considérés comme peu digne de confiance, d'être bien placé dans les résultats de recherche.

A l'instar de la SandBox, les sites mal considérés par Google se verraientt moins visités, tant en fréquence qu'en profondeur.

Certains ont également notés, à tort ou à raison, que la désindexation ayant suivit la mise en place de BigDaddy avait surtout frappé les gros sites, ceux ayant un nombre élevé de pages, épargnant relativement les plus petits.

Pour résoudre ces difficultés à se faire indexer, certains webmasters se posent la question de savoir s'il n'y aurait pas une "nouvelle" taille optimale de site, ou si la structure même des sites ne devrait pas être revue.

Mais c'est oublier que Google n'est pas statique, (c'est d'ailleurs ce dont se plaignent certains webmasters), il est en constante évolution, et, outre le fait que de tels changements (de taille ou de structure) non seulement n'arrangeront peut être pas la situation, ils seront peut être encore moins pertinents demain.

A vouloir courir derrière Google, on sera toujours en retard.

La taille d'un site ne doit pas être fonction d'une éventuelle optimisation pour les moteurs de recherche mais déterminée par la quantité de contenu unique et de qualité que vous êtes capable de produire sur votre sujet.

Il est évident que le site d'une petite entreprise très spécialisée ne pourra pas, et n'aura pas besoin d'avoir, une masse énorme de contenu. Il sera pour elle de beaucoup préférable d'avoir sur sa thématique un contenu restreint mais de grande qualité.

Les très gros sites, de grande compagnies, sont souvent assez mal indexés en profondeur, mais des facteurs tels que leur réputation, ou leur notoriété leurs permettent d'être bien représenté sur Google et ils n'ont pas besoin de voir la totalité de leurs pages présente dans son index.

Ainsi, tant pour le contenu que pour les liens, la qualité prime sur la quantité.

  • Privilégiez des pages proposant réellement un contenu unique plutôt que de nombreuses pages trop similaires les unes aux autres ou trop pauvres en contenu.
  • Privilégiez les liens en provenance de sites de qualité, si possible des liens dit "éditoriaux" (un seul lien dans le corps d'un article sur un site de référence en rapport avec votre thématique vaut une pleine brouette de liens sur des pages "partenaires" ou des annuaires, tant en visites directes générées que pour Google)

La quantité d'information sur Internet ne cesse de croire, et la quantité d'information n'est, en théorie, pas limitée. Mais l'attention que peu recevoir cette information, elle, est limitée.

Jusqu'à il y a peu, Google jouait sur la taille de son index, il la mettait en avant, c'était l'un de ses principal atout face à ses concurrents. Mais retourner plusieurs millions de résultats sur une simple requête n'a guère d'intérêt. Aujourd'hui, le nerf de la guerre est la pertinence du résultat. C'est d'ailleurs sans doute pour cela que Google voit l'avenir de la recherche sur Internet dans l'intelligence artificielle. Comme l'a dit Larry Page dans une récente conférence donnée à Londres :

"Les gens pensent toujours que nous en avons fini avec la recherche. Ce n'est absolument pas le cas. Nous n'avons sans doute pas effectué plus de 5 % du chemin. Nous voulons créer le moteur de recherche ultime qui pourra tout comprendre ... certains pourraient appeler ça l'intelligence artificielle. Un tel moteur comprendrait tout. Il comprendrait ce que vous lui demandez et vous donnerait instantanément la bonne réponse. Si vous lui demandiez :' Que devrais-je vous demandez Larry ?', il vous le dirait"

Un extrait de la conférence est disponible en vidéo

Google connaît sa puissance et son influence sur l'Internet, sur sa croissance et sur la visibilité de ses acteurs. Sur la base énorme de son index, lui également s'axe plus désormais sur la qualité que sur la quantité.

Il a commencé à faire le tri sur des critères beaucoup plus sélectifs que les anciens ou il se contentait de pénaliser les utilisateurs de techniques douteuses. Il le fait également pour sa régie publicitaire avec son nouveau robot qui a pour but de mesurer la qualité des pages sur lesquelles pointent les annonces AdSenses.

De cette nouvelle approche, certains ont déjà souffert. D'autres, s'ils ne s'adaptent pas, en souffriront bientôt.

Et à mon humble avis, la seule planche de salut sera la qualité du contenu.

Un dernier conseil, que n'a pas donné Matt Cutts, n'oubliez pas les autres moteurs et essayez de ne pas trop dépendre de Google.

English English

S'abonner

  • Add to Google
  • Ajouter à Mon Yahoo!
  • Abonnement Bloglines
  • Subscribe in NewsGator Onlines
  • S'abonner avec Netvibes
  • D'autres infos sur Twitter:

Sites amis