Google : L’apprentissage automatique s’occupe du spam le plus évident

Maintenance Hébergement Sécurité et développement de Wordpress

Lors du dernier podcast Search Off The Record, John Mueller, Gary Illyes et Martin Splitt ont reçu un invité spécial de l’équipe chargée de la qualité des recherches chez Google, Duy Nguyen. Ce dernier a déclaré que Google avait mis au point un “modèle d’apprentissage automatique très efficace et complet qui a permis d’éliminer la plupart des spams évidents”

Il a déclaré que ce modèle d’apprentissage automatique s’occupe de la plupart des spams, ce qui permet à son équipe de passer plus de temps à “se concentrer sur des travaux plus importants” Il a ajouté que le modèle d’apprentissage automatique pour le spam “s’est essentiellement chargé de toutes les tâches lourdes” pour s’attaquer à ce spam le plus évident.

À environ 3:45 minutes, voici ce que Duy Nguyen a dit :

Donc, pour un contenu de si faible qualité ou du spam, c’est relativement facile. Si vous êtes une personne et que vous regardez une page qui est pleine de charabia, ou dans ce cas, des livres d’or avec des posts spammy, vous devriez être capable de dire catégoriquement, “Oui, c’est du spam”, en quelques secondes. Même si c’est plus compliqué, avec un œil exercé, cela devrait prendre moins d’une minute pour déterminer si quelque chose est du spam ou non. Et en tant que Google, nous disposons de tous ces signaux et de toutes ces données que nous avons accumulés, analysés et étudiés au fil des ans. Il est donc tout à fait possible de collecter ces données pour les étudier et construire des modèles d’apprentissage automatique pour lutter contre le spam.

Les modèles d’apprentissage automatique sont intéressants car ils ont de nombreux cas d’utilisation. Il vous recommande de la musique, vous lui faites suffisamment confiance pour conduire des voitures afin que vous n’ayez pas à conduire. Construire des modèles d’apprentissage automatique pour les spams s’avère donc être une étape assez naturelle pour nous.

Donc, oui, nous avons tellement de données autour, non seulement des résultats de recherche, mais surtout des spams. Nous avons donc pu construire un modèle d’apprentissage automatique très efficace et complet qui s’est occupé de la plupart des spams évidents. Il s’est chargé de tout le travail lourd pour que nous puissions nous concentrer sur des tâches plus importantes.

Voici l’audio :

Je me demande comment les deux mises à jour de spam de la semaine dernière sont liées à cela – s’agissait-il de mettre à jour le modèle d’apprentissage automatique ou de quelque chose de nouveau ?

Autres sujets sur le spam

Plus tard dans le podcast, Duy Nguyen a déclaré que le spam piraté est toujours un problème pour l’écosystème, et que de nombreux sites utilisent des plateformes obsolètes et sont des cibles faciles. Le spam piraté que l’on voit aujourd’hui n’est pas vraiment du piratage, il s’agit plutôt de failles faciles. Vous pouvez vous inscrire à la Google Search Console pour vous aider si vous êtes préoccupé par des problèmes de spam pirate, Google vous informera lorsqu’il sera détecté.

Duy Nguyen a déclaré qu’une des choses qui l’empêchent de dormir la nuit sont les escroqueries en ligne, comme le spam du support client de Gmail. Google travaille dur sur ce sujet mais l’éducation des consommateurs est importante.

Ils ont ensuite évoqué le fait qu’il ne faut pas copier les spammeurs juste parce qu’ils sont bien classés, le spam n’est probablement pas la raison. De plus, Duy Nguyen a dit qu’il détestait voir les webmasters se concentrer sur des mesures externes (il ne l’a pas mentionné mais je soupçonne le DA) et se concentrer sur l’amélioration de ces mesures au lieu de prendre le temps de penser à l’ensemble du site. Ne vous concentrez pas sur une seule chose, un seul facteur, ne vous concentrez pas sur les signaux externes.

Discussion du forum sur Twitter.