Blog

Qu’y-a-t-il dans la boite noire ? Pourquoi les données Bidstream ne sont pas des sources d’intention fiable

« Des milliards de signaux… » C’est ce que promettent généralement les fournisseurs de données qui s’engagent sur la détection d’intention. Ces dernières années, on a ainsi assisté à une prolifération de solutions offrant des données de ce type. La plupart s’appuient, sans trop de détails, sur des outils qui leur permettraient de surveiller, en temps réel, des centaines de milliers de sites web pour en extraire des signaux qui sensés vous aider à déterminer où cibler vos opérations commerciales et marketing.
Cette approche en forme de « boîte noire » appliquée aux données d’intention a surtout permis à tout le monde de s’exonérer de toute préoccupation en matière de fuites ou de confidentialité des données. Mais les évolutions récentes dans ces domaines montrent que la fête est bientôt finie ! Elles remettent largement en question la durabilité des méthodes de scraping des sites web – ces remontées sauvages d’information – et leur capacité à offrir une valeur ajoutée.

Le problème de l’approvisionnement en données Bidstream

En effet comment une entreprise « surveille-t-elle » les sites web qui ne lui appartiennent pas ou avec lesquels elle n’a pas de relations ? Il est relativement simple d’explorer des sites web et l’utilisation de modules d’IA peut même faire une partie du travail de classification des pages web. Mais l’exploration d’une page web ne vous dit rien de très précis sur qui l’a visitée. Les moyens de faire correspondre un contenu pertinent avec un lecteur du site sont limités : aucun d’entre eux n’atteint le niveau de l’utilisateur individuel.

Une façon courante de le faire consiste donc à utiliser des données provenant de campagnes publicitaires programmatiques, les données Bidstream. Le processus d’appel d’offres en temps réel qui permet de proposer une impression programmatique à plusieurs annonceurs potentiels expose certaines informations (la recherche, la page d’origine, la nature du visiteur…) non seulement au propriétaire de l’impression publicitaire gagnante, mais aussi à toute partie qui a concouru à l’enchère sur l’inventaire. Les entreprises mettent en place des enchères publicitaires pour « observer l’inventaire » sans intention d’acheter l’emplacement publicitaire mais simplement pour utiliser les données induites et, au final, récolter des informations sur l’audience des sites.
Bien que cette approche ne repose pas sur les cookies, elle soulève de la même manière des questions embarrassantes sur l’utilisation non autorisée des données au moment même où ceux-ci sont progressivement supprimés. En aout dernier, les autorités américaines ont ainsi demandé à la FTC d’enquêter pour savoir si, l’utilisation de données exposer à l’occasion d’enchères programmatique pour saisir et vendre des informations personnelles aux consommateurs, enfreignait les lois fédérales interdisant les pratiques commerciales trompeuses.

Dans un autre domaine, au début de l’été, la Business Publishers’ Association a publié une lettre ouverte de certains des plus grands fournisseurs d’informations du secteur B2B, appelant l’écosystème de la publicité numérique à mettre un terme aux fuites de données dans le « bidstream » programmatique. TechTarget a volontiers adhéré à cette initiative car elle reflétait une réalité que nous connaissons depuis longtemps : les éditeurs qui permettent que leurs pages fassent l’objet d’enchères programmatiques transmettent involontairement des données d’audience précieuses à des entreprises qui les utilisent pour créer des produits dérivés qui leur font concurrence. De notre côté nous avons choisi de ne pas participer à ces échanges programmatiques afin de protéger nos données d’audience – et d’autres fournisseurs d’informations technologiques clés en font maintenant de même, réduisant encore les perspectives d’obtenir des données de qualité en passant par ces flux.

Autres approches utilisées pour récolter des données d’audience auxquelles vous devriez prêter attention

Les données de masse ne sont pas la seule approche utilisée pour récolter des détails d’audience. Les outils web qui permettent le partage de contenu, l’analyse ou d’autres fonctionnalités proposaient par vos sites capturent souvent les données de visite des utilisateurs. Ils créent ainsi des ensembles de données qui peuvent être exploitées, toujours dans le cadre de « boites noires » à signaux, comme sources d’intention. La collecte d’audience clandestine par des widgets web n’est pas souvent évoquée, mais c’est le prochain point de discussion sur la protection de la vie privée. Les mêmes fournisseurs d’informations qui ne veulent pas que leurs données d’audience soient compromises par des fuites de données de masse commencent également à s’intéresser à cette question. Les sources de données de qualité ne devraient jamais exposer pas leurs actifs gratuitement.

Toutes les intentions ne sont pas égales – assurez-vous de connaître vos sources

La plateforme de TechTarget pour la détection des intentions d’achat ne repose pas sur des données extraites du web, mais sur l’activité réelle et observée des acheteurs ayant opté pour la solution, à travers le réseau de plus de 140 sites que nous possédons et gérons. Mais toutes les intentions ne sont pas égales – de nombreux fournisseurs ne seront pas aussi transparents avec vous sur l’origine de l’intention qu’ils vous fournissent et ils ne seront pas en mesure d’articuler clairement la valeur qui y est prétendument intégrée.
Les récents développements autour de l’extraction et de l’agrégation de données montrent clairement que l’approche « boîte noire » sur les données d’intention est de plus en plus suspectée. Assurez-vous que vous posez les bonnes questions à vos fournisseurs de données d’intentions et que vous êtes capable de bien évaluer la qualité des signaux et des données que vous recevez.

 

Plus d’articles sur