Developpez.com

Plus de 14 000 cours et tutoriels en informatique professionnelle à consulter, à télécharger ou à visionner en vidéo.

Comprendre les avantages et les inconvénients des Big Data

Ce que vous devez savoir sur les Big Data

Ce tutoriel identifie quelques domaines où les Big Data font déjà une différence et quelques domaines où ils feront, bientôt, une différence. Bien entendu, l'élément clé de ce tutoriel est de vous apprendre le potentiel énorme des Big Data qui est actuellement surestimé, et à court terme, massivement surévalué.

Ce tutoriel est inspiré du livre de Nate Silver, The Signal and the Noise, probablement le plus complet credo des Big Data créé ces dernières années — un livre que je recommande à tous les analystes de marché et acteurs du Big Data.

Commentez Donner une note à l'article (5)

Article lu   fois.

Les deux auteur et traducteur

Traducteur : Profil Pro

Liens sociaux

Viadeo Twitter Facebook Share on Google+   

I. Les succès des Big Data

Les Big Data ont eu un certain profil élevé et des succès impressionnants. Tesco, Target et Amazon, par exemple, ont utilisé les Big Data pour gagner des avantages compétitifs dans la vente au détail. Le projet Billion Prices Project du MIT a montré comment la surveillance des milliards de messages sur Internet peut être transformée en données physiques sur les prix des produits partout dans le monde. Peut-être l'exemple d'exploitation le plus fort des Big Data est la façon dont Google les utilisées pour vendre et cibler son public.

Dans son livre, Nate Silver mentionne comment l'utilisation massive des données, en informatique, a permis d'améliorer la qualité des prévisions météorologiques, en particulier au cours des vingt-cinq dernières années. Toutefois, Silver souligne également que la prévision météorologique est limitée quant à l'utilisation et à la précision lorsqu'elle est appliquée sur des dates plus éloignées de plus qu'une semaine. C'est une façon pour Silver, d'indiquer la puissance et les limites des Big Data.

Oui, il y a quelques succès des Big Data, mais vous remarquerez que les mêmes exemples que ceux qu'on vient de présenter reviennent couramment. C'est parce qu'ils sont relativement rares, même si des marques comme Amazon, Tesco et Google le font depuis plusieurs années.

II. Les succès des Big Data seront limités dans les cinq prochaines années

Il existe un large éventail de problèmes que les Big Data aborderont dans les prochaines années. Cependant, on dénote déjà des facteurs qui ralentiront leur développement. Ce sont notamment :

  • Un approvisionnement limité des données scientifiques et des personnes capables de travailler avec les Big Data. Dans un rapport écrit en 2011, McKinsey & Company's Business Technology, explique que : «  les États-Unis à eux seuls feront face à une pénurie de 140 000 à 190 000 personnes compétentes en analytiques profondes ainsi que 1.5 million de gestionnaires et d'analystes pour analyser les Big Data et pour prendre des décisions basées sur leur conclusion ».
  • La croissance des bruits perturbe le signal que les entreprises espèrent trouver dans les données. La position de Nate Silver sur la croissance massive des données est que : « la plupart de ces données ne sont que du bruit et le bruit augmente plus rapidement que le signal ».
  • Il y a un manque de modèles, ce qui rend les données moins utiles que cela pourrait l'être. Des personnes comme Chris Anderson, rédacteur en chef du magazine Wired ont affirmé que les Big Data vont se débarrasser de la nécessité de la théorie et même de la méthode scientifique. Toutefois, Silver montre que cette dernière justification est fausse et décrit celle-ci comme étant : « catégoriquement la mauvaise attitude ». Mais en attendant que les organisations réalisent que les hypothèses, les essais et l'expérimentation sont essentiels, les Big Data resteront limitées.

III. Les limites des Big Data à long terme

Il y a beaucoup de problèmes qui peuvent être résolus par la simple collecte de plus de données. Nate Silver illustre ce point avec les problèmes de prédiction des tremblements de terre. En dépit de toutes les sciences, les données et les modèles qui ont été relevés sur les prédictions de tremblements de terre, il n'y eut aucun progrès appréciable. Cela pourrait être dû à l'insuffisance des données ou au fait que les modèles sont incomplets et que le système est trop chaotique (au sens mathématique) pour le rendre apte à être modélisé au niveau des informations qui pourraient être réellement recueillies.

En ce qui concerne les entreprises, deux problèmes sont particulièrement pertinents pour les limitations des Big Data.

  1. Endogénéité. L'endogénéité fait référence à une boucle de retours d'informations dans un système. Dans les systèmes sociaux (tels que l'économie, la politique et la commercialisation) lorsqu'on découvre une loi, par exemple une thèse qui est vraie, celle-ci se vérifie de moins en moins. Les économistes ont découvert toutes sortes de règles sur l'économie expliquant l'inflation, la récession, etc. Cependant, quand les décideurs tentent d'utiliser ces règles, bien souvent, elles ne fonctionnent pas. Les personnes et les marchés sont aussi concernés par ce système de règles, ils en tiennent compte dans leurs réponses, changent ces règles. La citation d'Einstein qui dit que « aucun problème ne peut être résolu dans le même niveau de conscience qu'il a été créé » décrit ce genre de problème. Nous pouvons modéliser et prédire les fourmis ou les algues beaucoup mieux que nous pouvons modéliser et prédire les marchés.
  2. Le ratio des cas d'observations. Nate Silver illustre ce problème quand il explique l'une des raisons pour lesquelles la prévision des récessions économiques est si mauvaise. Les États-Unis ont eu onze récessions depuis la Seconde Guerre mondiale, mais il y a des millions d'indicateurs sociaux et économiques (le gouvernement américain suit 45 000 indicateurs économiques, là où les organisations privées en suivent jusqu'à quatre millions). Avec ce grand nombre d'indicateurs, la plupart des modèles vont être faux. Nous serions mieux (du point de vue des mathématiques) si nous avions onze indicateurs et des centaines de récessions.

IV. Quand les Big Data s'appliquent-elles ?

Les Big Data sont très utiles lorsqu'il y a une question précise et lorsque la logique des modèles peut être créée et testée. Aux USA, Target a posé la question suivante : « pouvons-nous déterminer si une cliente est enceinte ? » Le modèle produit était a) très prédictif et b) vous allez le trouver dans les pages du New York Times Magazine.

À la conférence MRS à Londres en 2013, Lucien Bowater, directeur des stratégies et des concepts chez BskyB a dit que lorsqu'on sait où creuser, les Big Data sont une bonne chose. Et donc, il utilise l'étude de marché pour lui dire où chercher et pour ses collaborateurs où creuser.

Dans le monde de la commercialisation et de l'étude de marché, l'incidence des Big Data va être de plus en plus profonde en reliant les points plutôt que de créer de nouvelles images complètes et dissociées.

V. Faire de la recherche avec les Big Data

Le rôle de l'étude de marché dans le futur va ressembler à celui de fournir un prisme pour les Big Data, montrant à la science des données où creuser, aidant ainsi à créer des hypothèses à tester et ajoutant un « pourquoi » au « quoi » des Big Data.

Dans le livre de Nate Silver, il illustre comment les personnes ayant cette vision commune travaillent ensemble à rendre les Big Data plus performantes ; performance meilleure que si on n'avait que d'un côté le concept de Big Data, et de l'autre la vision. Il montre que dans un jeu de base-ball où on utilise des systèmes de prédictions de performance comme son système PECOTA, on obtient de meilleurs résultats que si on avait juste le jeu de base-ball et un système de Big Data.

Chez Vision Critical, nous travaillons à intégrer, dans un schéma global, les travaux des communautés autour des Big Data. Dans une communauté, nous pouvons suivre les gens au fil du temps pour les aider à trouver des modèles, construire et tester les hypothèses et avoir des discussions avec les membres pour explorer les questionnements. Ce travail peut être interfacé avec les Big Data pour quantifier, valider et évaluer les connaissances dérivées en combinant la vision de la communauté avec les sources de données.

VI. Qu'est-ce que les acteurs du marché doivent faire ensuite ?

Les acteurs du marché doivent se familiariser avec les Big Data. Il va y avoir un certain succès, et nous voulons être impliqués dans ce dernier. De plus, en ignorant quelques théories de plusieurs « experts » disant que cela va être énorme, vous pouvez paraître stupide (même si vous êtes intelligent).

Ma prévision est qu'au cours des cinq prochaines années, la plupart des projets de Big Data (dans les domaines de ventes, du marketing et de la croissance de la marque) n'apporteront pas une contribution positive significative pour les équipes, les organisations et les entreprises avec leur mise en service.

Les projets qui vont porter des fruits sont typiquement ceux qui :

  1. Posent une question claire et bien définie ;
  2. Incluent un modèle testable, basé sur des hypothèses ;
  3. Utilisent des études de marché à la portée pour définir et interpréter les résultats et les processus.

Est-ce que les Big Data sont un grand gaspillage d'argent ou un mauvais investissement ? Pas nécessairement. Toutefois, pour que les projets Big Data soient significatifs, les chercheurs et les spécialistes du marketing ont besoin d'une approche stratégique qui consiste à écouter ce que les clients ont à dire.

Selon vous, quelle sera la prochaine étape en matière de Big Data ? N'hésitez pas à partager dans les commentaires.

VII. Remerciements

Toute l'équipe de Developpez.com remercie sincèrement Ray Poynter qui nous a aimablement permis de traduire et de publier son article sur notre site. Nous remercions aussi Danick d'avoir fait la traduction et Cédric et Jean-Philippe pour les corrections orthographiques.

Vous avez aimé ce tutoriel ? Alors partagez-le en cliquant sur les boutons suivants : Viadeo Twitter Facebook Share on Google+   

  

Les sources présentées sur cette page sont libres de droits et vous pouvez les utiliser à votre convenance. Par contre, la page de présentation constitue une œuvre intellectuelle protégée par les droits d'auteur. Copyright © 2016 Ray Poynter. Aucune reproduction, même partielle, ne peut être faite de ce site et de l'ensemble de son contenu : textes, documents, images, etc. sans l'autorisation expresse de l'auteur. Sinon vous encourez selon la loi jusqu'à trois ans de prison et jusqu'à 300 000 € de dommages et intérêts.