• AgoraVox sur Twitter
  • RSS
  • Agoravox TV
  • Agoravox Mobile

Accueil du site > Tribune Libre > Le monde nouveau du BIG DATA

Le monde nouveau du BIG DATA

En mai dernier, j’ai publié un article Big Data et émergence de « Real Humans ». Je reprend et prolonge mes réflexions sur ce thème clé, ceci à partir de la lecture du livre de Viktor Mayer-Schönberger et Kenneth Cukie, paru en 2013 et consacré à ce sujet, « Big Data : A Revolution That Will Transform How We Live, Work, and Think ».

LE TOUT NUMÉRIQUE

Quelques rappels tout d’abord sur la dimension de ce qui se produit depuis une dizaine d’années, c’est-à-dire très peu de temps :

« En 2007 seulement sept pour cent des données sont analogiques (documents, livres, photographies imprimées, etc.). Le reste était numérique. (…) Aussi récemment qu’en 2000, seulement un quart de l’information archivée dans le monde était numérique. Les autres trois-quarts étaient sur support papier, film, disque vinyle, bande magnétique,… (…) En 2013, la quantité d’information stockée dans le monde est estimée autour de 1200 exaoctets, et que moins de 2 pour cent n’est pas numérique. »

« La quantité d’information archivée croît quatre fois plus vite que l’économie mondiale, pendant que la puissance de traitement informatique croît neuf fois plus vite. »

« Ceci s’étend maintenant aux données, qui deviennent un actif des entreprises, une contribution économique vitale, et le fondement de nouveaux modèles de business. C’est le pétrole de l’économie de l’information. Bien que les données ne soient que rarement enregistrées dans les bilans, ce n’est probablement qu’une question de temps. »

Dans leur livre, ils parlent de « datafication », c’est-à-dire du processus actuel qui tend à tout numériser, non plus seulement les écrits, mais les localisations, les actes individuels, voire l’empreinte de notre corps sur le siège d’une voiture :

« Koshimizu et son équipe convertissent le dos en données en mesurant avec des capteurs la pression en 360 différents points d’un siège de voiture, et en indexant chaque point sur une échelle de zéro à 256. Le résultat est un code digital unique pour chaque individu. Dans l’essai, le système peut distinguer au sein d’une poignée de personnes avec 98% de fiabilité. La recherche n’est pas stupide. La technologie est développée comme système antivol pour les voitures. Un véhicule ainsi équipé reconnaîtrait quand un conducteur illicite serait au volant et demanderait un mot de passe pour continuer la conduite ou peut-être couper le moteur. »

Ainsi, nous entrons dans un monde où l’information numérique sera omniprésente, et cela ouvre « une perspective sur la réalité que nous n’avons jamais eu avant. »

TOUT CHANGE

L’émergence du Big Data n’est pas seulement une affaire de quantité. Elle se traduit par des transformations multiples.

Dans leur livre, Viktor Mayer-Schönberger et Kenneth Cukie en identifient trois :

- La possibilité d’analyser des quantités de données croissantes : non seulement nous pouvons stocker sans cesse davantage, mais nous pouvons les traiter massivement,

- L’acceptation de l’approximation et du désordre, car l’abondance des données rend moins nécessaire l’exactitude : « Quand la donnée était rare, chaque donnée élémentaire était critique, aussi il fallait faire attention pour ne pas créer de biais dans l’analyse. Aujourd’hui nous ne vivons plus dans une situation de manque d’informations. Ayant affaire à des ensembles de données de plus en plus complets, qui captent non plus seulement une petite tranche d’un phénomène à portée de main, mais beaucoup plus, voire tout, nous n’avons plus à nous soucier autant que des données élémentaires biaisent l’analyse globale. »

- La recherche des corrélations plutôt des causalités  : « Dans le monde du Small Data, montrer que des intuitions de causalité sont fausses prend du temps. C’est en train de changer. Dans le futur, des corrélations issues du Big Data seront utilisées pour réfuter des intuitions de causalité, en montrant que souvent il n’y a rien qu’une relation statistique entre l’effet et la cause supposée. » (1)

Autre différence majeure avec le monde des choses matérielles, le fait de se servir des données ne les épuise pas : « La valeur des données ne diminue pas quand on s’en sert. Elles peuvent être traitées encore et encore. L’information est ce que les économistes appellent un bien « sans rivalité » : l’utilisation par une personne n’empêche un autre de s’en servir. »

Au contraire, plus on s’en sert, plus de nouvelles idées naissent et de nouvelles valorisations aussi. Mais ceci n’est pas sans poser des problèmes…

ALERTE VIE PRIVÉE !

Ce monde du Big Data pose aussi de nouvelles questions.

D’abord une « simple » : comment protéger la vie privée quand tout est progressivement numérisé, quand tout est stocké, et que tout peut être traité ?

Peut-on simplement refuser de voir ses données archivées ? Certes, oui, mais quand il deviendra de plus en plus courant de tout voir être archivé, le refuser deviendra suspect…

A défaut de refuser, je peux demander à ce que mes données soient anonymes. Mais si elles sont très nombreuses et précises, ce sera facile par des recoupements, de savoir à qui elles appartiennent. Un peu comme dans l’histoire où l’on ne donne pas le nom de la personne, mais on la désigne en disant que c’est elle qui se tient appuyée contre la porte du fond…

Mais il y a plus : puisqu’il est impossible de savoir à quoi telle information pourra être utilisée dans le futur, comment pourrais-je donner aujourd’hui une autorisation pour des usages à venir inconnus ?

Ceci en revient à de fait paralyser toutes les protections de la vie privée : « Comment des entreprises pourraient-elles prévenir au nom d’un objectif qui n’existe pas encore ? Comment des individus pourraient-ils être donner une autorisation pour ce qui est inconnu ? Aussi en absence d’autorisation, toute analyse Big Data portant sur des données personnelles pourrait impliquer un retour vers chaque individu, pour lui demander la permission pour chaque réutilisation. (…) A l’ère du Big Data, les trois stratégies essentielles longtemps utilisées pour garantir la préservation de la vie privée – notification et autorisation individuelle, possibilité de retrait, et anonymisation – ont perdu beaucoup de leur efficacité. »

Le monde du Big Data suppose l’invention de nouvelles règles et d’un nouveau droit. Il va devenir de plus en plus urgent de les inventer…

ANTICIPER OU SUBIR ?

Les problèmes liés à la vie privée ne vont pas porter que sur les droits d’utilisation de nos données, ainsi que de leur utilisation. Ils vont aussi être liés à une autre menace : si une analyse de mes données montre que je vais très probablement commettre un acte délictueux, faut-il ou non agir ?

C’était le thème central du film Minority Report de Steven Spielberg où l’on arrête quelqu’un, non pas parce qu’il a commis un délit, mais parce qu’il allait le commettre.

Ce qui n’était que de la science fiction, n’en sera bientôt plus : nous n’aurons pas besoin comme dans le film de femmes mutantes capables de prévoir le futur, nous aurons des analyses de données qui nous le permettront.

Alors que faire ?

« Si grâce au Big Data, nous prévoyons qui pourrait commettre un crime à venir, nous pourrons ne pas nous contenter de simplement empêcher le crime d’arriver. Nous serons enclins à vouloir punir aussi son auteur probable. C’est simplement logique. Si nous nous contentons d’intervenir pour interdire à l’acte illicite d’avoir lieu, son auteur potentiel pourrait essayer à nouveau en toute impunité. A l’opposé, en utilisant le Big Data pour le tenir responsable de ses (futurs) actes, nous pouvons le dissuader lui et d’autres. (…) De telles mesures préventives restreignent notre liberté, mais beaucoup les verront comme un petit prix à payer pour éviter en retour des dommages plus graves. Dans de nombreux cas, l’analyse des données est déjà utilisée au nom de la prévention. (…) La promesse du Big Data est que nous faisons depuis longtemps – profilage – mais beaucoup mieux, de façon moins discriminatoire, et plus individualisée. Cela semble acceptable si nous utilisons les prévisions Big Data pour empêcher des actions non voulus. Mais cela devient plus dangereux si nous utilisons des prévisions Big Data pour décider si quelqu’un est coupable et doit être puni de ce qui n’est pas encore arrivé. »

Vaste débat qu’il va falloir trancher. Les comités éthiques ont du travail sur la planche…

DES SYSTÈMES COLLECTIFS À REBÂTIR

Dans sa nouvelle « Funes ou la mémoire », Jorge Luis Borges montrait que, sans la capacité d’oublier, la vie devenait impossible.

« En effet, non seulement Funes se rappelait chaque feuille de chaque arbre de chaque bois, mais chacune des fois qu'il l'avait vue ou imaginée. (…) Non seulement il lui était difficile de comprendre que le symbole générique chien embrassât tant d'individus dissemblables et de formes diverses ; cela le gênait que le chien de trois heures quatorze (vu de profil) eût le même nom que le chien de trois heures un quart (vu de face). (…) Il avait appris sans effort l'anglais, le français, le portugais, le latin. Je soupçonne cependant qu'il n'était pas très capable de penser. Penser c'est oublier des différences, c'est généraliser, abstraire. Dans le monde surchargé de Funes il n'y avait que des détails, presque immédiats. »

Avec le Big Data, nous risquons de perdre le droit à l’oubli. C’est déjà en débat avec Facebook et Google. Mais quand demain, les lieux où seront archivés tous nos actes seront multiples, comme le garantir ?

Un sujet de plus pour les comités éthiques…

Faut-il au nom de tout cela enrayer l’avènement du Big Data ?

Certainement pas ! Mais comme la mondialisation des activités économiques a mis à mal nos organisations politiques, le Big Data va mettre à mal nos systèmes éthiques et de protection individuelle.

Il devient donc urgent de bâtir des réponses à ces deux défis qui vont aller de plus en plus de pair !

(1) Attention, le monde du Big Data n’est pas non plus un monde sans hypothèses préalables : « Le Big Data est lui-même une théorie. Par exemple, il emploie des théories statistiques et mathématiques, et parfois aussi de la théorie informatique. (…) De plus, parce que le Big Data repose sur des théories, nous ne pouvons nous en extraire. Elles conditionnent à la fois les méthodes et les résultats. Cela commence avec la façon de choisir les données. »


Moyenne des avis sur cet article :  4/5   (4 votes)




Réagissez à l'article

2 réactions à cet article    


  • Piotrek Piotrek 30 septembre 2014 00:19

    Quelques remarques car vous évoquez de multiples concepts :

    - Le Big Data, c’est la collection d’évènements insignifiants ou moins objectifs en espérant en tirer un bénéfice significatif, ou un nouvel objectif.
    Ca me fait penser immédiatement à l’article sur le self-scanning d’aujourd’hui. On ne va pas considérer uniquement ce que le client scanne : on va aussi compter le temps entre les scans pour esperer cartographier le parcours dans le magasin, on va considérer les articles annulés que ceux qui sont effectivement achetés... etc

    - L’autre chose que vous évoquez c’est le croisement de données, qui n’est pas directement lié au Big Data (chaque acteur économique décidant de la masse de données à collecter dans son propre champ de possibilité) car le partage de données ne se fait (actuellement) qu’au cas par cas.

    - Enfin le problème c’est que plus on amasse des données, plus on a de chance d’obtenir des corélations farfelues. Il existe un site qui s’amuse à resencer ces corélations http://www.tylervigen.com/. La dernière en date : Il existe une relation presque parfaite entre les dépenses des Etats-Unis pour les technologies, l’aérospatiale avec le nombre de morts par étouffement...

    Donc je pense que pour éviter un 1984 ou un monde minority report, il ne faut pas se concentrer sur la surveillance des moyens de collection mais plutôt sur les objectifs de la collection. Facebook aurait nettement moins de succès si il affichait ses objectif plutôt que ses moyens comme c’est le cas actuellement.

    Le droit à l’oubli n’est que le moyen du pauvrement renseigné, de celui qui n’avaient pas conscience du pouvoir des données.

    Bon article


    • Hervé Hum Hervé Hum 1er octobre 2014 00:05

      Je suis toujours aussi surpris, pour ne pas dire plus, de voir que le plus important n’est pas abordé.

      A savoir qui contrôle ce big data !

      Dire que celui ci permettra d’arrêter un criminel avant qu’il n’agisse est une plaisanterie, par contre, dire que big data permet d’arrêter un activiste politique avant qu’il ne prenne de l’importance est très sérieux.

      Bref, vous passez complètement à coté de ce qu’il faut dire de big data et de sa menace où les moyens pour la prévenir consiste à la rendre totalement transparente dans son fonctionnement.

      Protéger la vie privé ne consiste certainement pas à maintenir l’opacité autour de la collecte et du traitement des données, mais bien au contraire à la rendre totalement publique de telle manière qu’aucune personne ou groupe d’intérêts ne puisse plus se servir de l’anonymat pour manipuler et exécuter tout ennemis à leur intérêts.

      Quoiqu’il en soit, passé un certain seuil, je ne crois pas que le contrôle seul du big data soit suffisant pour un pouvoir arbitraire défendant ses seuls intérêts particuliers, il faut aussi pouvoir contrôler le contenu de l’information véhiculé, c’est à dire avoir une capacité de réaction immédiate sans laquelle le contrôle du big data ne servirait à rien.

      Le big data n’a d’intérêt qu’à des fins politique pour maitriser la société. Dans une démocratie, son contrôle est totalement transparent, dans une dictature il est totalement opaque.

      Quid de son contrôle actuel ?

      voilà bien la seule question qui doit être posé au niveau éthique, le reste n’est que de la diversion.

      Dites, vous travaillez pour qui ? Pour quel projet . ?

      vous écrivez oeuvrer au sein du mouvement « nous citoyens », je me demande bien de quel types de citoyens vous parlez ???

Ajouter une réaction

Pour réagir, identifiez-vous avec votre login / mot de passe, en haut à droite de cette page

Si vous n'avez pas de login / mot de passe, vous devez vous inscrire ici.


FAIRE UN DON






Les thématiques de l'article


Palmarès