Le monde nouveau du BIG DATA
En mai dernier, j’ai publié un article Big Data et émergence de « Real Humans ». Je reprend et prolonge mes réflexions sur ce thème clé, ceci à partir de la lecture du livre de Viktor Mayer-Schönberger et Kenneth Cukie, paru en 2013 et consacré à ce sujet, « Big Data : A Revolution That Will Transform How We Live, Work, and Think ».

LE TOUT NUMÉRIQUE
Quelques rappels tout d’abord sur la dimension de ce qui se produit depuis une dizaine d’années, c’est-à-dire très peu de temps :
« En 2007 seulement sept pour cent des données sont analogiques (documents, livres, photographies imprimées, etc.). Le reste était numérique. (…) Aussi récemment qu’en 2000, seulement un quart de l’information archivée dans le monde était numérique. Les autres trois-quarts étaient sur support papier, film, disque vinyle, bande magnétique,… (…) En 2013, la quantité d’information stockée dans le monde est estimée autour de 1200 exaoctets, et que moins de 2 pour cent n’est pas numérique. »
« La quantité d’information archivée croît quatre fois plus vite que l’économie mondiale, pendant que la puissance de traitement informatique croît neuf fois plus vite. »
« Ceci s’étend maintenant aux données, qui deviennent un actif des entreprises, une contribution économique vitale, et le fondement de nouveaux modèles de business. C’est le pétrole de l’économie de l’information. Bien que les données ne soient que rarement enregistrées dans les bilans, ce n’est probablement qu’une question de temps. »
Dans leur livre, ils parlent de « datafication », c’est-à-dire du processus actuel qui tend à tout numériser, non plus seulement les écrits, mais les localisations, les actes individuels, voire l’empreinte de notre corps sur le siège d’une voiture :
« Koshimizu et son équipe convertissent le dos en données en mesurant avec des capteurs la pression en 360 différents points d’un siège de voiture, et en indexant chaque point sur une échelle de zéro à 256. Le résultat est un code digital unique pour chaque individu. Dans l’essai, le système peut distinguer au sein d’une poignée de personnes avec 98% de fiabilité. La recherche n’est pas stupide. La technologie est développée comme système antivol pour les voitures. Un véhicule ainsi équipé reconnaîtrait quand un conducteur illicite serait au volant et demanderait un mot de passe pour continuer la conduite ou peut-être couper le moteur. »
Ainsi, nous entrons dans un monde où l’information numérique sera omniprésente, et cela ouvre « une perspective sur la réalité que nous n’avons jamais eu avant. »
TOUT CHANGE
L’émergence du Big Data n’est pas seulement une affaire de quantité. Elle se traduit par des transformations multiples.
Dans leur livre, Viktor Mayer-Schönberger et Kenneth Cukie en identifient trois :
- La possibilité d’analyser des quantités de données croissantes : non seulement nous pouvons stocker sans cesse davantage, mais nous pouvons les traiter massivement,
- L’acceptation de l’approximation et du désordre, car l’abondance des données rend moins nécessaire l’exactitude : « Quand la donnée était rare, chaque donnée élémentaire était critique, aussi il fallait faire attention pour ne pas créer de biais dans l’analyse. Aujourd’hui nous ne vivons plus dans une situation de manque d’informations. Ayant affaire à des ensembles de données de plus en plus complets, qui captent non plus seulement une petite tranche d’un phénomène à portée de main, mais beaucoup plus, voire tout, nous n’avons plus à nous soucier autant que des données élémentaires biaisent l’analyse globale. »
- La recherche des corrélations plutôt des causalités : « Dans le monde du Small Data, montrer que des intuitions de causalité sont fausses prend du temps. C’est en train de changer. Dans le futur, des corrélations issues du Big Data seront utilisées pour réfuter des intuitions de causalité, en montrant que souvent il n’y a rien qu’une relation statistique entre l’effet et la cause supposée. » (1)
Autre différence majeure avec le monde des choses matérielles, le fait de se servir des données ne les épuise pas : « La valeur des données ne diminue pas quand on s’en sert. Elles peuvent être traitées encore et encore. L’information est ce que les économistes appellent un bien « sans rivalité » : l’utilisation par une personne n’empêche un autre de s’en servir. »
Au contraire, plus on s’en sert, plus de nouvelles idées naissent et de nouvelles valorisations aussi. Mais ceci n’est pas sans poser des problèmes…
ALERTE VIE PRIVÉE !
Ce monde du Big Data pose aussi de nouvelles questions.
D’abord une « simple » : comment protéger la vie privée quand tout est progressivement numérisé, quand tout est stocké, et que tout peut être traité ?
Peut-on simplement refuser de voir ses données archivées ? Certes, oui, mais quand il deviendra de plus en plus courant de tout voir être archivé, le refuser deviendra suspect…
A défaut de refuser, je peux demander à ce que mes données soient anonymes. Mais si elles sont très nombreuses et précises, ce sera facile par des recoupements, de savoir à qui elles appartiennent. Un peu comme dans l’histoire où l’on ne donne pas le nom de la personne, mais on la désigne en disant que c’est elle qui se tient appuyée contre la porte du fond…
Mais il y a plus : puisqu’il est impossible de savoir à quoi telle information pourra être utilisée dans le futur, comment pourrais-je donner aujourd’hui une autorisation pour des usages à venir inconnus ?
Ceci en revient à de fait paralyser toutes les protections de la vie privée : « Comment des entreprises pourraient-elles prévenir au nom d’un objectif qui n’existe pas encore ? Comment des individus pourraient-ils être donner une autorisation pour ce qui est inconnu ? Aussi en absence d’autorisation, toute analyse Big Data portant sur des données personnelles pourrait impliquer un retour vers chaque individu, pour lui demander la permission pour chaque réutilisation. (…) A l’ère du Big Data, les trois stratégies essentielles longtemps utilisées pour garantir la préservation de la vie privée – notification et autorisation individuelle, possibilité de retrait, et anonymisation – ont perdu beaucoup de leur efficacité. »
Le monde du Big Data suppose l’invention de nouvelles règles et d’un nouveau droit. Il va devenir de plus en plus urgent de les inventer…
ANTICIPER OU SUBIR ?
Les problèmes liés à la vie privée ne vont pas porter que sur les droits d’utilisation de nos données, ainsi que de leur utilisation. Ils vont aussi être liés à une autre menace : si une analyse de mes données montre que je vais très probablement commettre un acte délictueux, faut-il ou non agir ?
C’était le thème central du film Minority Report de Steven Spielberg où l’on arrête quelqu’un, non pas parce qu’il a commis un délit, mais parce qu’il allait le commettre.
Ce qui n’était que de la science fiction, n’en sera bientôt plus : nous n’aurons pas besoin comme dans le film de femmes mutantes capables de prévoir le futur, nous aurons des analyses de données qui nous le permettront.
Alors que faire ?
« Si grâce au Big Data, nous prévoyons qui pourrait commettre un crime à venir, nous pourrons ne pas nous contenter de simplement empêcher le crime d’arriver. Nous serons enclins à vouloir punir aussi son auteur probable. C’est simplement logique. Si nous nous contentons d’intervenir pour interdire à l’acte illicite d’avoir lieu, son auteur potentiel pourrait essayer à nouveau en toute impunité. A l’opposé, en utilisant le Big Data pour le tenir responsable de ses (futurs) actes, nous pouvons le dissuader lui et d’autres. (…) De telles mesures préventives restreignent notre liberté, mais beaucoup les verront comme un petit prix à payer pour éviter en retour des dommages plus graves. Dans de nombreux cas, l’analyse des données est déjà utilisée au nom de la prévention. (…) La promesse du Big Data est que nous faisons depuis longtemps – profilage – mais beaucoup mieux, de façon moins discriminatoire, et plus individualisée. Cela semble acceptable si nous utilisons les prévisions Big Data pour empêcher des actions non voulus. Mais cela devient plus dangereux si nous utilisons des prévisions Big Data pour décider si quelqu’un est coupable et doit être puni de ce qui n’est pas encore arrivé. »
Vaste débat qu’il va falloir trancher. Les comités éthiques ont du travail sur la planche…
DES SYSTÈMES COLLECTIFS À REBÂTIR
Dans sa nouvelle « Funes ou la mémoire », Jorge Luis Borges montrait que, sans la capacité d’oublier, la vie devenait impossible.
« En effet, non seulement Funes se rappelait chaque feuille de chaque arbre de chaque bois, mais chacune des fois qu'il l'avait vue ou imaginée. (…) Non seulement il lui était difficile de comprendre que le symbole générique chien embrassât tant d'individus dissemblables et de formes diverses ; cela le gênait que le chien de trois heures quatorze (vu de profil) eût le même nom que le chien de trois heures un quart (vu de face). (…) Il avait appris sans effort l'anglais, le français, le portugais, le latin. Je soupçonne cependant qu'il n'était pas très capable de penser. Penser c'est oublier des différences, c'est généraliser, abstraire. Dans le monde surchargé de Funes il n'y avait que des détails, presque immédiats. »
Avec le Big Data, nous risquons de perdre le droit à l’oubli. C’est déjà en débat avec Facebook et Google. Mais quand demain, les lieux où seront archivés tous nos actes seront multiples, comme le garantir ?
Un sujet de plus pour les comités éthiques…
Faut-il au nom de tout cela enrayer l’avènement du Big Data ?
Certainement pas ! Mais comme la mondialisation des activités économiques a mis à mal nos organisations politiques, le Big Data va mettre à mal nos systèmes éthiques et de protection individuelle.
Il devient donc urgent de bâtir des réponses à ces deux défis qui vont aller de plus en plus de pair !
(1) Attention, le monde du Big Data n’est pas non plus un monde sans hypothèses préalables : « Le Big Data est lui-même une théorie. Par exemple, il emploie des théories statistiques et mathématiques, et parfois aussi de la théorie informatique. (…) De plus, parce que le Big Data repose sur des théories, nous ne pouvons nous en extraire. Elles conditionnent à la fois les méthodes et les résultats. Cela commence avec la façon de choisir les données. »
2 réactions à cet article
Ajouter une réaction
Pour réagir, identifiez-vous avec votre login / mot de passe, en haut à droite de cette page
Si vous n'avez pas de login / mot de passe, vous devez vous inscrire ici.
FAIRE UN DON