Web : Les plagiaires y errent
Le journal Le Monde publiait il y a quelques jours un article intitulé « Une arme informatique contre le plagiat mise au point par une société savoyarde ». Cette société, Six Degrés, commercialise en effet un service Web appelé Compilatio.net (compilatio voulait dire pillage, et par extension plagiat en latin), qui permet d’analyser des travaux d’étudiants douteux (les travaux, pas les étudiants, encore que...). Le principe est simple : on s’abonne et ensuite on peut soumettre des textes à analyser, pour la modique somme de 0,29 € HT (ça doit faire dans les 0,35 TTC) à chaque fois. L’Université de Savoie et quelques autres écoles auraient déjà souscrit.

Il faut reconnaître que la pratique du copier-coller
est devenue quelque peu inquiétante. Je la constate tous les jours chez mes étudiants... Demandez n’importe quoi, un rapport sur l’explosion des SMS en Moldavie, la synthèse de la parole dans les machines à coudre, les langues de la planète Mars, et vous aurez immédiatement des dizaines de rapports superbement mis en page, avec photos, figures et couleurs ad nauseam, mais dont le texte oscille entre des passages fastidieux avec orthographe approximative (« Nous allons consacré la première partie de ce rapport... ») et des passages parfaitement écrits, avec des mots compliqués, des figures de style et tout et tout — dans une espèce de patchwork à la rhétorique obscure.
Bien sûr, il suffit de copier un passage ou deux dans Google Yahoo pour en trouver immédiatement la provenance... C’est en gros ce que fait Compilatio.net, en systématisant la méthode. Le site Compilatio.net est remarquablement silencieux sur les aspects techniques —secrets de fabrique, je présume— mais l’un des auteurs, Frédéric Agnès, a accepté de me donner quelques infos. Le texte est tronçonné en segments d’une dizaine de mots, qui sont comparés avec une base de données de documents : Compilatio.net
possède son propre crawler, qui n’indexe pas tout le web, mais certains sites ciblés. La comparaison est complétée par un envoi de requêtes auprès de métamoteurs. Compilatio.net retrouve non seulement les URL d’où ont été extraits les fragments plagiés, mais donne aussi un coloriage du texte et des originaux qui montre les fragments copiés.
J’avoue que j’étais un peu sceptique sur l’efficacité de la technique. J’ai voulu en avoir le coeur.net et j’ai donc soumis un texte que j’ai fabriqué pour la circonstance (on a droit à deux essais gratuits). J’ai collé ensemble dix extraits de textes pris sur le Web : blogs, articles scientfiques, extraits de Wikipedia, rapports (Cemagref, Insee). Du HTML et du pdf. J’ai même été un peu vache : les rapports en question font plus de 60 pages et j’ai pris un bout à la fin, me disant que les métamoteurs interrogés n’en indexent peut-être qu’une partie... Ca m’a fait un texte bidon de trois pages, que j’ai soumis à Compilatio.net. Il a fallu trois à quatre minutes pour que j’aie ma réponse. Oui, le texte était suspect !

L’analyse détaillée des résultats m’a épaté. Le système a retrouvé 8 extraits sur dix. Il fournit les URL et colorie les passages incriminés. Un clic, et on est sur l’original, lui aussi colorié. Les extraits en fin des gros rapports Cemagref et Insee ont bien été repérés. Les deux extraits qui n’ont pas été identifiés sont deux paragraphes de blogs (AixTal, MissTICS). Ils sont pourtant indexés dans Google et Yahoo.

Vraiment pas mal, donc, du point de vue technique. Il existe déjà des systèmes analogues pour l’anglais (par exemple Plagiarism, TurnItIn ou Eve), mais il faut saluer la prouesse, d’autant que le système est très ergonomique et simple à utiliser. J’avais trouvé un seul petit point noir, le temps : d’après mon essai, si le système avait mis disons une minute par page, cela aurait fait un temps de traitement d’une heure pour un rapport de 60 pages, 48 heures pour une promo de 48 étudiants... Mais Frédéric Agnès m’explique que le système procède par sondage statistique et que le temps de traitement reste constant quelle que soit la taille du document. S’il est considéré comme suspect, une analyse plus fine peut alors être déclenchée. Bien vu.
La situation est-elle cependant si grave qu’il faille mettre en place dans les universités des sortes de radars automatiques comme sur les bonnes vieilles routes de France ? La situation est préoccupante sur les campus américains.
Une étude de Donald McCabe (Rutgers) avait fait grand bruit en 2003 en révélant les résultats d’une enquête auprès de 18 000 étudiants : 38% d’entre eux reconnaissaient avoir eu recours au copier-coller à partir d’Internet (voir article du New York Times). La proportion n’était que de 10% en 2000. Je ne connais pas d’étude du même type pour la France. Intuitivement, j’ai trouvé que la proportion de copier-coller était en augmentation assez préoccupante sur les deux ou trois dernières années, comme je le disais en introduction, et je crois que d’autres collègues font le même constat (une collègue d’HEC Genève anime un groupe de travail très intéressant sur ce thème).
Je ne crois pas que nous en soyons arrivés à la situation des campus américains, où des officines (« paper mills ») se sont même spécialisées dans la vente de devoirs et mémoires en ligne (par exemple SchoolSucks ou CheatHouse). Il faut dire que lorsque les droits d’inscription atteignent 10 à 15000 $ par an, cela incite peut-être à des « investissements » de ce type... Pour l’instant ce que j’ai pu constater relève plus de la méconnaissance des règles
du travail universitaire que du plagiat caractérisé. Je ne disconviens pas que celui-ci existe aussi, évidemment (des sites de « gruge » commencent même à apparaître pour le français), mais pour l’instant ce que j’ai surtout observé c’est que mes étudiants n’ont pas conscience que le copier-coller de sources multiples n’est pas une façon acceptable de faire un rapport.
Il faut dire qu’on ne prend guère la peine de leur enseigner les règles de base de la propriété intellectuelle, du bon usage de la citation, etc. Pire encore, ils ont été habitués pendant toute leur scolarité, au collège et au lycée (et peut-être même avant), à faire des « recherches » qui se résument déjà le plus souvent à des assemblages par copier-coller. Je vois mal d’ailleurs comment ils pourraient faire différemment : supposez que vous ayez à faire un projet sur l’Etna ou l’histoire du cinéma pour la semaine prochaine... Comment un enfant de 12 ou 14 ans peut-il à la fois trouver les sources (indispensables), les lire, et avoir le recul pour synthétiser ses lectures en un travail réellement personnel ? Il me semble que la compilation est un travail intelligent et honnête au collège (la synthèse et l’appropriation peuvent venir après). Il suffirait d’expliquer clairement comment citer ses sources, comment mettre en évidence les parties personnelles et les parties empruntées (du bon usage des guillemets et des annexes), etc. Je ne crois pas que pour l’instant ce soit beaucoup fait dans le secondaire, sauf exception, mais il faudra certainement que le corps enseignant se penche sur le problème. La copie a toujours existé, mais les sources étaient rares et difficiles d’accès, et copier des encyclopédies était un travail de bénédictin. Internet a changé la donne. Il faudra sans doute désormais enseigner l’art et l’éthique de la compilation...
J’ai constaté que la méthode marchait à merveille auprès de mes étudiants. Quelques explications de base, techniques autant qu’éthiques, et le problème disparaît : l’immense majorité de nos étudiants est profondément honnête. Quant aux plagiaires invétérés, la dissuasion des moteurs de recherche est radicale. Il suffit de dire qu’il y aura contrôle sur Internet pour que toute tentation disparaisse comme par magie. De ce point de vue, Compilatio.net
constitue l’arme de dissuasion absolue : comme la Bombe, il n’y aura peut-être pas besoin d’y avoir recours. Il suffira de faire la démo...
Sur le même thème
Corporations vs Nations : Le Dernier MatchChatGPT Info ou Intox
La "clé de l'évolution" dans la boîte à gants?
Santé : des critères à respecter pour Google et ses algorithmes
Les causes de la crise politico-économique
6 réactions à cet article
Ajouter une réaction
Pour réagir, identifiez-vous avec votre login / mot de passe, en haut à droite de cette page
Si vous n'avez pas de login / mot de passe, vous devez vous inscrire ici.
FAIRE UN DON