• AgoraVox sur Twitter
  • RSS
  • Agoravox TV
  • Agoravox Mobile

Accueil du site > Actualités > Médias > Web : Les plagiaires y errent

Web : Les plagiaires y errent

Le journal Le Monde publiait il y a quelques jours un article intitulé « Une arme informatique contre le plagiat mise au point par une société savoyarde ». Cette société, Six Degrés, commercialise en effet un service Web appelé Compilatio.net (compilatio voulait dire pillage, et par extension plagiat en latin), qui permet d’analyser des travaux d’étudiants douteux (les travaux, pas les étudiants, encore que...). Le principe est simple : on s’abonne et ensuite on peut soumettre des textes à analyser, pour la modique somme de 0,29 € HT (ça doit faire dans les 0,35 TTC) à chaque fois. L’Université de Savoie et quelques autres écoles auraient déjà souscrit.

texte examiné à la loupe

Il faut reconnaître que la pratique du copier-coller

est devenue quelque peu inquiétante. Je la constate tous les jours chez mes étudiants... Demandez n’importe quoi, un rapport sur l’explosion des SMS en Moldavie, la synthèse de la parole dans les machines à coudre, les langues de la planète Mars, et vous aurez immédiatement des dizaines de rapports superbement mis en page, avec photos, figures et couleurs ad nauseam, mais dont le texte oscille entre des passages fastidieux avec orthographe approximative (« Nous allons consacré la première partie de ce rapport...  ») et des passages parfaitement écrits, avec des mots compliqués, des figures de style et tout et tout — dans une espèce de patchwork à la rhétorique obscure.

Bien sûr, il suffit de copier un passage ou deux dans Google Yahoo pour en trouver immédiatement la provenance... C’est en gros ce que fait Compilatio.net, en systématisant la méthode. Le site Compilatio.net est remarquablement silencieux sur les aspects techniques —secrets de fabrique, je présume— mais l’un des auteurs, Frédéric Agnès, a accepté de me donner quelques infos. Le texte est tronçonné en segments d’une dizaine de mots, qui sont comparés avec une base de données de documents : Compilatio.net

possède son propre crawler, qui n’indexe pas tout le web, mais certains sites ciblés. La comparaison est complétée par un envoi de requêtes auprès de métamoteurs. Compilatio.net retrouve non seulement les URL d’où ont été extraits les fragments plagiés, mais donne aussi un coloriage du texte et des originaux qui montre les fragments copiés.

J’avoue que j’étais un peu sceptique sur l’efficacité de la technique. J’ai voulu en avoir le coeur.net et j’ai donc soumis un texte que j’ai fabriqué pour la circonstance (on a droit à deux essais gratuits). J’ai collé ensemble dix extraits de textes pris sur le Web : blogs, articles scientfiques, extraits de Wikipedia, rapports (Cemagref, Insee). Du HTML et du pdf. J’ai même été un peu vache : les rapports en question font plus de 60 pages et j’ai pris un bout à la fin, me disant que les métamoteurs interrogés n’en indexent peut-être qu’une partie... Ca m’a fait un texte bidon de trois pages, que j’ai soumis à Compilatio.net. Il a fallu trois à quatre minutes pour que j’aie ma réponse. Oui, le texte était suspect !

indice de plagiat

L’analyse détaillée des résultats m’a épaté. Le système a retrouvé 8 extraits sur dix. Il fournit les URL et colorie les passages incriminés. Un clic, et on est sur l’original, lui aussi colorié. Les extraits en fin des gros rapports Cemagref et Insee ont bien été repérés. Les deux extraits qui n’ont pas été identifiés sont deux paragraphes de blogs (AixTal, MissTICS). Ils sont pourtant indexés dans Google et Yahoo.
urls et coloriage du texte

Vraiment pas mal, donc, du point de vue technique. Il existe déjà des systèmes analogues pour l’anglais (par exemple Plagiarism, TurnItIn ou Eve), mais il faut saluer la prouesse, d’autant que le système est très ergonomique et simple à utiliser. J’avais trouvé un seul petit point noir, le temps : d’après mon essai, si le système avait mis disons une minute par page, cela aurait fait un temps de traitement d’une heure pour un rapport de 60 pages, 48 heures pour une promo de 48 étudiants... Mais Frédéric Agnès m’explique que le système procède par sondage statistique et que le temps de traitement reste constant quelle que soit la taille du document. S’il est considéré comme suspect, une analyse plus fine peut alors être déclenchée. Bien vu.
masque

La situation est-elle cependant si grave qu’il faille mettre en place dans les universités des sortes de radars automatiques comme sur les bonnes vieilles routes de France ? La situation est préoccupante sur les campus américains.

Une étude de Donald McCabe (Rutgers) avait fait grand bruit en 2003 en révélant les résultats d’une enquête auprès de 18 000 étudiants : 38% d’entre eux reconnaissaient avoir eu recours au copier-coller à partir d’Internet (voir article du New York Times). La proportion n’était que de 10% en 2000. Je ne connais pas d’étude du même type pour la France. Intuitivement, j’ai trouvé que la proportion de copier-coller était en augmentation assez préoccupante sur les deux ou trois dernières années, comme je le disais en introduction, et je crois que d’autres collègues font le même constat (une collègue d’HEC Genève anime un groupe de travail très intéressant sur ce thème).

Je ne crois pas que nous en soyons arrivés à la situation des campus américains, où des officines (« paper mills ») se sont même spécialisées dans la vente de devoirs et mémoires en ligne (par exemple SchoolSucks ou CheatHouse). Il faut dire que lorsque les droits d’inscription atteignent 10 à 15000 $ par an, cela incite peut-être à des « investissements » de ce type... Pour l’instant ce que j’ai pu constater relève plus de la méconnaissance des règles

du travail universitaire que du plagiat caractérisé. Je ne disconviens pas que celui-ci existe aussi, évidemment (des sites de « gruge » commencent même à apparaître pour le français), mais pour l’instant ce que j’ai surtout observé c’est que mes étudiants n’ont pas conscience que le copier-coller de sources multiples n’est pas une façon acceptable de faire un rapport.

Il faut dire qu’on ne prend guère la peine de leur enseigner les règles de base de la propriété intellectuelle, du bon usage de la citation, etc. Pire encore, ils ont été habitués pendant toute leur scolarité, au collège et au lycée (et peut-être même avant), à faire des « recherches » qui se résument déjà le plus souvent à des assemblages par copier-coller. Je vois mal d’ailleurs comment ils pourraient faire différemment : supposez que vous ayez à faire un projet sur l’Etna ou l’histoire du cinéma pour la semaine prochaine... Comment un enfant de 12 ou 14 ans peut-il à la fois trouver les sources (indispensables), les lire, et avoir le recul pour synthétiser ses lectures en un travail réellement personnel ? Il me semble que la compilation est un travail intelligent et honnête au collège (la synthèse et l’appropriation peuvent venir après). Il suffirait d’expliquer clairement comment citer ses sources, comment mettre en évidence les parties personnelles et les parties empruntées (du bon usage des guillemets et des annexes), etc. Je ne crois pas que pour l’instant ce soit beaucoup fait dans le secondaire, sauf exception, mais il faudra certainement que le corps enseignant se penche sur le problème. La copie a toujours existé, mais les sources étaient rares et difficiles d’accès, et copier des encyclopédies était un travail de bénédictin. Internet a changé la donne. Il faudra sans doute désormais enseigner l’art et l’éthique de la compilation...

J’ai constaté que la méthode marchait à merveille auprès de mes étudiants. Quelques explications de base, techniques autant qu’éthiques, et le problème disparaît : l’immense majorité de nos étudiants est profondément honnête. Quant aux plagiaires invétérés, la dissuasion des moteurs de recherche est radicale. Il suffit de dire qu’il y aura contrôle sur Internet pour que toute tentation disparaisse comme par magie. De ce point de vue, Compilatio.net

constitue l’arme de dissuasion absolue : comme la Bombe, il n’y aura peut-être pas besoin d’y avoir recours. Il suffira de faire la démo...


Moyenne des avis sur cet article :  3.67/5   (3 votes)




Réagissez à l'article

6 réactions à cet article    


  • Julien2vox 29 juin 2005 13:06

    Bon résumé de la situation. Perso je suis étudiant, j’avoue moins aussi avoir recours au plagiat pur et simple (je dit que c’est par manque de temps, mais j’avoue une certaine fainéantise quand même :( Toujours est-il que je l’explique aussi par la facilité de l’accès à l’information, un browser web et ton traitement texte et voila c’est fait. Je l’utilise plus pour les projets de peu d’intérêt de toute façon. Franchement on peut se poser la question quand on demande à un futur ingénieur informaticien de rédiger un rapport sur les effets de la foudre dans les installation agricoles. Si un simple re-formulation ou même des changements de tournure de phrase, pour simple preuve que l’on a au moins lu le texte (ca arrive oui que l’étudiant ne lit même pas ce qu’il met) Donc oui des contrôles oui, pas seulement pour la tricherie qu’elle représente mais pour le vol tout simplement, on ne peut pas s’approprier le travail d’un autre sans son autorisation, c’est du vol je le redit


    • nico (---.---.28.2) 29 juin 2005 13:42

      Effectivement, les correcteurs de rapports n’ont pas attendu cet outil pour identifier les plagiats. La méthode manuelle associée à Google est finalement assez performante.

      Lorsque j’avais des rapports pénibles et peu intéressant à faire, j’avais l’habitude de ne chercher ma documentation que dans des ressources non francophones, et j’en faisait une traduction libre. J’ai bien peur que Compilatio ne donne à mes rapports qu’un indice de plagiat très faible.

      Le plagiat copié-collé n’est qu’une partie immergée de la fraude. Mais identifier un contenu qui a été traduit ou qui est sémantiquement proche, est loin d’être faisable pour le moment, d’un point de vue computationnel mais aussi et simplement théorique.

      Compilatio donc se limite simplement à automatiser l’identification des copié-collés. La vie des plagiaires ne me semble pas menacée.


      • www.le-perfologue.net (---.---.135.249) 29 juin 2005 16:54

        Cela devient un peu plus grave lorsque l’étudiant « oublie » son travail préalable de copier/coller et décide de publier en ligne son rapport dont il n’est pas peu fier. Je lance de temps à autre des contrôles de plagiat de mes divers sites, et je tire toujours très rapidement « bonne pioche ». AF


        • Seb (---.---.209.147) 30 juin 2005 05:22

          Sera t’il bientot fini le temps ou chacun s’approprie l’information qu’il produit et tente de la proteger alors que le but ultime est selon moi de capitaliser la reflexion et de s appuyer sur les idees d autrui pour aller plus loin que lui ? Un peu a la maniere d’un pont, ou l’on passe sur le debut du pont bati par quelqu un d autre pour en batir soi meme une tranche en sachant et en esperant que le prochain fera de meme avec le meme but commun, la traversée.


          • www.le-perfologue.net (---.---.135.249) 30 juin 2005 10:02

            « Capitaliser la reflexion et de s’appuyer sur les idees d autrui pour aller plus loin que lui » Pas de problème, c’est comme cela que nous fonctionnons tous. On a tous appris auprès des autres, on a tous lu des livres, on a tous fondé notre réflexion sur le travail de prédécesseurs en tentant d’apporter un complément ou un autre éclairage. La copie de pans entiers de texte sans citer les sources et le signer de son nom c’est autre chose. C’est du vol tout simplement. L’auteur original est lésé. La prochaine, il ne publiera pas de textes originaux en ligne. le lecteur est aussi lésé. Ne connaissant pas l’auteur initial, il ne peut pousser plus avant la réflexion. Alors c’est bien de parler de partage et de construction de ponts. J’aime bien l’image. Encore faut-il que chacun apporte sa contribution et ne pas simplement considérer les apports des autres comme un libre-service. A+ AF


            • FrédéricLN (---.---.244.231) 18 septembre 2006 13:44

              Bravo, M. Véronis, excellent article. Je suis absolument d’accord avec la conclusion. Utiliser du savoir disponible en ligne est la nature même de la réflexion (ou de 99% de celle-ci) aujourd’hui, encore faut-il savoir le faire, et pour cela apprendre.

Ajouter une réaction

Pour réagir, identifiez-vous avec votre login / mot de passe, en haut à droite de cette page

Si vous n'avez pas de login / mot de passe, vous devez vous inscrire ici.


FAIRE UN DON






Les thématiques de l'article


Palmarès