Quand j’ai vu les chiffres apparaître sur mon écran, j’en ai eu le souffle littéralement coupé. Les taux de citations sont extrêmement proches du résultat final et permettent, en particulier, de prédire l’ordre d’arrivée des quatre principaux candidats :

L’écart entre les taux de citations et le résultat peut être quantifié précisément à l’aide d’une mesure utilisée communément en statistique pour évaluer la qualité de l’ajustement d’un modèle, l’écart quadratique moyen (on calcule la moyenne des carrés des écarts, puis on en prend la racine carrée). Cette mesure est reportée dans la ligne Écart. Elle permet de classer la qualité de la « prédiction » des différents médias. Le plus proche du résultat officiel est le journal Les Échos, suivi de près par Le Parisien et Le Monde. L’ordre des différentes colonnes de gauche à droite suit le classement en fonction de l’écart. La ligne Top 4 donne la même mesure d’écart, mais restreinte aux quatre « grands candidats ».
On remarquera qu’on trouve à droite du tableau des publications plus engagées, comme L’Humanité, qui fait bénéficier Marie-George Buffet d’un taux de citations extrêmement élevé (17,5%, c’est-à-dire autant que ce que le journal attribue à Ségolène Royal). A part ce cas un peu extrême, les biais des autres médias se compensent les uns les autres (voir analyse détaillée dans l’étude en pdf). Ceci explique que la moyenne des taux de citations, lorsqu’on exclut le journal L’Humanité, est légèrement plus proche du résultat que le journal Les Echos (colonne Moyenne-H). On peut encore améliorer le résultat en ne retenant que le « Top 3 » des trois médias de tête (sans doute les moins « engagés ») : Les Échos, Le Parisien et Le Monde (colonne Moyenne3). Cette moyenne est étonnamment proche du résultat officiel (écart inférieur à un point).

Le plus étonnant est que ces résultats sont meilleurs que ceux des instituts de sondages.

On voit que l’institut BVA est le plus proche du résultat, à peu près à égalité avec la « prédiction » du journal Les Échos et légèrement moins bon que la moyenne des taux de citations sans L’Humanité. L’institut CSA, dernier du classement, est plus éloigné du résultat officiel que quatre grands quotidiens (Les Échos, Le Parisien, Le Monde, Libération). La moyenne des taux de citations du « Top 3 » de la presse est nettement meilleure que le meilleur des instituts (BVA).

On remarquera d’ailleurs qu’on ne peut pas améliorer les résultats des sondages en en prenant la moyenne, même restreinte aux deux ou trois meilleurs (voir résultats analogues ici). Les moyennes restent plus éloignées du résultat officiel que les valeurs fournies par l’institut BVA. Ceci s’explique par le caractère systématique des biais des différents instituts, qui vont tous dans le même sens (surestimation importante de Jean-Marie Le Pen et sous-estimation de Nicolas Sarkozy, notamment), alors que les biais de la presse ont tendance à se compenser.
L’étude jointe en pdf donne une analyse plus détaillée des écarts, média par média.
Il faut sans doute beaucoup de précautions devant un résultat aussi étonnant, et des études complémentaires et approfondies qui relèvent de la sociologie des médias, mais cette étonnante convergence est certainement à analyser : autorégulation des rédactions autour d’une sorte d’ « équité » intuitive ? Fabrication de l’opinion par les médias ? Sans doute un peu de tout ça...
Le fait que la presse fasse, de façon purement intuitive, mieux que les sondeurs est certainement un fait à méditer. J’ai ma petite hypothèse : on sait que les chiffres publiés ne sont pas les données brutes des enquêtes, mais des chiffres redressés (en ce qui concerne Jean-Marie Le Pen, l’importance du redressement peut atteindre presque un facteur trois, ce qui est extrêmement important). Les instituts gardent secrètes les méthodes de redressement, mais l’on sait qu’elles sont extrêmement délicates, et qu’in fine, les instituts opèrent des correctifs et un redressement manuel en fonction de leur « intuition politique ». Il n’est alors pas étonnant que des centaines de journalistes, observateurs expérimentés des rapports de force et de la vie politique, aient collectivement une meilleure « intuition politique » que les instituts de sondage.
Il est frappant de constater que les rédactions ont corrigé (plus ou moins consciemment, à nouveau) la surestimation importante du score de Jean-Marie Le Pen opérée par les sondeurs. Il est probable que divers indices de nature qualitative étaient perceptibles par les journalistes pour leur laisser penser, collectivement s’entend, que le scénario de 2002 était peu probable en 2007 : interviews de militants et sympathisants, affluence dans les meetings, etc. L’observation de la courbe des sondages sur Jean-Marie Le Pen sur la période de la campagne est également un élément de considération important : en forte croissance sur les dernières semaines avant le premier tour de 2002, elle était presque parfaitement plate avant celui de 2007.
Qu’on l’interprète d’une manière ou d’une autre, cette étude met en évidence de façon éclatante les jeux complexes d’interaction entre les médias, les sondages et l’opinion, qui ont sans doute été plus intenses dans cette élection que dans toute autre jusqu’ici.
Etude détaillée


















































