@Ouam
Il en va des erreurs dans ces fichiers comme de la chasse au spam quand tu gères un serveur de courrier.
Avec des mesures simples, tu peux en arrêter 80% Avec d’autres mesures un peu plus sophistiquées, 10% de mieux, et ainsi de suite jusqu’à ce que le bénéfice en % devienne parfaitement négligeable en raison de l’effort que cela impliquerait...
En statistiques, personne ne prétend à l’exactitude (illusoire). On espère juste descendre à un taux d’erreur acceptable, c’est mon cas.
C’est à ça que sert ma validation, je compare par rapport aux séries longues de l’Insee et je calcule les taux d’erreur, puis je fais une moyenne pondérée.
Reste que c’est à ce jour le meilleur set de données dont nous disposions, il ne faut pas trop compter sur l’Insse pour en fournir des aussi détaillés... 