La statistique dans la cité n° 33 - février 2023
Sommaire du n° 33


Éditorial

Méthodes :
                                     - L’indice de position sociale des élèves, une mesure quantitative
                                      de stratification sociale appliquée à l’éducation
                                     - Commune rurale ou commune urbaine

Vie des institutions :
                                     - La Commission des sondages,
                                      gardienne de la qualité des sondages électoraux

Humeur :
                                     - Combien de manifestants ?

Feuilleton :
                                     - Un point sur l’affaire Georgiou

Nous avons lu

Annonces

Vie du Groupe



Tous les numéros précédents de l'infolettre sont téléchargeables sur le site du groupe SEP


Editorial

Avec ce premier numéro de l’année 2023, La statistique dans la cité entre dans sa huitième année calendaire.

L’année 2022 a été marquée par un retour à la normale des activités du Groupe Statistique et enjeux publics après deux années pendant lesquelles nous avons dû nous adapter aux contraintes liées à la pandémie de Covid19. Six Cafés de la statistique ont pu être organisés, les deux premiers uniquement en visioconférence, mais les quatre suivants l’ont été en mode « hybride », c’est-à-dire en présentiel au Café du Pont-Neuf avec possibilité de suivre les débats et de poser des questions à distance. Les cinq numéros de La statistique dans la cité ont pu paraître comme à l’accoutumée.

Mais cette année 2022 a aussi été celle de la guerre déclenchée en Ukraine il y a maintenant un an. Cette situation qui touche l’ensemble de la société ukrainienne affecte bien entendu nos collègues, statisticiens publics ukrainiens, dans leur vie professionnelle comme dans leur vie familiale. La rédaction de notre infolettre avait donc décidé de leur ouvrir ses colonnes, ce qu’ils ont confraternellement accepté, et, dans un article publié dans le n° 30 (juin 2022), nos collègues nous ont fait part de leurs difficultés pour collecter et traiter les données mais aussi de leur volonté de continuer à proposer une information aussi fiable et précise que possible aux décideurs et au public le plus large, malgré les énormes difficultés liées à la guerre.

Les débats qui vont rythmer cette année 2023 vont rendre toujours plus nécessaire l’accessibilité à une information fiable et complète, non seulement pour les décideurs publics ou privés, mais aussi pour les citoyens. En France, la plupart des statistiques – et des données à partir desquelles elles ont été produites - sont disponibles. Mais l’écosystème statistique ne se limite pas à la production et à la diffusion de statistiques. Il s’étend aussi à leur explication et à leur interprétation. La transparence nécessaire pour rencontrer la confiance des utilisateurs ne concerne pas seulement la manière de produire des résultats et de diffuser ceux-ci mais l’ensemble de l’écosystème.

La rédaction sera toujours heureuse de recevoir critiques et suggestions et invite ses lecteurs à réagir au contenu de ses lettres et à lui signaler les informations susceptibles d’intéresser notre communauté. Cet appel s’adresse à tous les statisticiens, qu’ils appartiennent ou non au service statistique public, mais aussi à tous ceux qui, sans être statisticiens, partagent notre souci de savoir comment la statistique peut éclairer les débats et les enjeux publics.


N’hésitez pas à nous écrire à l’adresse sep@sfds.asso.fr

Méthodes

L’indice de position sociale des élèves (1), une mesure quantitative de stratification sociale appliquée à l’éducation

L’insuffisante réduction des inégalités sociales par le système éducatif ou la ségrégation sociale entre établissements d’enseignement sont des thèmes récurrents du débat sur l’éducation. Ces sujets sont alors illustrés à l’aide de la profession et catégorie socioprofessionnelle (PCS) des parents : par exemple, la Depp, le service statistique du Ministère de l’éducation nationale (Direction de l’évaluation, de la prospective et de la performance) publie régulièrement la proportion d’élèves « défavorisés » au sein d’une filière d’enseignement ou d’un établissement scolaire (2).

La Depp calcule également depuis 2016 (3) un indicateur quantitatif de position sociale des élèves destiné à analyser par simple moyenne des indices de chaque élève, le niveau social d’un groupe d’élèves (par exemple, une classe, un établissement scolaire ou un territoire) : « l’indice de position sociale » des élèves .

Il est construit en attribuant une valeur quantitative à chaque PCS (en pratique, à chaque ensemble de la PCS du père et de la mère) : plus ce score est élevé, plus le contexte familial est réputé favorable à la réussite scolaire des élèves (4).

Ce score est issu d’une analyse des correspondances multiples (ACM) sur un panel de plus de 29 000 élèves entrés en sixième en 2007, et pour lequel on disposait, outre la PCS des parents, d’évaluations scolaires ainsi que d’informations complémentaires sur le capital culturel et économique des familles, considérées comme des « médiatrices » de la réussite scolaire (5). Les variables « médiatrices » retenues ont été recueillies grâce à une enquête réalisée auprès des familles du panel en 2011 : le diplôme des parents (mère et père), les conditions matérielles (revenus, nombre de pièces du logement, partage de chambre, ordinateur au domicile, accès à Internet), le capital culturel (nombre de livres à la maison, présence d'une télévision dans la chambre, temps passé devant la télévision), l'ambition et l'implication déclarée par les parents (aspirations, diplôme considéré comme le plus utile, implication des parents dans la scolarité, conversations sur la scolarité, sur l'avenir scolaire), les pratiques culturelles (sport, concert, théâtre, cinéma, musée, activités extrascolaires). À noter que certaines variables comme la structure familiale ou le statut d’immigration, non considérées comme « médiatrices », ont été exclues de l’analyse.

Les PCS sont projetées sur la première composante de l’ACM afin d’obtenir le score, qui est ensuite standardisé de manière à obtenir un indice de position sociale de moyenne 100 et d’écart-type 30.

Suite à un recours juridique du journaliste Alexandre Léchenet devant le tribunal administratif, cet indice, jusque-là réservé à l’usage interne du ministère (6), est public depuis l’automne 2022 (à tout le moins pour ce qui concerne l’indice relatif à chaque établissement d’enseignement (7)). Un tableau présentant les scores associés à chaque PCS (du responsable légal, du père, de la mère et des PCS combinées des deux parents) est également disponible. Depuis, la presse et Internet font régulièrement écho des analyses réalisées à l’aide de l’IPS (8), même si, comme tout indicateur composite, il reste simple d’utilisation, mais complexe dans sa conception.

(1) Le magazine Web des anciens élèves de l’Ensae, Variances, a publié dans une de ses très récentes livraisons, un article sur les critiques qui peuvent être adressées à cet indicateur.
(2) La Depp utilise régulièrement, pour des raisons pratiques, un regroupement des PCS en quatre catégories : – favorisée A : cadres et assimilés, chefs d’entreprise, professeurs des écoles et assimilés ; – favorisée B : professions intermédiaires ; – moyenne : employés, agriculteurs, artisans, commerçants ; – défavorisée : ouvriers, inactifs.
(3) Un premier indice du même type avait été proposé en 2010.
(4) Pour en savoir plus : Thierry Rocher « Construction d’un indice de position sociale des élèves », Revue éducation & formations n° 90, avril 2016. MENJ-Depp
(5) L’idée sous-jacente est que les PCS n’agissent pas directement sur les résultats scolaires (ici le score cognitif de l’élève), mais à travers ses caractéristiques familiales.
(6) Par exemple, dans l’Académie de Paris, le ministère utilise les IPS pour l’attribution de moyens aux établissements (dotations horaires plus élevées pour les établissements à faible IPS) ou l’affectation des élèves dans un lycée (attribution de points supplémentaires pour les élèves provenant de collèges à IPS faible, afin de réduire la ségrégation scolaire).
(7) En revanche, l'écart-type par établissement, qui peut s'interpréter comme un indicateur de diversité sociale, n'est pas communiqué.
(8) Par exemple Le Monde écrit dans son n° daté du 11 janvier 2023 : « Au lycée, de nouvelles données révèlent l’ampleur du « tri social » entre les voies générale et professionnelle ».


Commune rurale ou commune urbaine

Selon quels critères une commune est-elle classée comme rurale ou urbaine ? La statistique publique française donne deux réponses. L’une, traditionnelle, fonde la liste des « unités urbaines », actualisée en 2020 et dont la méthode vient d’être publiée. L’autre, récente (9), fonde la « grille de densité » dont on peut également consulter la méthode sur le site de l’Insee (10). La grille de densité est de plus en plus utilisée dans les études publiées par l’Insee et le service statistique public.

Pour 88 % des communes, représentant 87 % de la population, les deux outils donnent des classements identiques vis-à-vis de l’opposition urbain/rural. Lorsque ces classements diffèrent, c’est le plus souvent dans ce sens : la grille de densité étend la ruralité. 11 % des communes, représentant 12 % de la population totale de la France, sont classées comme rurales par la grille de densité alors qu’elles appartiennent aux unités urbaines ; la situation inverse ne concerne que 1 % des communes représentant 0,5 % de la population.

Pourquoi ces différences de classement ?

Les deux méthodes ont des points communs. Les communes ne sont pas classées directement. Au préalable, des entités infra-communales sont constituées, analysées et regroupées sans tenir compte des limites administratives. Dans le cas de la grille de densité, ces entités sont des carreaux de 1 km de côté, que l’on classe d’après leur densité de population (hab./km²), et que l’on regroupe par contiguïté. Dans le cas des unités urbaines, il s’agit d’ensembles de bâtiments proches les uns des autres (pas de coupure supérieure à 200 mètres). Les ensembles de carreaux contigus, ou les ensembles de bâtiments proches, sont alors répartis en divers types, certains relevant de l’urbain, les autres du rural. À la fin du processus, on examine les communes, que l’on classe à leur tour selon le type qui est majoritaire sur leur territoire.

Les deux procédés de classement utilisent des seuils de population pour délimiter leurs types. L’un de ces seuils est crucial pour distinguer l’urbain et le rural. Dans la grille de densité, ce seuil est de 5 000 habitants : un groupe de carreaux contigus de même type de moins de 5 000 habitants est classé « rural ». Dans la nomenclature des unités urbaines, le seuil est de 2 000 : un ensemble de bâtiments proches constitue une « agglomération urbaine » s’il compte au moins 2 000 habitants.

Cette différence de seuil – 5 000 ou 2 000 – explique une grande partie des différences de classement des communes signalées plus haut. La grille de densité aboutit à classer en « bourgs ruraux » un grand nombre de communes qui figurent dans la liste des unités urbaines : plus de 2 200 communes sont dans ce cas, dont beaucoup se considèrent comme de « petites villes ». On peut citer, parmi celles dont la population municipale 2019 se situe juste en dessous du seuil de 5 000 habitants : Cluny, Montbard, Vittel, Port-Vendres, Saint-Tropez, … Certaines verront leur nouvelle dénomination comme un déclassement.

Le seuil de 2 000 habitants était utilisé dans la statistique française depuis le XIX° siècle ; lorsqu’il a été choisi, la population était répartie de façon beaucoup plus homogène sur le territoire qu’actuellement. Relever la barre après des décennies d’urbanisation n’est pas choquant ; par ailleurs, cela s’inscrit dans une démarche d’harmonisation européenne. Pourquoi, alors, continuer à délimiter des unités urbaines en utilisant le seuil traditionnel ? C’est que de nombreux textes législatifs et surtout réglementaires font référence aux « unités urbaines définies par l’Insee ». On en trouvera des exemples dans les documents méthodologiques cités en note de bas de page. Il apparaît de ce fait comme difficilement évitable de poursuivre la définition des unités urbaines selon des principes figés, tout en privilégiant un autre concept pour les études démographiques. À charge pour les utilisateurs de la statistique d’éviter les confusions !

(9) La statistique dans la cité a fait état de cette nouveauté dans son numéro 18 de février 2020 et dans son numéro 23 de février 2021.
(10) Le zonage en unités urbaines 2020, Vianney Costemalle, Sonia Ouja, Clément Guillo, Axelle Chauvet – Insee - Documents de travail n° M2022-02 Décembre 2022.
     
La grille communale de densité à 7 niveaux, Simon Beck, Marie-Pierre De Bellefon, Jocelyn Forest, Mathilde Gérardin, David Lévy – Insee - Documents de travail n° 2022-18.


Vie des institutions

La Commission des sondages, gardienne de la qualité des sondages électoraux

La Commission des sondages a été créée par la loi 77-808. Elle a tout pouvoir pour vérifier que les sondages portant sur des sujets liés, de manière directe ou indirecte, au débat électoral, et faisant l’objet d’une publication ont été réalisés conformément aux règles de l’art.

À l’automne 2021, un nouvel institut, dénommé Cluster 17, a commencé à présenter sur son site des estimations relatives aux élections présidentielles. Ces sondages ont ensuite été publiés régulièrement dans le magazine « Marianne ». La Commission des sondages a remarqué des anomalies dans la constitution et l’utilisation de l’échantillon retenu par cet institut (doublons, aucune vérification sur l’existence ou les caractéristiques des personnes interrogées,…). Dans la manière de procéder, Cluster 17 a acheté à bas prix des listes de plusieurs millions d’adresses mail, sans en vérifier la qualité. Puis il a envoyé, pour chaque sondage, 300 000 messages aux adresses ainsi achetées, pour environ 2 200 réponses et considère avoir ainsi réalisé un sondage aléatoire. Après de nombreux échanges avec la société Cluster 17, la Commission a ordonné la publication dans « Marianne » d’une mise au point invitant les lecteurs des sondages réalisés par Cluster 17 « à une prudence particulière dans l’appréciation de leur pertinence », en raison d’insuffisances dans les méthodes utilisées et de la faiblesse des contrôles lors des opérations de recueil. Un sous-chapitre de son rapport annuel 2022 est consacré à cette affaire.

La décision de la Commission a fait l’objet par la société Cluster 17 d’un recours pour excès de pouvoir devant le Conseil d’État.

Par une décision du 20 décembre 2022, celui-ci a entièrement confirmé la position de la Commission des sondages et a rejeté le recours de la société Cluster 17. Il a jugé que le mode de constitution de cette base prétendument « aléatoire », « eu égard aux conditions dans lesquelles ces adresses ont été acquises et à l’absence de dispositifs de vérification », ne permet pas de prévenir les biais susceptibles d’affecter cette base, dont la société ignore comment les adresses emails ont été obtenues. Le Conseil d’État a également confirmé que le fait que des contrôles aient été mis en place pour répondre aux demandes de la Commission n’était pas de nature à corriger les biais pouvant exister en amont, touchant à la base elle-même.


Humeur

Combien de manifestants ?

Ce n’est pas une surprise de constater, manifestation après manifestation, la différence entre les estimations du nombre de manifestants publiées par les organisateurs et par la police. Il semble bien toutefois qu’on vient de battre un record à l’occasion de la manifestation contre la réforme des retraites organisée à Paris le 21 janvier 2023 par plusieurs organisations de jeunesse : le rapport entre les deux estimations est cette fois de 1 à 10 : 14 000 selon la police et 150 000 selon les organisateurs !

Rappelons que, en 2015, s’était réunie, à la demande de la Préfecture de police de Paris, une Commission de réflexion sur la mesure du nombre des participants aux manifestations de rue. Cette commission avait remis son rapport le 31 mars 2015 ; elle avait notamment estimé que la seule méthode de comptage réellement opérationnelle était le visionnage de la manifestation dans son ensemble, méthode dont se rapprocheraient plus les comptages proposés à Paris par la Préfecture de police. Pierre Muller, l’un des trois sages de cette commission, avait été l’invité du 88e Café de la statistique le 10 novembre 2015. Le compte rendu de ce Café est disponible sur le site de la SFdS et son exposé introductif est visible en vidéo.

Depuis 2017, le cabinet Occurrence (11) a développé une méthode de comptage pour le compte d’un collectif de médias de la presse écrite et télévisée ; cette méthode semble tenir compte des recommandations de la commission réunie en 2015. Les résultats des comptages effectués par Occurrence sont en règle générale beaucoup plus proches de ceux annoncés par la police que de ceux des organisateurs. Ce cabinet a rendu publique la méthode qu’il utilise, à savoir un système à base de capteurs vidéo, placés en hauteur et qui tracent une ligne virtuelle sur un écran ; les capteurs peuvent compter les personnes qui dépassent cette ligne dans le sens de la manifestation et ce même sur les trottoirs. Toutefois, l’algorithme de comptage, propriété commerciale de l’entreprise Eurecam, n’a pas été rendu public. De ce fait, les médias, clients d’Occurrence, ont préféré suspendre la publication des résultats proposés par ce cabinet pour la manifestation organisée le 31 janvier 2023, résultats qui se trouvaient être cette fois très nettement inférieurs à ceux annoncés par la Préfecture de police.

(11) Occurrence est depuis l’année dernière une filiale du groupe Ifop.


Feuilleton

Un point sur l’affaire Georgiou

La Statistique dans la cité vous a régulièrement fait part du harcèlement juridique qu’Andreas Georgiou, président de l’office statistique grec, Elstat, de 2010 à 2015, subit depuis maintenant plus de dix ans (12). Il y a un peu plus d’un an, dans notre n° 27 (décembre 2021), nous faisions état du dernier avatar de ce feuilleton, à savoir le recours déposé par Andreas Georgiou devant la Cour suprême suite à sa condamnation en appel pour « calomnie simple (13) » envers Nicolas Stroblos, l'ancien directeur des comptes nationaux de la statistique grecque de 2006 à 2010 ; cette condamnation était le résultat de la procédure engagée parce qu’Andreas Georgiou avait « osé » évoquer les nombreuses manipulations des statistiques des finances publiques par ses prédécesseurs entre 2004 et 2009, manipulations largement reconnues depuis par la communauté statistique et notamment par Eurostat. La Cour suprême s’est réunie le 16 janvier 2023, presque deux ans après ce recours. Et a mis son jugement en délibéré, sans fixer de date précise pour rendre son arrêt.

Par ailleurs, Andreas Georgiou a saisi la Cour (14) européenne des droits de l’homme à Strasbourg. La date de l’audience qui aura à dire si ses droits à une justice équitable ont été violés n’a pas encore été fixée.

(12) Voir les numéros 6 (octobre 2017), 10 (juin 2018), 11 (octobre 2018), 14 (avril 2019), 17 (décembre 2019), 24 (avril 2021), 26 (octobre 2021) et 27 (décembre 2021).. Ces numéros sont accessibles dans les pages du groupe Statistique et enjeux publics sur le site de la SFdS.
(13) Dans plusieurs pays, généralement anglo-saxons, il y a « calomnie simple » lorsque une personne a cherché délibérément à porter atteinte à l’honneur ou à la considération d’une autre personne, qu’il s’agisse de faits réels ou mensongers. Cette notion n’est pas équivalente à la notion de diffamation en droit français ; en France, une plainte pour diffamation n’est pas recevable si les faits allégués sont véridiques, sauf lorsque les propos incriminés se rapportent à la vie privée d’une personne, ce qui n’est évidemment pas le cas en ce qui concerne les faits que les avocats d’Andreas Georgiou reprochaient à Nicolas Stroblos.
(14) La Cour européenne des droits de l’homme est une juridiction du Conseil de l’Europe chargée de veiller au respect de la Convention européenne de sauvegarde des droits de l’homme et des libertés fondamentales par les 47 États qui l’ont ratifiée. Elle ne doit pas être confondue avec la Cour de justice de l’Union européenne qui siège à Luxembourg.


Nous avons lu

Dans l’infolettre statistique de l’OCDE (The Statistics Newsletter (15)) de décembre 2022, on peut noter un article sur la confiance du public dans les institutions publiques. Cet article donne les résultats de la première enquête de ce type effectuée par l’OCDE (Trust Survey). Cette enquête fournit des indicateurs comparables sur le jugement des citoyens sur la confiance dans leurs gouvernements ; il s’avère que les pays du sud de l’Europe (y compris la France) sont les moins bien classés de ce point de vue, le Portugal mis à part. Elle mesure aussi les attentes citoyennes face à la capacité qu’ont les gouvernements à mettre en œuvre des mesures visant à réduire les effets du changement climatique ; dans un tiers des pays seulement, les personnes interrogées pensent que leur propre pays sera capable de réduire les émissions de gaz à effet de serre.

(15) Le sous-titre de cette publication est Bringing together data stories from across the OECD.


Le Cnis a tenu son assemblée plénière annuelle le 27 janvier 2023 afin de dresser le bilan de l'année écoulée, d'examiner les orientations de l'année écoulée et d’évaluer les effets des crises qui ont traversé notre économie et qui interrogent la statistique publique. Une note de synthèse est disponible sur son site.


Annonces

Colloque annuel du Conseil national de l’information statistique (Cnis)

Le Cnis organise le 10 mai 2023 au Centre de conférences Pierre Mendès-France des ministères en charge de l’économie et des finances son colloque annuel ouvert au public. Le thème retenu pour ce colloque de 2023 est Mesurer la transition écologique : perspectives économiques. Ce colloque invitera à réfléchir aux besoins d’innovation auxquels la statistique publique devra répondre pour garantir l’indépendance, la pertinence et la qualité de l’information diffusée en matière de mesure de la transition écologique. Trois sessions – Macroéconomie et bien-être, Entreprises et transformation des modes de production, Comportements des ménages : règlementation, incitations et effets redistributifs – seront suivies d’une table ronde prospective consacrée à la mesure des phénomènes à l’œuvre et aux défis pour la statistique publique. Deux grandes questions serviront de fil directeur pendant ce colloque : a-t-on les indicateurs nécessaires pour mesurer l’avancement de la transition écologique et de ses impacts ? Comment améliorer l’acceptabilité sociale, par les acteurs économiques et la population en général, du contrôle accru sur les activités que vont exiger l’observation et les mesures rendues nécessaires pour réformer notre modèle de développement dans le sens de cette transition écologique ? Le programme de cette journée et le formulaire d’inscription sont disponibles sur le site du Cnis.


12e Colloque francophone sur les sondages

Ce colloque se tiendra du 22 au 24 mars et sera accueilli cette année par l’Ined, sur le campus Condorcet à Aubervilliers. Cette rencontre scientifique internationale est organisée depuis 1997, tous les deux à trois ans, sous l’égide de la SFdS et réunit les chercheurs et praticiens des instituts publics ou du secteur privé réalisant ou utilisant des enquêtes par sondage. Elle permet de faire le point sur l’état des pratiques et de la recherche dans les divers domaines de la méthodologie des enquêtes et des sondages. Le programme du colloque et les modalités d’inscription sont disponibles sur son site.


17e Conférence (16) de l’association internationale pour la statistique officielle (IAOS)

Cette conférence se tiendra à Livingstone (Zambie) du 4 au 6 avril 2023. L’association internationale pour la statistique officielle (IAOS – International Association for Official Statistics) est une des associations de la famille de l’Institut international de statistique (ISI – International Statistical Institute). Elle organise notamment des conférences biennales qui rassemblent, au-delà de la communauté statistique internationale, tous ceux qui s’intéressent aux développements de la statistique publique. Cette 17e édition s’intéressera en particulier aux développements de la statistique en Afrique. Son thème est Better Lives 2030: Mobilising the power of data for Africa and the world. Les personnes intéressées sont invitées à consulter le site de la conférence.

(16) Cette 17e Conférence se tient un an après le 18e Conférence organisée à Cracovie du 24 au 26 avril 2022. Elle aurait dû en effet se tenir en avril 2020 mais avait été reportée en raison de la pandémie du Covid-19.


Vie du Groupe

Deux séances de Cafés de la statistique ont été organisées depuis la parution du précédent numéro de La statistique dans la cité (n° 32 paru en décembre 2022), l’une le 10 janvier sur le thème Faut-il craindre une « grande démission » en France où notre invité était Michaël Orand, statisticien à la Dares, et l’autre sur Éthique et intelligence artificielle le 14 février avec Catherine Tessier, directrice de recherche à l’Onera (l’Office national d’études et de recherches aérospatiales). Ce dernier Café a été le 144e organisé par le Groupe Statistique et enjeux publics de la SFdS depuis le premier Café tenu le 6 décembre 2005. Les deux Cafés de janvier et février ont été tenus en mode hybride, en présentiel au Café du Pont-Neuf comme à l’accoutumée avec possibilité de suivre leur déroulement et d’intervenir dans les débats à l’aide d’une retransmission vidéo.

Le prochain Café se tiendra le 21 mars 2023 sur le thème Sondages et Médias ; notre invité sera Luc Bronner du journal Le Monde. Ce Café sera un événement satellite du Colloque francophone sur les sondages.


Responsable de l’infolettre : Chantal Cases, présidente du groupe SEP
Rédacteur en chef : Jean-Louis Bodin
Secrétaire de rédaction : Jean-Pierre Le Gléau
Webmestre : Érik Zolotoukhine

SFdS - Société Française de Statistique
©2023 SFdS