La statistique dans la cité n° 20 - juin 2020
Lettre bimestrielle du groupe « Statistique et enjeux publics »
Sommaire du n° 20


Éditorial

Vie des institutions :              - Le service statistique public s’adapte à la pandémie
                                                 - EpiCOV, une enquête sur l’épidémie de Covid-19 et sa dynamique
                                                 - L’éthique du statisticien en temps de crise

Il y a ...                                     ... cinquante ans
                                                 ... deux cents ans

Humeur ou humour ?

Lu pour vous

Annonces


À L’ATTENTION DE NOS LECTEURS

Ce n° 20 est le deuxième paru pendant la crise sanitaire. Comme à l’accoutumée, La Statistique dans la cité interrompra sa parution pendant l’été et le n° 21 paraîtra le 15 octobre. Ce sera le premier numéro de la cinquième année de cette infolettre. N’hésitez pas à prendre votre plume virtuelle pour nous adresser vos commentaires et suggestions dans la boîte sep@sfds.asso.fr.


Editorial

Comme on pouvait s’y attendre, c’est encore la crise sanitaire qui a dicté la préparation de ce nouveau numéro de La statistique dans la cité. Le SARS-CoV2 est à l’évidence un virus sur lequel il reste beaucoup à apprendre et, dans ce contexte, la statistique est plus que jamais sommée de fournir dans des délais aussi brefs que possible des informations aussi exactes que le nécessitent aussi bien les décisions à prendre concernant la santé publique que celles relatives à la situation économique, sociale et environnementale. C’est évidemment mission impossible ! Les décisions gouvernementales prises obligatoirement dans l’urgence tiennent donc souvent compte des avis de conseils scientifiques basés sur des modélisations imparfaites construites à partir d’observations concernant des épidémies passées plus que sur le constat statistique de celle qui est en cours.

Mais en même temps, les agents économiques et les citoyens reçoivent une avalanche de chiffres pas toujours faciles à interpréter ; on se demande parfois si trop de statistiques ne tue pas la statistique ! Dans une telle situation, il est plus que jamais essentiel de fournir quelques guides pour mieux comprendre et mieux utiliser les chiffres sur le développement de la pandémie. Nous espérons que les articles de ce numéro aideront à une meilleure compréhension de la réalité.

Les deux premiers articles rapportent la façon dont le service statistique public s’est adapté à la situation sanitaire, aussi bien pour continuer à fournir les informations utiles au pilotage de la vie économique, sociale et environnementale malgré les difficultés, notamment de collecte, et à développer de nouveaux outils. Le troisième article est une réflexion sur l’éthique du statisticien en temps de crise. Avant les rubriques traditionnelles (Lu pour vous, Annonces), la rédaction célèbre le deux-centième anniversaire de la naissance d’une pionnière des statistiques dans le domaine de la santé publique, plus connue dans le monde anglo-saxon que dans le monde latin et rappelle que, il y a cinquante ans, se terminait une autre pandémie, celle liée à la grippe dite « de Hong-Kong ».


Pour nous écrire : sep@sfds.asso.fr

Vie des institutions

Le service statistique public s’adapte à la pandémie

Dans un blog publié sur le site de l’Insee (https://blog.insee.fr/la-statistique-publique-a-lepreuve-de-la-crise-sanitaire/), son directeur général, Jean-Luc Tavernier, explique pourquoi et comment le service statistique public (Insee + services statistiques ministériels) s’est adapté aux nouvelles conditions de vie et de travail suite aux mesures prises pour maîtriser la propagation du virus SARS-CoV2.

Tout d’abord, la continuité des productions traditionnelles a pu, en grande partie, être assurée. Cela tient au fait que le matériau de base de la statistique est l’information ; que celle-ci est le plus souvent dématérialisée et se prête donc assez bien au télétravail. Les enquêtes menées par Internet ont ainsi pu se poursuivre, mais ces méthodes ne concernent encore qu’un nombre limité d’enquêtes. Pour la collecte de l’indice des prix, l’exploitation des tickets de caisse avait heureusement été mise en place dès le mois de janvier 2020, ce qui a permis de compenser en partie l’arrêt des relevés effectués dans les magasins. Mais, pour la réalisation des enquêtes habituellement réalisées en face-à-face, des palliatifs (Internet, téléphone) ont dû être trouvés. D’autres enquêtes, moins prioritaires ou peu compatibles avec une collecte par internet (par exemple, la deuxième édition de l’enquête Trajectoires et Origines) ont été suspendues et les résultats en seront retardés.

Cette situation nous conduit à nous interroger sur la pertinence de certaines statistiques : que valent les critères retenus pour la définition du chômage au sens du BIT en situation de confinement ? Le résultat publié fait ressortir étonnamment une baisse de 0,3 % au premier trimestre et l’Insee prend bien soin d’expliquer pourquoi ce résultat est en trompe-l’œil (1) (voir https://www.insee.fr/fr/statistiques/4488364). Que vaut la pondération de l’indice des prix à la consommation lorsque des pans entiers de la consommation ont disparu ou chuté ? Ou encore quelle est la précision de l’indice alors que la crise sanitaire a impacté les prix correspondant à plus de quatre dixièmes de la consommation (https://www.insee.fr/fr/statistiques/4492639) ?

Ensuite, cette période a aussi été l’occasion d’innover dans la production des statistiques. Ainsi, l’évolution du PIB s’est appuyée sur la consommation d’électricité, sur les transactions par carte bancaire, ou sur les premières estimations du nombre de salariés ayant cessé de travailler. Des enquêtes exceptionnelles ont été lancées dans l’urgence, par exemple l’enquête spéciale du l’activité et les conditions d’emploi de la main d’œuvre pendant la période de la pandémie (Acemo Covid - Activité et conditions d’emploi de la main d’œuvre pendant la crise sanitaire Covid-19) ou encore l’enquête EpiCOV (2) . D’autres statistiques (par exemple sur la mobilité géographique) ont été produites en utilisant des données fournies par les opérateurs de téléphonie mobile, ouvrant la voie à une possible coopération durable avec ceux-ci. Certaines statistiques essentielles pour la compréhension de la circulation du virus (par exemple, nombre de décès) ont été produites plus rapidement et à un rythme plus fréquent.

Enfin, en cette période où chaque pays a fait face comme il a pu aux nouvelles circonstances, les comparaisons internationales deviennent plus difficiles, y compris pour des informations cruciales comme le nombre de décès attribuables à la pandémie. Sur les indicateurs économiques (PIB, chômage, prix) il est hasardeux d’interpréter pour l’instant les écarts entre pays, tant les estimations fournies par chacun sont vraisemblablement affectées de biais différents.

(1) Cela a hélas été confirmé par la publication des demandeurs d’emploi par Pôle Emploi fin avril (+22,6 % en catégorie A)
(2) Voir l’article suivant de cette lettre d’information



EpiCOV, une enquête sur l’épidémie de Covid-19 et sa dynamique

La connaissance du statut sérologique de la population est essentielle pour conduire la politique de lutte contre l’épidémie de Covid-19. Les estimations réalisées jusqu’à présent reposent sur des modélisations ; les hypothèses sur les paramètres, notamment celle portant sur la proportion de la population déjà infectée, s’appuient sur des observations localisées et spécifiques (populations confinées dans des bateaux, par exemple). Evaluer cette prévalence, en population générale, sur un échantillon représentatif de l’ensemble de la population, avec des indications précises sur la composition des ménages et de leurs conditions de vie pendant le confinement est important pour ceux qui conduisent la politique de déconfinement et pour les chercheurs travaillant sur les modélisations de l’épidémie.

Le service statistique public et la recherche se sont mobilisés pour répondre à ce besoin en lançant dans des délais très courts une grande enquête en population générale afin de comprendre la dynamique de l’épidémie et ses conséquences sur les conditions de vie. Un partenariat entre l’Inserm et la Drees, co-maîtres d’ouvrage, ainsi que l’Insee, Santé Publique France, l’Ined, le CNRS et les Universités, a été organisé en urgence, dans le respect des procédures et de la déontologie de l’ensemble des partenaires.

L’enquête reposera sur un échantillon aléatoire de grande taille (370 000 personnes) tiré par l’Insee et visant à une représentativité à l’échelle du département (hormis la Guyane et Mayotte, pour des raisons de faisabilité) et pour certains sous-groupes socio-démographiques (populations à bas revenus, notamment). 200 000 répondants sont attendus ; ils seront notamment questionnés sur leurs conditions de confinement, leurs symptômes éventuels, leur état de santé général et de bien-être. Pour des raisons d’efficacité et de comparabilité, le questionnaire est commun avec d’autres projets de recherche associés à des cohortes existantes, pour lesquelles l’enquête pourra servir d’échantillon-témoin. Des tests sérologiques seront réalisés sur un sous-échantillon de cent mille personnes. L’estimation départementale de la population ayant été en contact avec le virus devrait en être grandement améliorée.

L’enquête sera réalisée en multi-mode (téléphone et internet) et se déroulera en deux vagues. La première a été lancée le 30 avril, la seconde devrait se dérouler en juin. Un enjeu essentiel sera bien sûr de produire des résultats au plus vite…

Pour en savoir plus :
https://presse.inserm.fr/epicov-connaitre-le-statut-immunitaire-de-la-population-pour-guider-la-decision-publique/39141/
https://www.cnis.fr/wp-content/uploads/2020/05/AC_2020_Drees_Inserm_Epicov.pdf


L’éthique du statisticien en temps de crise

Dans la précédente livraison de La statistique dans la cité (n° 19), évoquant la réactivité de l’Insee dès le début de la pandémie due au SARS-CoV2, l’éditorial citait le code de déontologie statistique publié en février 1986 par l’Association des administrateurs de l’Insee (AIS) et l’Association des anciens élèves de l’Ensae (Astec, aujourd’hui Ensae-Alumni). Son article 7 évoquait le nécessaire compromis entre l’exigence de qualité et le devoir d’informer : « Si les conditions d'une opération paraissent techniquement contestables, le statisticien devrait refuser de la prendre en charge. Néanmoins, il peut lui sembler préférable d'accepter, lorsque son abstention ouvrirait la voie à des pratiques plus dommageables. ».

Une information de qualité est nécessaire tant aux politiques publiques qu’aux stratégies privées. Par métier et par fonction, les statisticiens se doivent de produire des chiffres opportuns et fiables pour fournir une telle information. Parfois, faute de données, de moyens ou de temps, cette double exigence ne peut être pleinement honorée. D’autres acteurs sociaux, économiques ou politiques sont alors tentés d’y pourvoir eux-mêmes, sans davantage disposer des données ou des techniques idoines : par intérêt ou de bonne foi, ils produisent des résultats biaisés ou non significatifs.

En général, devant une demande qu’il ne peut satisfaire selon les standards en vigueur, le statisticien expose cette incapacité. S’il ne peut obtenir les ressources ou les délais nécessaires, il s’abstient. Toutefois – c’est là ce que dit cet article – ce faisant, il laisse le champ libre à des pratiques impropres. Et, à des conséquences peut-être très dommageables. Or, il est peut-être le plus à même de faire quelque chose, un « bricolage » certes médiocre ou incertain, mais moins problématique que l’ersatz qu’un profane ou un charlatan fabriquerait. Lui, du moins, est conscient de l’imperfection et du risque encouru, et il se doit d’informer sur les limites de ce qu’il produira le cas échéant.

D’autres professions rencontrent un tel dilemme : un médecin sans instruments devant un accidenté, un ingénieur devant un dysfonctionnement, majeur et imprévu, d’une installation, … S’abstenir ou improviser ? Respecter les règles ou les ignorer ? Tenter un remède de fortune ? Un tel dilemme ne peut être tranché d’avance : il convoque le professionnel au plus aigu de son art. On oppose ainsi une éthique « de conviction » (respecter ce que je considère correct, garder les mains propres et ma réputation : advienne que pourra, je n’y serai pour rien) à une éthique « de responsabilité » (tout subordonner à l’objectif, quitte à répondre aussi bien de ce que j’aurai raté que de ce que je n’aurai pas tenté).


Il y a ...

... cinquante ans ...

Le printemps 1970 voit l’extinction de la circulation du virus H3N2 à la source de la pandémie qualifiée de « grippe de Hong-Kong ». Cette pandémie, plutôt oubliée aujourd’hui, avait frappé la France en deux vagues, l’une à l’automne 1968, et la seconde, plus dévastatrice, entre novembre 1969 et le printemps 1970. Selon les recherches faites en 2003 par Antoine Flahault et Alain-Jacques Valleron, épidémiologistes à l'Inserm, la grippe de Hong Kong aurait fait plus de 31 000 morts en France pour sa seule seconde vague et devrait être considérée comme la première pandémie de l'ère moderne. Elle aurait fait plus d’un million de morts à l’échelle de la planète.

... deux cents ans ...

Le 12 mai 1820 naît en Toscane Florence Nightingale dans une famille de la haute société britannique. Elle sera une pionnière des soins infirmiers modernes et de l’utilisation des statistiques dans le domaine de la santé. Elle est probablement plus connue dans les pays anglo-saxons que dans les pays latins. Le magazine Significance, revue de la Royal Statistical Society et de l’American Statistical Association, lui a consacré en avril un numéro spécial.

Bien qu’elle ait fait des études en mathématiques, elle se découvre à 25 ans une vocation d’infirmière, ce qui est rare au Royaume-Uni à cette époque (les hôpitaux sont pour les pauvres !), mais c’est surtout par son activité comme infirmière pendant la guerre de Crimée (1853 – 1854) qu’elle se fera connaître en attirant l’attention du corps médical sur l’importance de l’hygiène dans les hôpitaux. Henry Dunant lui-même reconnaissait que les idées qui l’avaient amené à fonder la Croix-Rouge avaient été influencées par son œuvre.

Mais sa formation mathématique l’amène aussi à s'intéresser très vite à la statistique et elle recourt fréquemment aux analyses statistiques dans ses compilations, analyses et présentations de données sur les soins médicaux et la santé publique. Elle a été une des premières à présenter visuellement les données statistiques ; elle utilise entre autres les diagrammes circulaires afin d'illustrer les causes de mortalité des patients de l'hôpital militaire où elle travaille. Dès son retour de Crimée, elle encourage les établissements de santé à collecter des données de mortalité par pathologie ou par intervention. Par ailleurs elle collabore activement à la préparation de la Classification internationale des maladies (CIM) et présente une communication remarquée au 4e Congrès International de Statistique (3) à Londres en 1860. Les résultats de mortalité concernant les établissements londoniens et provinciaux pour la période 1862-1866 ont été publiés dans le Journal of the Statistical Society of London, devenue en 1887 par charte royale la Royal Statistical Society.
La Journée internationale des infirmières est célébrée chaque année le jour de l’anniversaire de sa naissance. Ce jour-là est aussi la date de la journée mondiale de la fibromyalgie, Florence Nightingale ayant souffert une grande partie de sa vie de cette maladie chronique. Elle meurt le 13 août 1910 à Londres.

Pour en savoir plus : https://fr.wikipedia.org/wiki/Florence_Nightingale

(3) Pour une rapide histoire de ces congrès qui ont conduit à la création de l’Institut International de Statistique en 1885, voir par exemple https://www.isi-web.org/images/news/2020-03_ISI-135Years-Bodin.pdf


Humeur ou humour ?

Plusieurs médias se plaisent à rappeler que 9 victimes sur 10 de la pandémie du Covid-19 sont âgées de plus de 65 ans. Or si on regarde les tables de mortalité pour l’année 2018, on constate qu’un peu plus de 84 % des personnes décédées, toutes causes confondues, sont âgées de plus de 65 ans. Ces médias viennent de faire une découverte fondamentale : plus on vieillit, plus on a de chances de décéder !

Jean-Paul Sardon, directeur de recherches honoraire à l’Ined, a publié dans la revue numérique Telos un article sous le titre La grande vulnérabilité des personnes âgées face au Covid-19 : une illusion ?
Voir https://www.telos-eu.com/fr/societe/la-grande-vulnerabilite-des-personnes-agees-face-a.html.
Il écrit notamment :
On ne peut donc, aucunement, conclure à une surmortalité supplémentaire des 70 ans ou plus dans cette épidémie par rapport à celle mise en évidence dans la mortalité générale. En fait, face au Covid-19, les personnes âgées se trouvent dans les mêmes conditions que face aux autres risques de morbidité et de mortalité : ceteris paribus, les défenses immunitaires diminuent avec l’âge. Rappelons aussi une tautologie : plus on avance en âge, plus le risque de mortalité grandit et plus le nombre moyen d’années d’espérance de vie diminue.


Lu pour vous

Plusieurs articles parus dans Variances, le magazine Web de l’association des anciens élèves de l’Ensae :

Le 4 mars, F. Lequiller : Maîtriser les chiffres pour ne pas céder à la panique économique

Faut-il craindre un désastre économique après la crise sanitaire ? François Lequiller nous exhorte à raison garder. Par un calcul "de coin de table", présenté comme tel, il estime que le PIB de la France en 2020 pourrait se situer à 10 % au dessous de celui de 2019 : c'est beaucoup, c'est inédit, mais ce n'est pas un effondrement. Surtout, comparant avec la crise économique de 1929, il souligne que la situation actuelle est profondément différente. D'abord, l'origine de la baisse du PIB n'est pas économique, ni financière : c'est un « choc exogène », comme disent les économistes. Ensuite, et surtout, les outils de politique économique et sociale dont disposent les gouvernements sont bien supérieurs à ceux d'alors, qu'il s'agisse des politiques de relance, des « stabilisateurs » qui évitent que les revenus des ménages baissent comme la production, ou des outils de politique monétaire. Et les gouvernements semblent bien décidés à utiliser pleinement ces outils. L'avenir économique, à court terme, sera peut-être rude, mais il ne devrait pas être catastrophique.

Le 30 avril, A . Charpentier : Une courte histoire des expériences randomisées

Arthur Charpentier est professeur à l’UQAM (Université du Québec à Montréal). La crise de la pandémie Covid-19 a fait beaucoup parler ces derniers mois des essais cliniques et des expériences randomisées (controverses sur l’usage de l’hydroxychloroquine par exemple), y compris dans les médias non spécialisés : émissions télévisées, journaux grand public, etc. Arthur Charpentier ne se contente pas de décrire l’apport essentiel de Sir Ronald Fisher dans les années 1920 et 1930 au développement de ces méthodes mais dresse une vaste fresque historique à partir du XIXe siècle en évoquant leur apport à des domaines aussi divers que l’agronomie, la psychologie, la médecine et même le domaine du paranormal.


Dans les pages Idées du journal Le Monde daté du vendredi 5 juin, une tribune de Christian Babusiaux intitulée « La politique publique des données de santé est à réinventer ».

Christian Babusiaux est président de chambre honoraire à la Cour des Comptes et ancien président de l’IDS (institut national des données de santé). L’IDS a été intégré dans le HDH (Health Data Hub) (4). Dans cette tribune, Christian Babusiaux fait part des risques que, selon lui, présente l’hébergement de cette base de données par Microsoft Azure soumis à la législation américaine. Il estime qu’il s’agit d’une décision hâtive qui représente en fait un changement de paradigme par rapport aux principes qui inspiraient la création de l’IDS. Il insiste surtout sur l’inaptitude de l’HDH à répondre aux besoins que la pandémie a mis en évidence : notamment une bonne perception de ce qui s’est passé dans les Ehpad. Il demande une remise à plat et l’ouverture d’un débat sur les besoins individuels et collectifs de la population et sur nos valeurs. La politique des données de santé, conclut-il, est à réinventer sur la base d’un retour aux fondamentaux.

(4) Rappelons que le HDH a été largement évoqué lors du café statistique « Données de santé : où va-t-on ? » animé en octobre 2019 par Stéphanie Combes (Drees), et a fait l’objet d’un article dans le n° 18 de La Statistique dans la Cité paru le 15 novembre 2019.


Annonces

Deux réunions au Centre de conférence Pierre Mendès-France du ministère de l’économie et des finances, annoncées par le Cnis pour le mois de juin, ont été reportées à l’automne 2020 en raison de l’état d’urgence sanitaire : le 7 octobre un séminaire sur « le questionnaire et la diffusion des résultats du recensement de la population : Un dialogue entre producteurs et utilisateurs » et le 24 novembre un colloque sur le thème « Panels et cohortes statistiques, quels nouveaux outils pour éclairer le débat public ? ». Ces réunions sont ouvertes à tous, mais il convient de s’y inscrire à l’avance sur le site du Cnis.

Le 11e Colloque International Francophone sur les Sondages est reporté à l’automne 2021. Les dates précises seront communiquées dès que possible.


Cafés de la Statistique

La situation sanitaire nous a obligés à annuler les « cafés » prévus au 2e trimestre 2020. A l’heure où cette infolettre est préparée, nous ne pouvons malheureusement pas vous dire quand et sous quelle forme pourront reprendre nos cafés. Le bureau du groupe Statistiques et Enjeux Publics réfléchit aux thèmes qui pourront vous être proposés pendant la saison 2020-2021, qui incluront probablement des thèmes liés à l’actualité que nous subissons depuis trois mois. Toute suggestion des lecteurs de La Statistique dans la cité sera la bienvenue !


Responsable de l’infolettre : Marion Selz, présidente du groupe SEP
Rédacteur en chef : Jean-Louis Bodin
Secrétaire de rédaction : Jean-Pierre Le Gléau
Webmestre : Érik Zolotoukhine

SFdS - Société Française de Statistique
©2020 SFdS