POPP : explorer la population parisienne de l’entre-deux-guerres

La Lettre Histoire

#FOCUS

Les listes nominatives de recensement de la population permettent de connaître de nombreuses caractéristiques des habitants d’une commune. À Paris, il n’en existe que quatre : celles de 1926, 1931, 1936 et 1946 recensant la population de la capitale comptant alors près de trois millions d’individus. Bien trop conséquentes à relever à la main, celles de l’entre-deux-guerres (1926, 1931 et 1936) ont pu être océrisées grâce aux progrès de l’intelligence artificielle, puis corrigées et adaptées à l’analyse en sciences sociales qui peut désormais commencer. 

La démographie historique et l’intelligence artificielle

Les deux sources principales utilisées par les démographes historiens et historiennes sont les actes de naissance, mariage et décès (ou baptême, mariage et sépulture pour l’Ancien Régime) et les recensements de population. En France, ce sont surtout les premiers qui ont été les plus fréquemment mobilisés notamment car les recensements de population sont mal conservés avant 18361.

La constitution de bases de données est l’outil essentiel de la démographie historique. Pendant des décennies, les chercheurs et les chercheuses ont consacré une très grande partie de leur temps à relever les informations contenues dans les archives de population pour les reporter dans des tableaux statistiques à la main, puis grâce aux ordinateurs. Les progrès très récents de l’intelligence artificielle permettent désormais d’envisager cette collecte d’informations de manière automatique2. En plus du gain de temps, ces nouvelles techniques permettent d’envisager de travailler sur des populations plus vastes, et notamment sur les populations des grandes villes.

 

Le projet POPP

Le projet POPP (Projet d’océrisation des recensements de la population de Paris) est le fruit d’une rencontre interdisciplinaire entre Sandra Brée, chargée de recherche CNRS, démographe historienne au Laboratoire de recherche historique Rhône-Alpes3, et des informaticiens du Laboratoire d’informatique, du traitement de l’information et des systèmes4 — parmi lesquels Thierry Paquet, co-porteur du projet. La première souhaitait travailler sur les recensements parisiens de l’entre-deux-guerres afin de mieux connaître une population urbaine majeure pendant une période rarement étudiée en démographie historique ; les seconds, spécialistes de l’océrisation (de l’anglais OCR, optical character recognition, c’est-à-dire la reconnaissance optique des caractères) des documents anciens, avaient encore des leviers scientifiques à lever, notamment pour la lecture d’écritures manuscrites.

L’intérêt de travailler sur la population parisienne est multiple. Il faut, tout d’abord, préciser qu’en termes de listes nominatives de recensement, Paris laisse peu de choix puisqu’elles n’ont été dressées que pour quatre recensements, ceux de 1926, 1931, 1936 et 1946. Du début du xixe siècle à 19465, des recensements quinquennaux ont eu lieu en France les années se terminant en 1 et en 66. Leur but était de recueillir des informations sur l’ensemble des individus résidant dans le pays à un instant t. Sur cette base, des statistiques ont été dressées à partir des informations fournies par les individus et publiées dans les publications nationales (Figure 1). Comme celle des autres communes de France, la population parisienne a ainsi été recensée et a même fait l’objet de publications spécifiques par le bureau de statistique parisien, plus détaillées, notamment par arrondissements (voire par quartiers pour la période 1881-18967). Ce n’est malheureusement pas le cas pour l’entre-deux-guerres. Paris avait, par ailleurs, obtenu le droit de ne pas dresser de liste nominative de sa population (Figure 2)8, ce qui explique que la première qui existe ne date que de 1926, lorsque le bureau statistique de la ville estima que leur existence était importante9 pour les recherches statistiques sur la capitale.

image
Figure 1. Résultats pour la ville de Paris (distinguée du reste du département de la Seine) dans les Résultats
statistiques du dénombrement de la population de 1931
image
Figure 2. Liste nominative de la population de résidence habituelle du quartier Belleville en 1926, cote
ADP D2M8 696

Pourquoi chercher à connaître l’ensemble de la population — qui compte alors près de trois millions d’habitants — lorsque des sondages pourraient être menés à moindre coût ? Il existe plusieurs techniques d’échantillonnage des populations et, dans le cas des listes nominatives parisiennes, le plus simple aurait été de choisir quelques quartiers représentatifs des différentes populations parisiennes en termes de niveaux socioéconomiques, d’origine, etc. ; choix impliquant en eux-mêmes des biais de sélection. Cependant, connaître l’ensemble de la population permet d’étudier des groupes certes réduits en termes d’effectifs mais tout de même assez nombreux pour des analyses quantitatives significatives. Cette manière de procéder offre également la possibilité de suivre des individus d’un recensement à l’autre dans l’ensemble de la ville. 

image
Figure 3. Pyramides proportionnelles (pour 10 000) des populations parisienne et française en 1926
Sandra Brée et l'équipe de Popp. Populations & Sociétés, 636, septembre 2025, Ined
Sources : Résultats statistiques du recensement de la population (1926) et base Popp

Une base de donnée initiale a été produite grâce à une IA conçue spécifiquement pour le projet par l'équipe d'informaticiens du LITIS. Cette IA chargée de transcrire les écritures manuscrites dans les images des tableaux de recencement a permis d'atteindre un niveau de qualité particulièrement élevée par rapport aux résultats des précédents projets sur le sujet10. Il restait malgré tout un travail important de correction (mauvaise lecture de la machine ou décalage des colonnes), mais aussi d’adaptation de la base de données à l’analyse statistique11. Les nombreux scripteurs des listes nominatives n’ont, non seulement, pas la même écriture mais n’appliquent pas les instructions (quand il y en a) de la même manière ou n’utilisent pas les mêmes abréviations pour les mêmes mots. Il a donc fallu uniformiser la manière d’écrire l’ensemble des professions, départements ou pays de naissance, situations dans le ménage et prénoms. Le découpage des ménages a également été très compliqué car les consignes d’attribuer un numéro de ménage et de placer une accolade n’ont pas toujours été correctement respectées par les différents scripteurs, pas plus que de nommer correctement le ou la cheffe de ménage. Ces adaptations ainsi que la création de diverses variables non présentes dans les listes nominatives — comme la variable sexe — ont encore pris plusieurs années. Somme toute, l’ensemble de ce travail a pris un peu plus de cinq ans alors qu’il aurait sans doute pris quatre fois plus de temps sans le recours à l’IA (mais surtout n’aurait pas été envisagé). 

 

Résultats et perspectives

La partie informatique du projet, permettant la livraison d’une base brute, est achevée ; et la correction et l’adaptation de cette base aux analyses statistiques est en passe de l’être. En revanche les analyses du côté des  sciences humaines et sociales ne font que commencer (Figure 3)12. Un premier ouvrage sur la population parisienne de l’entre-deux-guerres, dirigé par Sandra Brée, Victor Gay13 et Marion Leturcq14, est en cours d’écriture. Il vise à apporter une analyse démographique, économique et sociale de la population parisienne de l’entre-deux-guerres à l’échelle de la ville et de ses quartiers et se veut également un guide de compréhension de la source, de la construction et de l’adaptation de la base de données POPP et de cadrage structurel pour les chercheurs et chercheuses qui souhaiteront utiliser la base par la suite15.

Le projet POPP avait également des ambitions de dissémination. Une partie de la base POPP (nom, prénom et adresse) a ainsi été versée aux Archives de Paris qui conservent et avaient déjà numérisé les listes nominatives. La recherche nominative est donc désormais possible dans les listes nominatives des recensements de la population parisienne de 1926, 1931 et 1936 sur le site des Archives de Paris. L’exposition Les gens de Paris, 1926-1936. Dans le miroir des recensements de population16 a, par ailleurs, été construite en prenant ces listes de l’entre-deux-guerres comme point de départ : des résultats statistiques issus des publications statistiques et de la base POPP ont été présentés sous forme d’infographies et la recherche nominative a été proposée via des ordinateurs mis à disposition dans la dernière salle de l’exposition.

image
Figure 4-1. Recherche nominative dans l’exposition. © Musée Carnavalet - Paris Musées - Pierre Antoine
image
Figure 4-2. Vue de l'outil : exemple d'une recherche nominative sur Jacques Prévert


 

Contact

Sandra Brée
Chargée de recherche CNRS, Laboratoire de recherche historique Rhône-Alpes (LARHRA)

Notes

 

  1. La démographie historique française a été très fortement influencée par les travaux de Louis Henry et de Pierre Goubert, proposant tous deux une étude des familles à partir des registres de population. Leurs travaux portant au départ surtout sur l’Ancien Régime, ils ne pouvaient s’appuyer que sur ces sources particulièrement bien conservées.
  2. Le projet POPP fait partie du SOSI ObHisPop : Observatoire de l’Histoire de la Population Française : grandes bases de données et démographie historique. (https://www.inshs.cnrs.fr/fr/cnrsinfo/obhispop-observatoire-de-lhistoire-de-la-population-francaise-grandes-bases-de-donnees-et)
  3. LARHRA, UMR5190, CNRS / ENS de Lyon Université GrenobleAlpes / Université Lumière Lyon 2 / Université Jean Moulin Lyon 3.
  4. LITIS, Université de Rouen Normandie / Université Le Havre Normandie / Institut national des sciences appliquées de Rouen Normandie. https://litislab.fr
  5. Des opérations de recensement sont effectués dès 1801 mais ce n’est qu’en 1836 que des instructions précises sont fournies sur la manière de procéder. Un exception parisienne existe par ailleurs puisque les départements de la Seine et de la Seine-et-Oise sont recensés en 1817 avec une méthode innovante de dénombrement individuel.
  6. À l'exception du recensement de 1871 qui fut reporté à 1872 en raison de la guerre avec la Prusse, et des recensements de 1916 et 1941 qui n'eurent pas lieu à cause des deux guerres mondiales. Après 1946, les recensements ont été espacés car les coûts étaient jugés trop élevés.
  7. Pour les années 1881, 1886, 1891 et 1896, ces publications sont intitulées : Résultats statistiques du dénombrement de [année] pour la ville de Paris et de département de la Seine et renseignements relatifs aux recensements antérieurs.
  8. Biraben J.-N. 1963, Inventaire des listes nominatives de recensement en France, Population, vol. 18, no 2 : 305-328.
  9. Herold B. 2025, Recenser à Paris, dans S. Brée, H. Ducaté et V. Guillaume (éd.), Les Gens de Paris 1926-1936. Dans le miroir des recensements de population, Paris-Musée : p. 20-21.
  10. Constum T. & al. 2022, Recognition and Information Extraction in Historical Handwritten Tables: Toward Understanding Early 20th Century Paris Census, Document Analysis Systems: 15th IAPR International Workshop, DAS 2022, La Rochelle, France, May 22–25, 2022, Proceedings :143-157.
  11. Brée S. & al., POPP. An OCR-Generated Database of the Population Censuses of Paris (1926-1936), Historical Life Course Studies, à paraître.
  12. Une première publication courte est parue comparant Paris et la France et Paris en 1926 et aujourd’hui. La base POPP a été ici utilisée en complément et pour détailler les résultats publiés des recensements de la population pour la ville de Paris (à ce sujet, voir : Brée S. et l'équipe de POPP, 2025, Paris, il y a 100 ans : une population plus nombreuse qu’aujourd’hui et déjà originaire d’ailleurs, Population et Sociétés, no 636. DOI : https://doi.org/10.3917/popsoc.636.0001
  13. Enseignant-chercheur en économie, membre de la Maison des Sciences Humaines et Sociales de Toulouse (MSHS-T, UAR3414, CNRS / Comue de Toulouse).
  14. Chargée de recherche à l’Ined.
  15. La base sera ouverte courant 2026 au groupe d’exploitation élargi pour proposer une conférence sur la population parisienne et un second ouvrage portant sur des recherches plus spécifiques sur certaines populations (selon le lieu d’origine, la profession, le quartier etc.), puis à l’ensemble des chercheuses et chercheurs qui en feront la demande auprès de Progedo-diffusion (probablement courant 2027).
  16. Exposition présentée au Musée Carnavalet-Histoire de Paris du 8 octobre 2025 au 8 février 2026. Commissariat : Valérie Guillaume, directrice du musée Carnavalet - Histoire de Paris ; Hélène Ducaté, chargée de mission scientifique au musée Carnavalet - Histoire de Paris ; Sandra Brée, chargée de recherche CNRS au Laboratoire de Recherche Historique Rhône-Alpes (LARHRA), commissaire invitée.