Consulter les offres d’emploi

Ingénieur Data Scientist

Publiée le 26/02/2026 13:46.

CDD, 2 Av. de la Source de la Bièvre, 78180 Montigny-le-Bretonneux.

Entreprise/Organisme :	Université de Versailles Saint-Quentin-en-Yvelines
Niveau d'études :	Master
Date de début :	01/04/2026
Secteur d'activité :	Bio-informatique
Description :	Le SEPSIS Comprehensive Center (IHU SEPSIS) est le premier centre au monde intégrant recherche, formation et soins dans une approche unifiée pour lutter contre le sepsis, principale cause de mortalité liée aux infections. Au sein de cet institut d’excellence, plusieurs programmes de recherche translationnelle s’appuient sur de vastes cohortes cliniques afin de réaliser un endotypage multi-omique (métabolomique, transcriptomique, génomique, etc.) et d’identifier de nouveaux biomarqueurs diagnostiques et théranostiques, en vue d’un transfert clinique rapide. Des milliers d’échantillons biologiques humains sont actuellement en cours d’analyse, générant des volumes massifs de données complexes. Leur traitement exige la mise en oeuvre de workflows analytiques avancés, combinant prétraitement du signal, normalisation, standardisation et modélisation statistique. L’objectif est de développer et d’appliquer des approches d’apprentissage automatique (machine learning) adaptées à des données de haute dimension, et d’intégrer des modèles longitudinaux pour la compréhension dynamique des réponses biologiques. Objectif du poste : Nous recherchons un(e) Data Scientist passionné(e) par la modélisation de données biomédicales complexes pour mettre en oeuvre des méthodes de data science appliquées à la métabolomique et à la transcriptomique dans le cadre de plusieurs projets cliniques du centre. Il s’agira en particulier de développer des méthodes d’apprentissage statistique et des workflows de traitement de données métabolomiques et transcriptomiques. Vos missions : • Exploiter et améliorer les codes existants développés au sein de l’équipe pour finaliser les analyses statistiques. • Concevoir, développer et automatiser des workflows pour le traitement des données métabolomiques et transcriptomiques. • Appliquer et comparer des modèles d’apprentissage automatique pour l’identification de biomarqueurs pertinents. • Contribuer à la valorisation scientifique des résultats. • Participer à la structuration et documentation des pipelines analytiques pour assurer leur reproductibilité et leur transfert au sein des équipes. Pourquoi nous rejoindre ? • Intégrer un projet scientifique ambitieux et interdisciplinaire, à l’interface entre data science, biologie, chimie analytique et santé. • Évoluer au sein d’une équipe dynamique, collaborative et hautement qualifiée regroupant chercheurs, cliniciens, bioinformaticiens et ingénieurs. • Contribuer directement à des projets à fort impact clinique et sociétal, soutenus par un institut hospitalo-universitaire de rang international. Profil recherché : • Formation : Bac+5 minimum (école d’ingénieurs, Master en data science, mathématiques appliquées, bioinformatique ou discipline équivalente) ou thèse • Compétences techniques : ▪ Excellente maîtrise de R et/ou Python ▪ Solides connaissances en statistiques appliquées, traitement du signal, apprentissage supervisé et non supervisé, sélection de variables et analyse multivariée. ▪ Une connaissance des données omiques (transcriptomique, métabolomique) serait un atout. Qualités attendues : ▪ Rigueur scientifique, autonomie et sens de l’initiative. ▪ Intérêt marqué pour les applications biomédicales et le travail collaboratif. ▪ Excellente communication écrite et orale, maîtrise de l’anglais (niveau B2–C1). Contrat : CDD rentre 9 et 12 mois, démarrage dès que possible Lieu : UFR Simone Veil - Santé, Université Versailles Saint-Quentin-en-Yvelines Contact : Pr Stanislas Grassin Delyle, Département de Biotechnologie de la Santé : stanislas.grassin-delyle@uvsq.fr
En savoir plus :	https://www.linkedin.com/posts/ihu-sepsis-comprehensive-sepsis-center_profil-de-poste-ugcPost-7391124299195097089-9Se2?utm_source=share&utm_medium=member_desktop&rcm=ACoAABc6HqQBd4bWfuBeNiB1odfDPOV-6x-5FQI
Contact :	stanislas.grassin-delyle@uvsq.fr

Epidémiologiste / Biostatisticien avec expertise SNDS

Publiée le 21/02/2026 10:54.

CDI, Toulouse.

Entreprise/Organisme :	Oncopole Claudius Regaud
Niveau d'études :	Doctorat
Description :	Description du poste L'Oncopole Claudius Regaud recherche un EPIDEMIOLOGISTE (BIOSTATISTICIEN avec expertise SNDS) (H-F) en CDI temps plein. Le poste est à pourvoir dès que possible. Au sein de la Direction de la Recherche et de l'Innovation (DRI), la cellule Biostatistics & Health Data Science apporte son expertise et prend en charge les aspects biostatistiques, épidémiologie et data-management des projets de recherches cliniques et épidémiologiques. L’épidémiologiste participe aux différentes phases des projets de recherche notamment ceux basés sur les données du Système National des Données de Santé, depuis la conception jusqu’à l’analyse et la valorisation des résultats. Il met en œuvre les démarches et interprète les analyses nécessaires à la conduite des études cliniques et épidémiologiques dans le respect de la confidentialité et de la règlementation en vigueur Vos missions : Participer à l’élaboration de la stratégie méthodologique et épidémiologique/statistique pour répondre aux questions de recherche concernant les projets impliquant notamment les données du Système National des Données de Santé Organiser et exploiter des bases de données complexes, notamment en lien avec les données du SNDS Réaliser les analyses épidémiologique/statistique dans le cadre des projets de recherche (rétrospectif ou prospectif) Assurer un support à la valorisation scientifique dans le cadre de la communication de résultats Contribuer à la démarche qualité notamment dans le traitement des données issues du SNDS Réaliser la veille scientifique et participer à des développements méthodologiques. Suivre la mise en œuvre du projet et informer l’équipe et le responsable scientifique et du service des dysfonctionnements et avancées. Le tout selon la règlementation en vigueur Avantages sociaux : CSE (chèques vacances, remboursement activités sportives, colis fin d'année...) Restaurant d'entreprise Crèche d'entreprise Remboursement des frais de transport à hauteur de 50% (accessibilité bus + Teleo) Nous rejoindre c'est intégrer un institut au coeur de l'innovation, de l'excellence, de la solidarité et de l'humanisme. Profil recherché / compétences requises Formations/Diplômes : Master 2 ou école d’ingénieur ou Thèse en science Expérience : Minimum 3 ans Expertise et habilitation SNDS requise Un profil de biostatisticien(ne) disposant d’une expertise avérée sur le SNDS est pleinement éligible pour ce poste Connaissance des exigences réglementaires et juridiques concernant notamment l’utilisation des données SNDS Anglais (lu, écrit, parlé) Maitrise des logiciels statistiques : SAS, Stata, R.
En savoir plus :	https://recrutement-icr.iuct-oncopole.fr/web/guest/home?p_p_id=com_beorntech_hrms_portal_web_GuestJo
Contact :	filleron.thomas@iuct-oncopole.fr

Stage M2 prévisions des impacts des covariables extrêmes

Publiée le 21/02/2026 10:54.

Référence : Stage M2 prévisions des impacts des covariables extrêmes.

Stage, AgroParisTech, MIA Paris-Saclay.

Entreprise/Organisme :	MIA Paris-Saclay
Niveau d'études :	Master
Durée du contrat :	6 mois
Description :	Ce stage vise à améliorer les prévisions des impacts des covariables extrêmes sur une réponse. L’étude de cas sur les impacts des vitesses du vent sur les conditions cycloniques en Guadalupe sera traité. Tous les détails sont disponibles ici : https://mia-ps.inrae.fr/node/955
En savoir plus :	https://mia-ps.inrae.fr/node/955 stage_2026_impacts.pdf
Contact :	gloria.buritica@agroparistech.fr

Postdoc - Socialisation algorithmique des modèles de langage (PIQ Inria)

Publiée le 10/02/2026 09:32.

Postdoc, Centre Max Weber (UMR5283).

Entreprise/Organisme :	ENS de Lyon
Niveau d'études :	Doctorat
Date de début :	Avril 2026
Durée du contrat :	16 mois
Rémunération :	Selon profil (voir description)
Description :	Dans le cadre du projet SERISIA – Sociologie expérimentale du rapport à l'IA et socialisation des algorithmes conversationnels, financé par le Programme Inria Quadrant, le Centre Max Weber (UMR 5283, ENS de Lyon) recrute un·e post-doctorant·e ou ingénieur·e de recherche en NLP/machine learning. Le contrat de 16 mois porte sur le déploiement et le fine-tuning d'un LLM open-weight dans le cadre d'une enquête sociologique à grande échelle, visant à étudier comment les modèles de langage peuvent encoder des structures sociales au fil d'interactions avec des publics socialement différenciés. Le recrutement est prévu pour le 1er avril 2026 (date flexible). L'annonce de poste complète est ci-jointe.
En savoir plus :	https://piq.inria.fr/projets/#SERISIA Fiche poste Serisia.pdf
Contact :	nathan.ferret@ens-lyon.fr

M2 Research internship in applied mathematics

Publiée le 29/01/2026 11:16.

Stage, Marseille.

Entreprise/Organisme :	SESSTIM, Université Aix-Marseille
Niveau d'études :	Master
Sujet :	Identifiability of dependence structures between event times and censoring in survival analysis.
Date de début :	Flexible
Durée du contrat :	4 à 6 mois
Description :	Context Modern survival analysis [1] routinely deals with complex follow-up data, where event times (e.g. relapse, death, recovery, disability) might not be observed for all subjects. Instead, follow-up may be interrupted by administrative end of study, loss to follow-up, or occurrence of competing events. In such situations, the standard assumption of independent censoring is often unrealistic: the mechanism that censors an individual can itself be related to their underlying risk. Ignoring this dependence may bias classical estimators (Kaplan–Meier, Cox models, log-rank tests, etc.) and lead to misleading conclusions for prognosis or risk evaluation. On the other hand, since Tsiatis [2] in 1975, the dependence structure hidden behind a censoring mechanism is known not to be nonparametrically identifiable. Recent developments [3], [4], [5] shows that it might be however parametrically identifiable, under conditions depending on the parametric models. However, outside a few simple parametric copula families[6], [7], little is known about the extent of these identifiability conditions. This internship will contribute to the development of new statistical methods to model dependence structures underlying censored observations using copulas and related tools, in order to better understand when reliable inference is still possible under censoring. The goal is to combine a focused literature review with first numerical experiments and reproducible code, laying the groundwork for more advanced methodological work on the topic. Objectives The main objective of the internship is to explore, from both a theoretical and practical perspective, how survival analysis can accommodate dependence between event times and censoring times. More concretely, the work will focus on: - Conducting a targeted literature review on dependent censoring, copula-based survival models and identifiability issues in censored data. - Develop mathematical tools and theoretical concepts to classify the parametric families into identifiable or not, include specifc cases of non-smooth dependence structures. - Implementing small-scale simulation studies (in e.g., Julia, R or Python) to illustrate the impact of dependent censoring on classical survival estimators and to test the practical identifiability of the developed models. - Depending on progress and interest, carrying out an illustrative case study on a publicly available dataset (e.g., large-scale registry or cohort data) to showcase the practical relevance of the methods investigated during the internship. The internship will take place at SESSTIM in a research environment combining applied mathematics and public health. Communication of the obtained results will be an integral part of the work. Depending on mutual interest and available funding, the internship may naturally evolve into a PhD project on advanced dependence modelling under censoring. Candidate's profile The following are strictly required: - Master 2 level in applied mathematics, statistics and/or computer sciences, with at least an introductory knowledge of probability and statistical inference. - Capacity to 1) write in LaTeX, 2) collaborate with Git, and 3) code in at least one scientific language (Julia, Python, R) - Very good written English. Prior experience in survival analysis (hazard, censoring, Kaplan–Meier, regression models) and/or copula modelling is a plus, but not strictly mandatory if the candidate is strongly motivated to learn these topics. We do not require prior knowledge of the Julia programming language (which may be used for the numerical part), only solid programming skills in at least one scientific language (R, Python, Julia, …) and the willingness to adapt. Additional informations - Length: 4 to 6 months, starting from February to April 2026. - Location: At SESSTIM, on the Faculté des Sciences Médicales et Paramédicales in Marseille, France. - Wages: Regulatory internship stipend at the Université Aix-Marseille (4€35/hour for 35h/week, about 600€/month) - To apply: Please send your application with a resume and a few motivational lines to oskar.laverny@univ-amu.fr with [Internship2026] in the subject. You may add links to previous scientific (related or not) projects you did. References [1] T. R. Fleming et D. P. Harrington, Counting processes and survival analysis, vol. 625. John Wiley & Sons, 2013. [2] A. Tsiatis, « A nonidentifiability aspect of the problem of competing risks. », Proc. Natl. Acad. Sci., vol. 72, no 1, p. 20‑22, janv. 1975, doi: 10.1073/pnas.72.1.20. [3] C. Czado et I. V. Keilegom, « Dependent censoring based on copulas », 14 avril 2021, arXiv: arXiv:2104.06872. doi: 10.48550/arXiv.2104.06872. [4] N. W. Deresa et I. V. Keilegom, « Copula Based Cox Proportional Hazards Models for Dependent Censoring », J. Am. Stat. Assoc., vol. 119, no 546, p. 1044‑1054, avr. 2024, doi: 10.1080/01621459.2022.2161387. [5] G. Crommen, N. W. Deresa, M. D’Haen, J. Ding, I. Willems, et I. Van Keilegom, « Recent advances in copula-based methods for dependent censoring », SORT-Stat. Oper. Res. Trans., p. 3‑42, 2025. [6] R. B. Nelsen, An introduction to copulas, 2nd ed. in Springer series in statistics. New York: Springer, 2006. [7] H. Joe, Dependence modeling with copulas. CRC press, 2014.
En savoir plus :	https://sesstim.univ-amu.fr/sites/default/files/quantim_internship_offer_dependence.pdf intership_dependent_censoring.pdf
Contact :	oskar.laverny@univ-amu.fr

CDD Analyse projet ANR TRAVERSEES

Publiée le 29/01/2026 11:16.

Référence : CDD Analyse TRAVERSEES.

CDD, Campus Condorcet, Aubervilliers (93).

Entreprise/Organisme :	Institut National d'Etudes Démographiques (INED)
Niveau d'études :	Master
Date de début :	01.04.2006
Durée du contrat :	12 mois
Secteur d'activité :	Recherche en science ssociales
Description :	Le projet TRAVERSEES est aligné sur les actions nationales de promotion et de diffusion des enquêtes nationales, produites par les institutions de la recherche et de la statistique publique, en mobilisant et en valorisant des jeux de données (Enquête Ined 3B), et en outillant une démarche applicable à d’autres enquêtes. Ce projet est le point de départ d’un champ de recherche large, visant à adresser des problématiques en lien avec la conception et l’opérationnalisation d’une chaîne complète de traitement des trajectoires sémantiques dans le domaine des SHS. Sur le plan statistique, nos contributions dans le domaine de l’analyse de séquences seront diffusées vers une communauté active et déjà solidement établie (notamment autour de l’université de Genève qui possède une longue expertise autour de l’analyse quantitative de données longitudinales et de l’analyse de séquences). Les missions de la personne recrutée viseront à • Produire des ensembles de données longitudinales issues de l’enquête 3B, cohérentes et documentées, en collaboration avec les collègues informaticiens et en SHS du projet ; • Faire un état de l’art des analyses déjà produites et publiées sur cette enquête, et en fournir une vision synthétique ; • Produire des analyses inédites et complémentaires, en relation avec des méthodologies utilisées maintenant en SHS sur ce type de données (analyses de séquences, analyses multiniveaux par exemple) ; • Avoir un recul nécessaire sur les analyses pour être force de proposition sur la pertinence et la limite des données. Il est par exemple attendu qu’une analyse approfondie de l’interaction entre les différents événements des trajectoires de vie et la détection d’éventuelles ruptures ou fragilités, conduise à une compréhension accrue des dynamiques et transformations sociales afin d’éclairer les politiques publiques et leur impact sur les trajectoires individuelles et collectives. A travers ces objectifs, la personne recrutée aura donc pour mission principale l’analyse d’enquêtes longitudinales par questionnaire, et participera : - A la revue de la littérature - A la rédaction de documents de synthèse et d’articles scientifiques - Aux activités collectives de l’équipe (réunions, groupes de travail, manifestations scientifiques...) - A la mise à disposition des matériaux produits et valorisation des enquêtes nationales aux communautés scientifiques SHS et Sciences Numériques
En savoir plus :	No link ined-anr-traversees.pdf
Contact :	recrutements@ined.fr

Stage : analyse des multi-résistances chez K. pneumoniae à partir d’approches de fouille de données

Publiée le 19/01/2026 16:39.

Stage, Paris 3ème.

Entreprise/Organisme :	Laboratoire MESuRS - Conservatoire national des Arts et Métiers (Cnam)
Niveau d'études :	Master
Description :	Le stage vise à analyser des données issues d’un large système français de surveillance de l’antibiorésistance en ville et en Ehpad, afin de mieux comprendre les phénomènes de multirésistance chez Klebsiella pneumoniae.
En savoir plus :	https://mesurs.cnam.fr/ Offre_stage_multirésistances_KP.pdf
Contact :	laura.temime@lecnam.net

Méthode de Sélection de Variables Basée sur les Résidus pour la Modélisation Côtière

Publiée le 15/01/2026 17:08.

Référence : Méthode de Sélection de Variables Basée sur les Résidus pour la Modélisation Côtière.

Stage, Anglet (France).

Entreprise/Organisme :	Université de Pau et des Pays de l'Adour
Niveau d'études :	Master
Sujet :	Contexte et Objectifs : La prédiction des régimes d'impact des vagues et de la dissipation d'énergie en zone côtière est cruciale pour la conception d'ouvrages maritimes et la gestion des risques. Ce projet propose de développer une méthode originale de sélection de variables basée sur les résidus, adaptée aux jeux de données hydrodynamiques où les prédicteurs sont souvent fortement corrélés (ex. : paramètres spectraux, caractéristiques des vagues). L'objectif est d'identifier les variables les plus informatives pour prédire : • Le wave friction factor (mesure de la dissipation d'énergie). • Les régimes d'impact des vagues (4 classes) et le nombre de collisions/franchissement
Date de début :	Mars 2026
Durée du contrat :	4 à 6 mois
Rémunération :	4.35€ par heure de stage soit environ 670€ par mois
Secteur d'activité :	Recherche
Description :	Méthodologie : Nous proposons une méthode itérative de sélection de variables basée sur les résidus, particulièrement adaptée aux situations où le nombre de variables dépasse le nombre d'observations (p > n). Cette approche repose sur : • Une analyse itérative des résidus pour identifier et éliminer les variables redondantes. • L'utilisation de critères de stabilité (comme le bootstrap) pour évaluer la robustesse des variables sélectionnées. • Une comparaison systématique avec des méthodes classiques (LASSO, Elastic Net, stepwise selection) pour valider les performances. Cette méthode permettra de sélectionner les variables les plus pertinentes tout en évitant le surapprentissage, même dans des contextes où les données sont limitées. Applications : La méthode sera appliquée à deux problèmes spécifiques en génie côtier.
En savoir plus :	https://lma-umr5142.univ-pau.fr/fr/index.html sujet_stage_2026_LMAP_SIAME.pdf
Contact :	benoit.liquet@univ-pau.fr

Méthodes statistiques et data-mining appliquées à un dispositif de jeu vidéo

Publiée le 22/12/2025 09:39.

Référence : Stage M2 Tactile Game.

Stage, 2 rue Conté, 75003 Paris.

Entreprise/Organisme :	Conservatoire National des Arts et Métiers (CNAM) - Laboratoire Cédric
Niveau d'études :	Master
Date de début :	Février 2026
Durée du contrat :	5 mois
Rémunération :	Gratification de stage
Description :	Ce stage de M2 en statistique s’inscrit dans le projet Tactile Game Lab : un atelier d’initiation à la création de jeux vidéo combinant numérique et objets physiques. L’atelier a déjà fait l’objet de plusieurs expérimentations qui ont permis de recueillir des données hétérogènes et multimodales. Le ou la stagiaire contribuera à l’analyse des données existantes, à l’évaluation critique des indicateurs mobilisés et à la réflexion méthodologique sur les dispositifs de collecte, notamment en vue de l’automatisation des traces d’activités.
En savoir plus :	https://cedricnuage.cnam.fr/nextcloud/index.php/s/SyB9LQA5NcokT2M Fiche de poste_stage_MSDMA_CEDRIC_CNAM.pdf
Contact :	feriel.bouhadjera@lecnam.net

Théorie minimax pour les contraintes de forme et de régularité

Publiée le 16/12/2025 09:25.

Thèse, Saint-Etienne.

Entreprise/Organisme :	Université Jean Monnet / Institut Camille Jordan
Niveau d'études :	Master
Secteur d'activité :	Statistiques mathématiques
Description :	Ce sujet de thèse en statistiques mathématiques, financé, devrait probablement être mis au concours de l'école doctorale pour un démarrage en septembre 2026. Il s'adresse aux étudiants de niveau M2 ayant un solide parcours en mathématiques et souhaitant s'intéresser à la théorie des statistiques. Un encadrement en stage de M2 est possible. Les personnes intéressées sont invitées à prendre contact dès que possible.
En savoir plus :	No link sujetEDsfds.pdf
Contact :	mathieu.sart@univ-st-etienne.fr

Comparaison de méthodes de classification multivues à l’aide du logiciel R

Publiée le 28/11/2025 09:06.

Stage, Tours.

Entreprise/Organisme :	UMR CITERES-LAT et UMR 6285 Laboratoire Lab-STICC
Niveau d'études :	Master
Sujet :	Comparaison de méthodes de classification multivues à l’aide du logiciel R : application à des données archéologiques
Date de début :	à discuter
Durée du contrat :	2 mois
Rémunération :	gratification selon le tarif en vigueur
Secteur d'activité :	statistique appliquée à l'archéologoie
Description :	Depuis de nombreuses années, le Laboratoire Archéologie et Territoires (CITERES-LAT , UMR 7324, CNRS – Université de Tours) collabore avec des équipes de statistique afin de concevoir des outils statistiques destinés à l’étude de la chronologie. Une méthode de Classification Ascendante Hiérarchique (CAH) par compromis a notamment été proposée afin de déterminer une partition consensuelle entre deux sources d’information (ex. céramique et stratigraphie) (Bellanger, Coulon, Husi 2021). Cette méthode est désormais implémentée dans le package R SPARTAAS (Statistical Pattern Recognition and daTing using Archeological Artefacts assemblageS) (Coulon, Bellanger, Husi 2023). Le stage volontaire de niveau M1 proposé s’inscrit dans le cadre du projet Arctools (OPEN CNRS) dont l’objectif est d’enrichir le package R SPARTAAS en finalisant sa brique chronologique. Le stage sera encadré en collaboration avec le laboratoire Lab-STICC (UMR 6285, Université Bretagne Sud) pour l’aspect méthodologique en statistique. L’objectif du stage est de mettre en œuvre sous R différentes méthodes de classification non supervisée multivues, puis de les évaluer et de les comparer à l’approche CAH par compromis développée. Les méthodes seront appliquées à des jeux de données simulés ainsi qu’à des données archéologiques réelles, en particulier un corpus céramique d’Angkor Thom (Cambodge, 9ᵉ–15ᵉ s.), déjà organisé au sein d’une base de données.
En savoir plus :	No link Stage_M1_Artools_2026.pdf
Contact :	lise.bellanger@univ-ubs.fr

Classification Ascendante Hiérarchique par compromis

Publiée le 28/11/2025 09:06.

Stage, Tours.

Entreprise/Organisme :	UMR CITERES-LAT et UMR 6285 Laboratoire Lab-STICC
Niveau d'études :	Master
Sujet :	Classification Ascendante Hiérarchique par compromis : extension, étude de robustesse et application à des données archéologiques
Date de début :	A discuter
Durée du contrat :	6 mois
Rémunération :	gratification selon le tarif en vigueur
Secteur d'activité :	statistique appliquée à l'archéologie et à la santé
Description :	Depuis de nombreuses années, le Laboratoire Archéologie et Territoires (CITERES-LAT1, UMR 7324, CNRS – Université de Tours) collabore avec des équipes de statistique afin de concevoir des outils statistiques destinés à l’étude de la chronologie. Une méthode de Classification Ascendante Hiérarchique (CAH) par compromis a notamment été proposée afin de déterminer une partition consensuelle entre deux sources d’information (ex. céramique et stratigraphie) (Bellanger, Coulon, Husi 2021). Cette méthode est désormais implémentée dans le package R SPARTAAS (Statistical Pattern Recognition and daTing using Archeological Artefacts assemblageS) (Coulon, Bellanger, Husi 2023). Le stage de niveau M2 proposé s’inscrit dans le cadre du projet Arctools (OPEN CNRS) dont l’objectif est d’enrichir le package R SPARTAAS en finalisant sa brique chronologique. Les missions confiées à la personne recrutée porteront sur l’extension de la CAH par compromis à plus de deux sources d’informations et incluront : (i) la validation d’une méthode d’optimisation du critère permettant l’obtention du compromis, ainsi que l’étude des propriétés et de la robustesse de cette approche ; (ii) la comparaison avec différentes méthodes de classification non supervisée multivues ; (iii) l’intégration de cette extension dans une fonction R dédiée du package SPARTAAS. Différents corpus de données archéologiques, provenant de l’étude de la céramique - source matérielle omniprésente en archéologie - pourront être mobilisés (fouilles archéologiques réalisées à Angkor Thom, capitale de l’empire khmer (9e et le 15e s.) ou dans le bassin de la Loire Moyenne).
En savoir plus :	No link Stage_M2_Arctools_2026.pdf
Contact :	lise.bellanger@univ-ubs.fr

Ingénieur de formation orienté Intelligence Artificielle

Publiée le 24/11/2025 10:06.

Référence : Ingénieur formation IA.

CDD, Troyes.

Entreprise/Organisme :	Université de Technologie de Troyes
Niveau d'études :	Doctorat
Date de début :	Dès que possible
Durée du contrat :	4 ans
Secteur d'activité :	Enseignement supérieur
Description :	Missions de l’agent : Rattaché à la Direction de la formation et de la pédagogie, l’ingénieur de formation orienté IA fera partie d’une équipe projet impliquant la formation initiale, la formation continue, la coopérative pédagogique (le centre d’innovation pédagogique de l’UTT). Il/elle jouera un rôle clé dans la conception, la structuration et la mise en œuvre de ce nouveau programme de formation, en collaboration avec des experts du domaine, des enseignants, des ingénieurs pédagogiques et des partenaires académiques. Il/elle pourra être amené(e) à organiser et animer des sessions de formation (CM, TD, TP, webinaire, …) en soutien au déploiement de nouveaux contenus. Enfin, il/elle pourra contribuer aux comptes rendus, rapports d’activité et constitution de pièces justificatives éventuellement demandées par le financeur H!Paris.
En savoir plus :	https://www.utt.fr F_H Ingénieur_Formation_IA.pdf
Contact :	drh-recrutement@utt.fr

Stage M2 (2026, 6 mois) : Approches statistiques de bioéquivalence pour médicaments injectables

Publiée le 21/11/2025 13:20.

Stage, Lille.

Entreprise/Organisme :	ULR 2694 Metrics, Université de Lille
Niveau d'études :	Master
Sujet :	Évaluation d’approches de bioéquivalence par modélisation pour le développement de génériques de médicaments injectables à libération prolongée
Date de début :	A partir de Janvier 2026
Durée du contrat :	6 mois
Rémunération :	610€/mois (4.35€ net/h)
Secteur d'activité :	Statistique, Pharmacométrie
Description :	Garantir l’accès à des génériques sûrs et abordables reste un défi, notamment pour les formes injectables à libération prolongée (LAI), dont les essais de bioéquivalence (BE) sont souvent complexes. L’approche Model-Based BioEquivalence (MBBE), fondée sur la modélisation pharmacocinétique (PK) de population, est adaptée aux échantillons peu denses, fréquents dans ce contexte. Elle est ainsi recommandée par la FDA depuis 2022 pour l’évaluation de la BE des LAIs. Une première stratégie MBBE, développée par l’équipe Moclid (Paris), a ensuite fait l’objet de développements complémentaires en collaboration avec l’équipe Metrics (Lille). Elle repose sur trois étapes : ajustement du modèle, estimation de l’incertitude, puis test de BE basé sur une hypothèse de normalité des paramètres PK d’intérêt. Une équipe du département de Pharmacie de l'université d'Uppsala propose une stratégie alternative, intégrant une étape de simulation de population, suivie d’une évaluation de la BE à partir de la distribution empirique des rapports de moyennes géométriques, sans hypothèse de distribution. L’objectif du stage est de comparer les deux stratégies MBBE décrites ci-dessus, à partir d’essais simulés de BE de LAI. La génération d’essais réalistes reposera sur une revue systématique des publications concernant un médicament LAI, suivie de la simulation des essais de BE selon différents scénarios.
En savoir plus :	No link M2_2026_MBBE_LAI.pdf
Contact :	florence.loingeville@univ-lille.fr

Développement de méthodes statistiques en causalité

Publiée le 13/11/2025 12:02.

Référence : Stage recherche en causalité.

Stage, Paris, 6ème arrondissement ou Lille, Cité scientifique.

Entreprise/Organisme :	Université Paris Cité ou Université de Lille
Niveau d'études :	Master
Sujet :	1) Causalité en présence d'une exposition multiple Dans les cours introductifs de causalité, le premier type d’effet causal à être présenté est en général l'``effet causal moyen'' (ATE) pour une exposition binaire A et une réponse continue Y. Dans ce cas, l'ATE est défini comme la différence entre les valeurs attendues de la réponse sous l’exposition et en absence de l’exposition : ATE = E[Y(1)] - E[Y(0)]. Pour certaines applications, il est intéressant de considérer l’effet d’une exposition vectorielle A dans un espace euclidien de dimension d. Dans ce contexte, le paramètre cible E[Y(a_1,…,a_d)] définit une fonction ``dose-réponse'' de R^d vers R. Pour identifier ce paramètre, on peut utiliser une approche basée sur les scores de propension multivariés. La difficultés consiste alors à estimer des fonctions de densités conditionnelles multivariées. Une méthode simple consiste à modéliser ces densités par régression linéaire multivariée (Fong 2018, Williams 2020). Nous souhaiterions explorer d’autres approches pour estimer ces densités multivariées conditionnelles à l’aide de méthodes non paramétriques ou paramétrique mais flexibles. Dans cette deuxième classe de méthodes, on trouve les approches basées sur des réseaux de neurones. Par exemple, Shi et al. (2019) décrivent une architecture pour l’estimation du score de propension pour une exposition réelle. Il serait intéressant d’étudier la généralisation à une exposition multivariée. Une autre piste intéressante est celle des flots génératifs (voir Papamakarios 2021). Le stage pourrait porter sur l’étude d’une, ou plusieurs de ces approches, avec une validation par simulations. Nous aurons aussi la possibilité d’appliquer ces méthodes à des données réelles issues d’une cohorte française pour étudier les effets d’un mélange de polluants organiques persistants sur un événement de santé. 2) Causalité en analyse de survie En analyse de survie causale, on s’intéresse à l'effet causal d’une exposition sur le temps avant un événement d’intérêt T en présence de données censurées. Le correspondant de l'ATE dans ce contexte est donné par la différence P(T(1)>t) - P(T(0)>t), ou son intégrale par rapport à t sur un intervalle limité. Les résultats d’identification de l’ATE sur données non-censurées peuvent s’étendre à ce cadre, en considérant des poids qui prennent en compte non seulement la probabilité conditionnelle du traitement mais aussi la fonction de survie conditionnelle de la censure (Cheng 2022). Cette approche donne un estimateur consistant si les modèles utilisés pour estimer les probabilités conditionnelles définissant les poids sont bien spécifiés. Des estimateurs doublement robustes qui sont consistants sous des hypothèses moins restrictives ont également été proposés (Rytgaard 2023). Ces estimateurs, appelés estimateurs ``d'apprentissage ciblé'' sont issus de la théorie de l’efficacité semi-paramétrique (voir par exemple le lien Github ``Introduction to modern causal inference'' de Schuler et van der Laan). La théorie mathématique sous-jacente à ces estimateurs est particulièrement riche et élégante mais demande un peu d’investissement. Le stage pourrait porter sur un travail bibliographique pour comprendre et présenter de façon accessible ces approches et, si possible, sur une validation par simulations. Il sera aussi possible d’appliquer les méthodes étudiées à des données de vie réelle pour étudier l’effet d’un traitement hormonal sur le cancer du sein.
Date de début :	A n'importe quel moment à partir du mois de février
Durée du contrat :	4 à 6 mois
Rémunération :	660 euros par mois
Secteur d'activité :	Statistique
Description :	1) Causalité en présence d'une exposition multiple Dans les cours introductifs de causalité, le premier type d’effet causal à être présenté est en général l'``effet causal moyen'' (ATE) pour une exposition binaire A et une réponse continue Y. Dans ce cas, l'ATE est défini comme la différence entre les valeurs attendues de la réponse sous l’exposition et en absence de l’exposition : ATE = E[Y(1)] - E[Y(0)]. Pour certaines applications, il est intéressant de considérer l’effet d’une exposition vectorielle A dans un espace euclidien de dimension d. Dans ce contexte, le paramètre cible E[Y(a_1,…,a_d)] définit une fonction ``dose-réponse'' de R^d vers R. Pour identifier ce paramètre, on peut utiliser une approche basée sur les scores de propension multivariés. La difficultés consiste alors à estimer des fonctions de densités conditionnelles multivariées. Une méthode simple consiste à modéliser ces densités par régression linéaire multivariée (Fong 2018, Williams 2020). Nous souhaiterions explorer d’autres approches pour estimer ces densités multivariées conditionnelles à l’aide de méthodes non paramétriques ou paramétrique mais flexibles. Dans cette deuxième classe de méthodes, on trouve les approches basées sur des réseaux de neurones. Par exemple, Shi et al. (2019) décrivent une architecture pour l’estimation du score de propension pour une exposition réelle. Il serait intéressant d’étudier la généralisation à une exposition multivariée. Une autre piste intéressante est celle des flots génératifs (voir Papamakarios 2021). Le stage pourrait porter sur l’étude d’une, ou plusieurs de ces approches, avec une validation par simulations. Nous aurons aussi la possibilité d’appliquer ces méthodes à des données réelles issues d’une cohorte française pour étudier les effets d’un mélange de polluants organiques persistants sur un événement de santé. 2) Causalité en analyse de survie En analyse de survie causale, on s’intéresse à l'effet causal d’une exposition sur le temps avant un événement d’intérêt T en présence de données censurées. Le correspondant de l'ATE dans ce contexte est donné par la différence P(T(1)>t) - P(T(0)>t), ou son intégrale par rapport à t sur un intervalle limité. Les résultats d’identification de l’ATE sur données non-censurées peuvent s’étendre à ce cadre, en considérant des poids qui prennent en compte non seulement la probabilité conditionnelle du traitement mais aussi la fonction de survie conditionnelle de la censure (Cheng 2022). Cette approche donne un estimateur consistant si les modèles utilisés pour estimer les probabilités conditionnelles définissant les poids sont bien spécifiés. Des estimateurs doublement robustes qui sont consistants sous des hypothèses moins restrictives ont également été proposés (Rytgaard 2023). Ces estimateurs, appelés estimateurs ``d'apprentissage ciblé'' sont issus de la théorie de l’efficacité semi-paramétrique (voir par exemple le lien Github ``Introduction to modern causal inference'' de Schuler et van der Laan). La théorie mathématique sous-jacente à ces estimateurs est particulièrement riche et élégante mais demande un peu d’investissement. Le stage pourrait porter sur un travail bibliographique pour comprendre et présenter de façon accessible ces approches et, si possible, sur une validation par simulations. Il sera aussi possible d’appliquer les méthodes étudiées à des données de vie réelle pour étudier l’effet d’un traitement hormonal sur le cancer du sein.
En savoir plus :	https://obouaziz.github.io/supervision.html Stage_Causalite.pdf
Contact :	olivier.bou-aziz@univ-lille.fr

Page précédente 1 <2> 3 Page suivante