Consulter les offres d’emploi

Physically interpretable AI emulator for hydrological extremes
Publiée le 03/04/2025 09:18.
Référence : PhD thesis, Montreal, Canada.
Thèse, Polytechnique Montréal, Canada.
Entreprise/Organisme :Polytechnique Montréal, Canada
Niveau d'études :Doctorat
Sujet :This PhD project offers a unique opportunity to contribute either to the advancement of deep learning methodologies or to hydrological impact studies, depending on the candidate's expertise and interests. The focus is on developing physically-coherent deep learning (DL) emulators that can downscale low-resolution climate projections to high-resolution outputs. These emulators will ensure physical consistency between key meteorological variables (e.g., precipitation, temperature) and improve their interpretability for practical applications. From a deep learning perspective, this project aims to address challenges in uncertainty quantification and the integration of physical constraints into DL emulators, offering the potential to work on cutting-edge techniques in AI applied to environmental systems. Alternatively, from a hydrological impact studies perspective, the project aims to assess climate change's impacts on small watersheds using emulated meteorological variables, with a particular focus on streamflow prediction and extreme events such as flooding. This interdisciplinary project has far-reaching implications for both fields, contributing to better climate adaptation strategies and enhanced hydrological risk assessments.
Secteur d'activité :AI for climate
Description :See above description of thesis project.
En savoir plus :https://www.polymtl.ca/expertises/en/physically-interpretable-ai-emulator-hydrological-extremes-carr
Contact :julie.carreau@polymtl.ca
Intégration de données multi-omiques appariées à grande échelle
Publiée le 31/03/2025 08:16.
Thèse, Jouy-en-Josas ou Toulouse.
Entreprise/Organisme :INRAE
Niveau d'études :Master
Sujet :Le/la doctorant·e sera en charge de la mise au point de méthodes d’intégration de données omiques pour identifier les relations entre marques génétiques d’intérêt et signaux transcriptomiques, spécifiques ou partagés entre plusieurs sous-populations. Ces méthodes seront la base pour la définition de relations spécifiques à une espèce donnée ou, au contraire, conservées entre espèces et permettront une meilleure caractérisation de la variabilité des phénomènes de régulation. Pour motiver les développements méthodologiques de cette thèse, le/la doctorant·e s’appuiera sur des données chez le porc qui ont été générées et précédemment analysées dans le cadre du projet H2020 GENE-SWitCH. Brièvement, des données transcriptomiques (RNA-seq) dans trois tissus (muscles, duodenum, foie) couplées avec le séquençage du génome entier ont été collectées pour 3 races commerciales (Large White, Landrace, Duroc), avec n=100 animaux par race. L’analyse eQTL présentées dans Crespo-Piazuelo et al. (2023) s’est focalisé sur un modèle global pour les 3 races, et n’a pas pu mettre en évidence des associations spécifiques à l’une ou plusieurs d’entre elles.
Date de début :automne 2025
Durée du contrat :36 mois
Rémunération :environ 2200-2300€ bruts
Secteur d'activité :Recherche
Description :La thèse sera réalisée sur le site INRAE de Jouy-en-Josas dans l’Unité GABI (Génétique Animale et Biologie Intégrative). Il sera toutefois possible de la localiser alternativement sur le site INRAE de Toulouse dans l’Unité MIAT (Mathématiques et Informatique Appliqués à Toulouse). Dans les deux cas, l’équipe d’encadrement sera composée d’Andrea Rau (GABI) et de Nathalie Vialaneix (MIAT). Nous nous appuierons notamment sur des réunions hebdomadaires en visioconférence ainsi que des outils collaboratifs (e.g., Mattermost pour des messages quotidiens et les comptes rendus des réunions hebdomadaires, Gitlab pour le partage de scripts R/Python, Nextcloud pour le partage de documents) pour assurer une bonne communication entre le/la doctorant·e et l’équipe d’encadrement. Nous prévoyons également d’organiser ponctuellement mais régulièrement des séjours courts (~1 semaine) dans l’unité complémentaire pour permettre le/la doctorant·e de bénéficier des deux environnements scientifiques.
En savoir plus :No link
PhD_2025_GABI-MIAT_Rau-Vialaneix.pdf
Contact :nathalie.vialaneix@inrae.fr
CDD data-management
Publiée le 28/03/2025 08:46.
CDD, Montpellier.
Entreprise/Organisme :INRAE
Niveau d'études :DUT/Licence ou équivalent
Durée du contrat :3 mois
Description :Le/la data-manager sera responsable de la structuration et de la documentation d'une base de données complexe, provenant de sources variées et de formats multiples. En effet, une partie des informations collectées est traitée grâce à des technologies avancées telles que l’OCR (Reconnaissance Optique de Caractère) et les LLMs (Large Language Models) tandis qu’une autre partie est saisie sur l’outil REDCap. L'objectif principal sera de garantir la cohérence et l'exploitabilité de la base de données pour permettre des analyses statistiques précises et fiables.
En savoir plus :https://umr-moisa.cirad.fr/l-unite
CDD_Data_Manager.pdf
Contact :pascaline.rollet@inrae.fr
Poste ATER Statistique CNAM (candidature avant le 2 avril 2025)
Publiée le 28/03/2025 08:46.
Référence : Poste ATER Statistique CNAM.
CDD, 2 Rue Conté, 75003 Paris.
Entreprise/Organisme :CNAM
Niveau d'études :Doctorat
Date de début :1/09/25
Durée du contrat :1 an
Secteur d'activité :Recherche secteur public
Description :Un poste d'ATER en Mathématiques appliquées (statistique) est actuellement publié au Conservatoire National des Arts et Métiers. La personne recrutée intégrera l'équipe pédagogique du département Mathématiques et Statistique et effectuera sa recherche au sein de l'équipe Méthodes statistiques de data-mining et apprentissage du laboratoire CEDRIC. Fiche de poste : https://presentation.cnam.fr/medias/fichier/ater-05-tp-apprentissages-des-donnees-statistiques-epn06_1741080222419-pdf?ID_FICHE=1163521&INLINE=FALSE Date de clôture : 2 avril 2025 16h00 Modalités de candidature : https://presentation.cnam.fr/le-cnam-recrute/recrutement-ater-campagne-2025-1490673.kjsp
En savoir plus :https://presentation.cnam.fr/medias/fichier/ater-05-tp-apprentissages-des-donnees-statistiques-epn06
ATER 05_TP_Apprentissages des données statistiques_EPN06 (3).pdf
Contact :iraj.mortazavi@cnam.fr
Ingénieur.e en biostatistique
Publiée le 28/03/2025 08:46.
CDD, Lille.
Entreprise/Organisme :Plateforme Bilille - UAR 2014 - US 41 Plateformes Lilloises en Biologie et Santé
Niveau d'études :Master
Date de début :Prise de fonction dès que possible.
Durée du contrat :CDD de 12 mois renouvelable
Rémunération :Suivant l’expérience et les grilles de l'université de Lille.
Secteur d'activité :Plateforme de Bioinformatique et Biostatistique
Description :La plateforme de bioinformatique et biostatistique Bilille est l’une des 8 plateformes scientifiques et technologiques de l’unité PLBS (Plateformes Lilloises en Biologie et Santé) au service d’unités de recherche académiques en sciences de la vie et de la santé. Les domaines d’activité de Bilille portent notamment sur l'analyse de données -omiques, la biologie intégrative, la phylogénie, la biologie des systèmes, l’imagerie, et la bioinformatique structurale. Afin de renforcer son pôle biostatistique, Bilille recrute un.e ingénieur.e d’étude (IE) ou de recherche (IR) en biostatistique, en CDD pour une durée initiale de 12 mois. L'activité principale de la personne recrutée sera d'assurer la réalisation et la conduite de projets d’analyse de données biologiques (omiques, cliniques, imagerie, …) avec des outils statistiques appropriés - Recueillir les besoins et définir la stratégie de réponse la plus adaptée - Mettre en oeuvre les méthodes statistiques appropriées pour l’analyse - Apporter le conseil aux utilisateurs qui ont besoin de mettre en œuvre des outils statistiques - Synthétiser et présenter les résultats de manière adaptée au public (biologistes, statisticiens, bioinformaticiens) Formation requise : master ou diplôme d’ingénieur en (bio)statistique. Prise de fonction dès que possible.
En savoir plus :https://bilille.univ-lille.fr/news/detailed-news/join-bilille-team
202501_IE_IR_biostat_offre_poste.pdf
Contact :bilille@univ-lille.fr
Biostatistician in Advanced Methods department – Permanent position
Publiée le 28/03/2025 08:45.
CDI, Bordeaux.
Entreprise/Organisme :HORIANA
Niveau d'études :Master
Description :Horiana is a consulting company dedicated to epidemiology and biostatistics, designing and conducting real world healthcare studies. Horiana aims to support its clients − private and public/academic professionals in the healthcare field − at all stages of their projects. Within the Advanced Methods Department, you will be in charge of developing/implementing/reviewing innovative RWS methods, and performing Indirect Treatment Comparisons, as External Control Arms analyses, including documentation for regulatory purposes. You will closely work with our internal and external experts in various therapeutic fields such as oncology, infectious diseases, or rare disease for instance. You will also be involved in facilitating technical training on biostatistics and data science. Profile - A Master of Science (MSc) or Ph.D. degree in applied statistics in the fields of health and life sciences - At least 2-3 years of relevant experience as a biostatistician in a CRO, pharma, or academic environment - Experience in RWS or clinical studies - Good statistical programming skills (R as a minimum) - Good knowledge of regulatory standards (ISPOR, ICH, FDA, EMA, ENCEPP, HAS…) - Fluency in English - Autonomy, organization skills, and the ability to identify priorities - Aspiration for excellence and performance - Strong curiosity for unusual statistical methods -Willingness for training facilitation and knowledge sharing -Team spirit Mission • Write and review study statistical documentation (methodology, presentation, interpretation …) • Implement (programming) of relevant statistical analyses (NMA, MAIC, ITC, unconventional methods…) • Deliver the studies within timelines and quality standards • Contribute in building future projects and valorizing the results … • Write/collaborate in the drafting of quality documentation related to statistics • Build & maintain a deep level of innovative statistical skills Salary according to skills and experience Contact: info@horiana.com
En savoir plus :https://horiana.com/
20250319 Biostatistician Position Advanced.pdf
Contact :info@horiana.com
Phd proposal in Physics-informed Machine Learning with applications in Materials Science
Publiée le 21/03/2025 13:07.
Thèse, Clermont-Ferrand, France.
Entreprise/Organisme :Phimeca - Aubert & Duval / SIGMA Clermont - LIMOS
Niveau d'études :Master
Sujet :Development of a Robust Inverse Optimization Methodology for the Design of New Steel Grades
Durée du contrat :3 years
Description :This PhD proposal is an excellent opportunity for persons interested in hybrid modeling, combining physics-based and AI-driven approaches, to accelerate the development of new steel grades while enhancing their robustness against various sources of uncertainty. Title: Development of a Robust Inverse Optimization Methodology for the Design of New Steel Grades Context and Objectives: The development of new steel grades follows a complex process, requiring multiple iterations between the target chemical composition, transformation processes, and heat treatments. This process is constrained by costs and uncertainties related to processing parameters and final material properties. The objective of this PhD is to develop a digital virtual testing tool that identifies the most promising chemical compositions for specific performance requirements. The approach relies on a multi-objective, multi-criteria inverse optimization, leveraging hybrid models that combine phenomenological laws with data-driven machine learning methods. Scientific and Technological Challenges: This research aims to overcome several methodological and technological challenges, including: - Hybrid modeling, combining multi-fidelity physical models and machine learning algorithms to establish relationships between chemical composition and material properties. - The development of a forward and backward simulation chain, integrating nested and multi-scale models to assess the impact of elaboration, transformation, and heat treatment parameters. - The inverse optimization problem formulation in a high-dimensional space (continuous and discrete variables, uncertainties, industrial constraints), requiring the development of robust statistical learning algorithms. Work Plan: - Literature review on inverse optimization methods and machine learning approaches applied to materials science. - Analysis of industrial databases provided by Aubert & Duval, extracting relevant features and preparing machine learning models. - Building a numerical model chain, integrating physical models and machine learning algorithms, to predict properties at different scales (microstructure and end-use properties). - Developing inverse optimization algorithms to identify optimal chemical compositions under industrial constraints. Candidate Profile: - Engineering or Master’s degree with strong background in machine learning and statistics. - Knowledge of materials science and experimental data analysis is a plus. - Experience in computer programming and numerical modeling. - Interest in applied research and interdisciplinary approaches (physical modeling, artificial intelligence). Supervision and Work Environment: - The PhD will be conducted at Phimeca Engineering (Cournon-d’Auvergne, France) in collaboration with Aubert & Duval. - Enrollment at LIMOS (CNRS UMR 6158, Clermont-Ferrand). - Supervision by Jean-Marc Bourinet, Julien Ah-Pine, Cécile Mattrand, and Antoine Gomond. - Funding CIFRE ANRT PhD. The application should include: - CV and cover letter. - Transcripts from the last three years. - Two recommendation letters. Contacts - bourinet@sigma-clermont.fr - julien.ah-pine@sigma-clermont.fr - cecile.mattrand@sigma-clermont.fr - gomond@phimeca.com
En savoir plus :No link
PhDthesis_Phimeca_AubertetDuval_SigmaClermont.pdf
Contact :julien.ah-pine@sigma-clermont.fr
Poste d'ATER en section 26-27 - Département Science des Données IUT2 Grenoble
Publiée le 19/03/2025 09:48.
CDD, Grenoble.
Entreprise/Organisme :UGA/IUT2/Science des données
Niveau d'études :DUT/Licence ou équivalent
Date de début :01/09/2025
Durée du contrat :1 an
Description :Descriptif Enseignement : Le candidat ou la candidate sera amené(e) à intervenir dans différentes ressources et SAE du département, tant en informatique pour la science des données qu’en statistique, pour chacune des 3 années de la formation, en particulier en : - Systèmes d’information décisionnels, programmation Python ou Web pour la science des données - Statistique descriptive, programmation statistique, méthodes statistiques - Introduction au Big Data et à l’Intelligence Artificielle. Descriptif Recherche : Le candidat ou la candidate s’engage à rejoindre une des équipes d’un laboratoire grenoblois du pôle Mathématiques Sciences et Technologies de l’Information et de la Communication (MSTIC) de l’UGA (LIG, LJK, TIMC, etc.).
En savoir plus :https://www.stid-grenoble.fr
Profil ATER 2025_SD_CNU 26MCF2227_26-27.pdf
Contact :agnes.front@univ-grenoble-alpes.fr
Intégration multimodales avec données manquantes en blocs dans l'étude des effets à faibles doses
Publiée le 19/03/2025 09:23.
Référence : Thèse Bio-statistique/ Bio-informatique.
Thèse, Fontenay-aux-Roses.
Entreprise/Organisme :L'Autorité de sûreté nucléaire et de radioprotection (ASNR)
Niveau d'études :Master
Date de début :01/10/2025
Durée du contrat :3 ans
Description :Problématique et Objectifs: Des études épidémiologiques montrent l’effet d’une exposition à des rayonnements ionisants (RI) sur le développement de maladies cardiovasculaires (MCV, comme l'athérosclérose ou les accidents vasculaires cérébraux) pour des doses fortes à modérées (au-dessus de 500 mGy). La capacité statistique actuelle est contestée pour qualifier l’effet d’une exposition aux RI sur les MCV à des doses faibles compte tenu des biais, tel que les facteurs de confusion, au premier rang desquels le stress, connu pour activer le système nerveux sympathique impliqué dans les MCV. Or les MCV constituent une préoccupation forte de santé publique, responsable de la mort de près de 17,9 millions de pers./an selon l’Organisation Mondiale de la Santé. Pour faire progresser la compréhension des conséquences d’une exposition aux RI à faibles doses, les analyses s’appuient sur les données multi-omiques de la réponse biologique d’un organisme vivant. Toutefois, la diversification des types de données utiles à la réduction des facteurs de confusion induit une augmentation du risque de biais lié aux données manquantes, pour lequel le plafond acceptable établi entre 20 % et 30 % est ainsi souvent dépassé. Considérant qu’éliminer les données manquantes peut réduire gravement la précision de l’analyse, la thèse vise à construire une méthode d’analyse qui permette de traiter les données multi-omiques tout en intégrant les données manquantes à l’analyse des effets d’une exposition faible aux RI sur les MCV. Travaux -méthodes et moyens: Face à l’abondance croissante de données dans l’étude des effets des rayonnements ionisants (RI) à faible dose (RNA-seq, métabolomique, lipidomique…), l’exploitation efficace des données est confrontée au défi de la gestion des données manquantes induites par la diversification des données prise en compte. En effet celle-ci génère un ensemble d’échantillons/sujets inobservés pour certains types de données, formant des blocs des données manquantes. Ainsi, des approches méthodologiques spécifiques sont nécessaires pour intégrer les différentes modalités de données, en tenant compte des problématiques liées aux données manquantes et à la présence de facteurs confondants (dont les co-expositions), afin d'identifier les mécanismes d’action impliqués dans la réponse d’un organisme à un stress particulier. S’appuyant sur des données déjà générées, le.a candidat.e sera impliqué.e dans le développement d’algorithmes et de modèles statistiques pour l'analyse de grands ensembles de données biologiques, afin d’y intégrer convenablement le traitement des données manquantes et des facteurs confondants, notamment des co-expositions (Goujon E et al., 2024). Le.a candidat.e aura la charge de développer, tester et évaluer les outils statistiques en s’appuyant sur les méthodes proposées dans la littérature (Peltier C et al., 2023 ; Baena-Miret S et al. 2024). Les deux premières années de la thèse seront consacrées au développement méthodologique pour l’imputation des données et l’incorporation des facteurs dans une analyse intégrative. Et la dernière année sera consacrée à l’analyse des données et à l’interprétation des résultats par une analyse d’enrichissement des voies biologiques. La publication des résultats dans des revues internationales et la participation à des conférences sont attendues, notamment au sujet du développement méthodologique relatif à l’imputation des données multi-tableaux et des apports de l’intégration multimodale à l’étude des effets des facteurs de co-exposition sur les maladies cardio-vasculaires. Références: Elen Goujon, Olivier Armant, Clément Car, Jean-Marc Bonzom, Arthur Tenenhaus, and Imène Garali. Batch Effect Correction in a Confounded Scenario: a Case Study on Gene Expression of Chornobyl Tree Frogs. In Roberta Gori, Paolo Milazzo, and Mirco Tribastone, editors, Computational Methods in Systems Biology, pages 89–107, Cham, 2024. Springer Nature Switzerland. Peltier C, Le Brusquet L, Lejeune FX, Moszer I, Tenenhaus A (2022). “Missing Values in RGCCA: Algorithms and Comparisons.” In 8th International Conference on Partial Least Squares Structural Equation Modeling (PLS’22). Baena-Miret S, Reverter F, Vegas E. A framework for block-wise missing data in multi-omics. PLoS One. 2024 Jul 23;19(7):e0307482. doi: 10.1371/journal.pone.0307482. PMID: 39042603; PMCID: PMC11265675. Profil recherché: Le ou la candidat(e) doit être titulaire d’un master en Mathématique appliquées, Statistiques (parcours data et/ou analyse et modélisation des données) ou domaine connexe avec un intérêt pour la recherche en biologie ou en santé. Le ou la candidat(e) devra posséder un solide bagage théorique en algèbre linéaire et en statistique. Afin de valider et d’appliquer les méthodes développées, il est demandé la maitrise d’outils de programmation tels que R et Python. Un bon niveau d’anglais est essentiel. La capacité à travailler en équipe multidisciplinaire sera appréciée. Informations complémentaires: Le.a doctorant.e effectuera 60% de son temps de recherche au sein du LRAcc à l’ASNR sous l’encadrement de Dr. GARALI Imène (imene.garalizineddine@irsn.fr) et 40% au L2S (CentraleSupelec, Paris) sous la direction du Pr. TENENHAUS Arthur (arthur.tenenhaus@centralesupelec.fr). Des réunions régulières avec les biologistes du LRTOX à l’ASNR sont prévues.
En savoir plus :https://irsn-career.talent-soft.com/offre-de-emploi/emploi-integration-multimodales-avec-donnees-manquantes-en-blocs-dans-l-etude-des-effets-a-faibles-doses-h-f_1184.aspx
ASNR - Intégration multimodales avec données manquantes en blocs dans l'étude des effets à faibles doses H_F.pdf
Contact :imene.garalizineddine@asnr.fr
Post-Doc in Machine Learning (Multiple Fairness in Recommending Systems)
Publiée le 05/02/2025 10:39.
Référence : Postdoc in Télécom Paris.
CDD, Télécom Paris, 19 Place Marguerite Perey, 91120 Palaiseau.
Entreprise/Organisme :Télécom Paris
Niveau d'études :Doctorat
Date de début :Printemps 2025
Durée du contrat :18 ou 36 mois
Secteur d'activité :Intelligence Artificielle
Description :Post-Doc in Machine Learning (Multiple Fairness in Recommending Systems) The group dedicated to Research in Machine Learning, Statistics & Signal Processing (the research group S2A) in Télécom Paris is recruiting a postdoc in Machine Learning (18 months contact, extendable to 36 months). The post-doc recruited will take part in an interdisciplinary collaborative research project involving the SES (Economics and Social Sciences) department of Télécom Paris and the Caisse des Dépôts et Consignations, a leading French public financial institution. Research assignment Research activities will focus on fairness issues for recommendation engines designed by means of machine-learning methods. With the explosion of digitized content available online, recommender systems have become an essential technology and a key element in the development of new services. In a commercial context, the algorithmic principles at work (e.g. collaborative filtering, user/content-based methods, hybrid approaches) in their operation are most often aimed exclusively at maximizing user satisfaction and increasing the platform's level of use. In the context of a public service, many other criteria and objectives must be integrated to ensure a fair service from the point of view of both users and suppliers (multi-sided fairness). It is precisely the subject of this collaborative project to propose and analyze (theoretically and empirically) methods for achieving acceptable trade-offs between the relevance of recommendations and bias mitigation. In addition to producing methodological research, the post-doc's mission will also include applied work on the current version of a deployed recommendation system, aimed at quantifying the presence of different types of bias resulting from its operation. Keywords: public service recommender system, fair and explainable AI, bias mitigation, multi-sided fairness Supervision: the recruit will work under the supervision of Sephan Clémençon (https://perso.telecom-paristech.fr/clemenco/) Winston Maxwell (https://www.telecom-paris.fr/winston-maxwell). Charlotte Laclau (https://laclauc.github.io/) Skills Education : PhD in Computer Science or in Applied Maths A short international postdoctoral experience is welcome but not mandatory English: fluent Expertise in Python programming, familiarity with database queries Capacity to work in a team and develop good relationships with colleagues in other disciplines Excellent writing and pedagogical skills Knowledge and experience required Research publications in Machine Learning (e.g. in Neurips, ICML, AISTATS, …) Knowledge of how recommending systems work Taste for AI applications and interest in its societal aspects Additional information The position does not involve teaching. However, on a voluntary basis, the postdoc recruited may take part in machine-learning courses (undergraduate/master level) coordinated by the supervisory team. The position 18 months position (extendable to 36 months) Télécom Paris, 9 place Marguerite Perey - 91120 Palaiseau - France Application Applicants should submit a single PDF file that includes: motivation letter curriculum vitae one or two major publications contact information for one or two references Important dates First-Quarter 2025: interviews with candidates (by visio-conference eventually) Spring 2025: beginning Contact for information/application Stephan Clémençon stephan.clemencon@telecom-paris.fr Charlotte Laclau charlotte.laclau@telecom-paris.fr Winston Maxwell winston.maxwell@telecom-paris.fr Related Websites https://s2a.telecom-paris.fr/ www.telecom-paris.fr/ai-ethics
En savoir plus :https://s2a.telecom-paris.fr/
Post-Doc in Machine Learning (Multiple Fairness in Recommending Systems).pdf
Contact :stephan.clemencon@telecom-paris.fr
2-year Postdoctoral Position: Statistical Learning for Survey Sampling and Missing Data
Publiée le 30/12/2024 15:08.
Référence : 2-year Postdoctoral Position: in Statistical Learning for Survey Sampling and Missing Data.
Postdoc, Montreal and Ottawa, Canada.
Entreprise/Organisme :McGill University and the University of Ottawa
Niveau d'études :Doctorat
Date de début :01/09/2025, or flexible
Durée du contrat :2 years
Rémunération :70 000$
Secteur d'activité :Statistical learning, Missing data, Survey sampling, Causal Inference
Description :National statistical offices increasingly use machine learning to address unit nonresponse with inverse probability weighting. Machine learning may be used to model complex, high- dimensional relationships but introduces challenges such as variance estimation and model selection. We plan to investigate the Riesz Representer approach, combined with cross-fitting, to ensure consistent variance estimation and obtain square-root consistent estimators. This proposal will also explore hyperparameter selection and adaptive weight trimming to improve stability. This research aims to enhance the reliability of statistical inference in surveys with nonresponse.
En savoir plus :https://canssi.ca/wp-content/uploads/Statistical-Learning-for-Unit-Nonresponse-Treatment-in-Surveys-
Statistical-Learning-for-Unit-Nonresponse-Treatment-in-Surveys-Using-Riesz-Representers.pdf
Contact :mehdi.dagdoug@mcgill.ca
Exploring Transfer Learning techniques with Generative AI for the prediction of chemical processes
Publiée le 22/12/2024 18:11.
Stage, Solaize, Lyon, France.
Entreprise/Organisme :IFP Energies Nouvelles
Niveau d'études :Master
Sujet :Exploring Transfer Learning techniques with Generative AI for the prediction of chemical processes performance
Date de début :Mars 2025
Durée du contrat :5-6 mois
Secteur d'activité :Energies Renouvelables
Description :IFPEN is an important player in the triple energy, ecological, and digital transition by offering differentiating technological solutions in response to societal and industrial challenges of energy and climate. The implementation of new methodological approaches combining "data science and experimentation" is among the studied solutions that allow for faster progress and reduced R&I costs. The prediction of the output impurities content, such as sulphur or nitrogen, is a key factor when developing new catalysts or new processes. Data scarcity and poor generalization to new experimental conditions often limit the quality of the kinetic models or even and standard machine learning techniques. One of the solutions for improving models is reusing knowledge from previous datasets. Transfer Learning is a promising approach to model new catalysts or processes. Previous studies conducted at IFPEN led to important improvements using a Bayesian approach. Other techniques, that use Generative Adversarial Networks (GANs), along with feature augmentation, allow model’s deep understanding of the dataset’s feature distribution, thus improving model training and robustness.
En savoir plus :NA
TL_GAN_Internship_proposition2024.pdf
Contact :youba.abed@ifpen.fr
PhD in modeling of soils
Publiée le 11/12/2024 11:14.
Référence : DeepHorizon.
Thèse, AgroParisTech , Palaiseau.
Entreprise/Organisme :UMR MIA, AgroParisTech
Niveau d'études :Master
Sujet :Developing a statistical spatial soil inference system with quantified uncertainty
Date de début :march 2025 or later
Durée du contrat :3 years
Rémunération :monthly gross salary ~ 2,100 €
Secteur d'activité :Interdisciplinary research in statistical machine learning and environmental sciences
Description :In the framework of the EU-project DeepHorizon (https://cordis.europa.eu/project/id/101156701), we are looking for an excellent PhD candidate to develop statistical methods supporting the development of a spatial soil inference system for European soils. A soil inference system uses known measurements, each with a certain level of uncertainty, to predict related soil properties with minimal error, by applying a series of logically connected (pedo)transfer functions (PTFs). The PhD candidate will start with an inventory of existing soil pedotransfer functions relevant to European soils and to calibrate usual mechanistic biogeochemical models. A large part of the work involves the exploration, development and application of new statistical approaches relevant for the inference system. The approaches should handle missing data along with uncertainty quantification of the input soil properties and propagation of the uncertainty throughout the inference engine. The candidate is expected to collaborate closely with other PhD candidates of the project consortium and with a project partner in Belgium, for which temporary stay could be envisioned.
En savoir plus :https://cordis.europa.eu/project/id/101156701
PhD_topic_PTFs.pdf
Contact :tabea.rebafka1@agroparistech.fr
Clustering de données fonctionnelles avec application en océanographie
Publiée le 01/10/2024 09:26.
Référence : Clustering de données fonctionnelles avec application en océanographie.
Thèse, Conservatoire National des Arts et Métiers, 2 rue Conté 75003 Paris.
Entreprise/Organisme :Conservatoire National des Arts et Métiers, Laboratoire CEDRIC
Niveau d'études :Master
Sujet :Classification non-supervisée pour l'identification de paysages acoustiques homogènes
Date de début :Entre fin 2024 et début 2025 en fonction de la date de recrutement du candidat
Durée du contrat :3 ans
Secteur d'activité :recherche
Description :Voir pièce jointe
En savoir plus :https://vincentaudigier.weebly.com/uploads/1/7/3/1/17317324/these_cnam_shom_clustering.pdf
these_cnam_shom_clustering.pdf
Contact :vincent.audigier@cnam.fr

Page précédente  1  2  <3> 

 
 
©2025 SFdS
Société Française de Statistique
Institut Henri Poincaré
11 rue Pierre et Marie Curie
75231 Paris cedex 5
Tél. : +33 (0)1 44 27 66 60
Notre site a été supporté par :