Consulter les offres d’emploi

Stage M2 - Prévision de la direction locale du vent par Deep-learning
Publiée le 05/02/2025 10:40.
Référence : Stage M2 - Prévision de la direction locale du vent par Deep-learning.
Stage, Cadarache- Saint Paul Lez Durance.
Entreprise/Organisme :ASNR
Niveau d'études :Master
Durée du contrat :6 mois
Description :Le STAAR est un service de recherche qui étudie la dispersion des radionucléides dans les milieux aquatiques et atmosphériques. Au sein du STAAR, le ou la stagiaire sera accueillie au LRTA à Cadarache pour travailler sur des méthodes de deep learning. Le STAAR/LMDA (à Fontenay-aux-Roses) fournira un appui sur la modélisation atmosphérique, et le STAAR/LERTA (à Cherbourg) apportera ses compétences expérimentales sur l'atmosphère. Lorsque l'on souhaite prédire la direction principale de la dispersion d'éléments chimiques rejetés dans l'atmosphère à un endroit donné, il est nécessaire de s'appuyer sur une prévision fiable de la direction du vent. Cette prédiction est le résultat d'un modèle de prévision numérique du temps. Il s'agit d'une valeur moyenne calculée pour une maille géographique de plusieurs centaines de mètres à plusieurs kilomètres de côté. Localement, la direction du vent est influencée par des obstacles (bâtiments, talus, végétation, …) et autres paramètres environnementaux qui ne sont pas pris en compte dans les modèles météorologiques, entrainant un écart entre la direction observée et la direction modélisée. Cet écart peut être à l'origine d'erreurs dans le calcul d'impact des éléments chimiques à l'homme et l'environnement. Pour réduire les erreurs liées à ces écarts, des méthodes d'intelligence artificielle pourraient offrir une solution plus précise. En traitant de grandes quantités de données recueillies localement par des stations d'observation météo
En savoir plus :https://irsn-career.talent-soft.com/offre-de-emploi/emploi-stage-m2-prevision-de-la-direction-locale
ASNR - stage M2 - Prévision de la direction locale du vent par Deep-learning H_F.pdf
Contact :kathleen.pele@asnr.fr
Stage M1 ou M2 Machine Learning à l'intersection de PAC-Bayes et prédiction conforme
Publiée le 05/02/2025 10:40.
Stage, Laboratoire ERIC - Bron.
Entreprise/Organisme :Université Lyon 2 - Laboratoire ERIC
Niveau d'études :Master
Sujet :Conformal Prediction from a PAC-Bayesian Perspective
Durée du contrat :4 à 6 mois
Rémunération :600 euros/month
Secteur d'activité :Recherche universitaire en Machine Learning
Description :Machine learning algorithms are becoming increasingly widespread in our society. With the rapid expansion of these algorithms, many questions arise concerning their reliability and the generalisation performance when the algorithms under study are applied to new data. For this reason, a deep mathematical analysis of the most widely used algorithms is playing an increasingly important rôle in current research. New tools appear at a fast pace that help investigate why these algorithms generalise well. To derive relevant statistical guarantees, a number of approaches have been developed, such as the notion of uniform stability, the complexity measure of hypothesis spaces or the PAC-Bayesian theory. The PAC-Bayesian approach has recently lead to successive breakthroughs in the discovery of novel generalisation bounds that could not until now be produced using alternative theories. It has also been used to derive new algorithms for minimizing such bounds (known as self-bounding algorithms). Other approaches have also be used to produce different kinds of statistical guarantees in prediction and risk control, which are various applications to the concept of Conformal Prediction. Unlike traditional models that output only a single prediction, conformal prediction assigns a set of possible outcomes associated to each input, ensuring that the true outcome is included in this set with a user-specified probability (e.g., 95%). Hence, Conformal Prediction is a statistical framework that provides reliable uncertainty estimates for predictions made by machine learning models. As a particular instance of Conformal Prediction, split Conformal Prediction works by splitting data into a training set and calibration set. The calibration set is used to adjust the prediction sets to statistically guaranteed coverage at the desired confidence level. The strengths of Split Conformal Prediction lies in its inherent simplicity, flexibility, and statistical guarantees. Other approaches have also been developed with narrower prediction sets, such as Jackknife+. In another direction, the fundamental problem of producing conditional coverage was investigated in recent new works. Indeed, traditional Conformal Prediction techniques usally provide what is called "marginal coverage" guarantees, meaning that the interval length does not depend of the input. Several methods use the quantile regression trick to overcome this issue, thereby ensuring that the prediction intervals contain the true outcome on average across the entire population, with part of the interval beeing conditional of the input. However, these methods may not offer adequate coverage for specific subgroups within the data. Recent results have pushed the limits of Standard Conformal Prediction capabilities by addressing the issue of building schemes that can account for conditional dependency of the prediction interval on the covariates. To sum up, the PAC Bayes and the Conformal based approach both provide generalisation guarantees for the algorithms under study, but from different viewpoints. Let us add that exciting recent work has successfully combined these two tools to derive generalisation guarantees on the coverage properties of an algorithm using conformal prediction, showing that the approaches can be complementary in establishing strong generalisation results. During the proposed internship, we wish to investigate, in particular, recent contributions to Conformal Prediction that manage to enhance the reliability of prediction intervals in Machine Learning models. This approach allows to generate prediction intervals that maintain both marginal coverage and approximate conditional validity for clusters or subgroups naturally present in the data. Our main objectives in this internship will be to: (i) reinforce the results obtained in the recent literature through the lens of PAC-Bayes theory (which applies very well to combinations of models) and (ii) investigate exciting applications to fairness, where notions of subgroups naturally appear when it comes to study different populations. During his internship, the candidate will attempt to establish theoretical guarantees on the predictions made by a model by combining the theories of Conformal Prediction and PAC-Bayesian. The work can be conducted as follows: (i) understand the similarities and differences between Conformal Prediction and PAC-Bayesian theory, (ii) provide additional guarantees on Conformal Prediction using PAC-Bayesian theory, (iii) study the applicability of the obtained theoretical results to Fairness.
En savoir plus :https://eric.msh-lse.fr/
Stage_Conformal_Prediction ERIC Lyon 2.pdf
Contact :stephane.chretien@univ-lyon2.fr
Stage M2 - Intégration de jeux de données protéomiques et PTM-omiques
Publiée le 05/02/2025 10:40.
Stage, Paris 15ème arrondissement.
Entreprise/Organisme :Institut Pasteur
Niveau d'études :Master
Sujet :Contexte : Le protéome est l’ensemble des protéines présentes dans des échantillons biologiques (cellules, organismes, etc.). La plateforme protéomique de l’Institut Pasteur a pour vocation l’étude à grande échelle des protéomes de pathogènes (virus, bactéries, etc.) et des interactions de ces pathogènes avec leur hôte. Dans ce but, elle travaille en collaboration avec différents laboratoires de recherche de l’Institut Pasteur. L’expérience utilisée le plus couramment à la plateforme se base sur la spectrométrie de masse et consiste à réaliser des analyses « bottom-up » (les protéines sont préalablement digérées en peptides pour une meilleure détection). Ces expériences produisent des données volumineuses qui nécessitent plusieurs étapes d’analyses pour être interprétées. D’un point de vue statistique, les jeux de données produits possèdent certaines caractéristiques particulières. Ainsi, on mesure des dizaines de milliers de peptides dans seulement quelques échantillons (données de type « large p, small n »). Il en résulte des matrices d’intensités mesurées qui possèdent des dizaines de milliers de lignes (les peptides) et seulement quelques colonnes (les échantillons). Elles peuvent être entachées de valeurs manquantes (survenant lorsque la protéine n’a pas été détectée dans un échantillon par exemple). Un sujet d’étude particulier concerne les modifications post-traductionnelles (« Post-translational modifications », ou PTM) de protéines. Ces modifications, notamment la phosphorylation, jouent un rôle clé dans la communication cellulaire. Leurs variations d'abondance peuvent perturber les signaux cellulaires, entraînant des désordres et des maladies. Comparer l'évolution d'un protéome non modifié à celle d'un phospho-protéome (ou autre PTM-ome) sous différentes conditions biologiques permet de déterminer si l’abondance de la modification est liée à celle de la protéine d'origine au fil des conditions. En cas d'absence de différence, on peut conclure que les conditions biologiques n'affectent pas l’abondance des modifications, et donc les signaux cellulaires. Ce type d'analyse aide à la compréhension du fonctionnement de maladies infectieuses et, in fine, à identifier des processus cellulaires à cibler pour améliorer le traitement de patients infectés. Contenu du stage : Sous la supervision d'un ingénieur de recherche statisticien de l'Institut, vous contribuerez au développement d'un programme en R, ainsi que de son interface en Shiny, pour simplifier ce type d'analyses au sein de la plateforme protéomique. Une première version de l'application est déjà en cours d'élaboration, mais plusieurs défis restent à relever, notamment la mise en place de méthodes statistiques pour plus de deux conditions biologiques et pour la visualisation des résultats. Ces améliorations sont essentielles pour rendre l'application pleinement opérationnelle dans le cadre des activités quotidiennes de la plateforme. Une comparaison exhaustive de méthodes d’intégration de ce type de données est à mener pour déterminer quelle approche statistique est la plus optimale à utiliser. Nous recherchons un(e) candidat(e) motivé(e) par cette problématique biologique concrète, par le développement de méthodes statistiques en R et par la création d’interfaces intuitives en Shiny, permettant d’exporter des résultats sous forme de tableurs Excel, fichiers PowerPoint ou Word. Idéalement, le/la candidat(e) possède de solides connaissances en mathématiques/statistiques, notamment en modèles de régression, clustering et analyses multivariées, et des connaissances en R, qu’il/elle pourra approfondir durant le stage.
Date de début :printemps 2025 (1er avril au plus tôt)
Durée du contrat :6 mois
Description :Contexte : Le protéome est l’ensemble des protéines présentes dans des échantillons biologiques (cellules, organismes, etc.). La plateforme protéomique de l’Institut Pasteur a pour vocation l’étude à grande échelle des protéomes de pathogènes (virus, bactéries, etc.) et des interactions de ces pathogènes avec leur hôte. Dans ce but, elle travaille en collaboration avec différents laboratoires de recherche de l’Institut Pasteur. L’expérience utilisée le plus couramment à la plateforme se base sur la spectrométrie de masse et consiste à réaliser des analyses « bottom-up » (les protéines sont préalablement digérées en peptides pour une meilleure détection). Ces expériences produisent des données volumineuses qui nécessitent plusieurs étapes d’analyses pour être interprétées. D’un point de vue statistique, les jeux de données produits possèdent certaines caractéristiques particulières. Ainsi, on mesure des dizaines de milliers de peptides dans seulement quelques échantillons (données de type « large p, small n »). Il en résulte des matrices d’intensités mesurées qui possèdent des dizaines de milliers de lignes (les peptides) et seulement quelques colonnes (les échantillons). Elles peuvent être entachées de valeurs manquantes (survenant lorsque la protéine n’a pas été détectée dans un échantillon par exemple). Un sujet d’étude particulier concerne les modifications post-traductionnelles (« Post-translational modifications », ou PTM) de protéines. Ces modifications, notamment la phosphorylation, jouent un rôle clé dans la communication cellulaire. Leurs variations d'abondance peuvent perturber les signaux cellulaires, entraînant des désordres et des maladies. Comparer l'évolution d'un protéome non modifié à celle d'un phospho-protéome (ou autre PTM-ome) sous différentes conditions biologiques permet de déterminer si l’abondance de la modification est liée à celle de la protéine d'origine au fil des conditions. En cas d'absence de différence, on peut conclure que les conditions biologiques n'affectent pas l’abondance des modifications, et donc les signaux cellulaires. Ce type d'analyse aide à la compréhension du fonctionnement de maladies infectieuses et, in fine, à identifier des processus cellulaires à cibler pour améliorer le traitement de patients infectés. Contenu du stage : Sous la supervision d'un ingénieur de recherche statisticien de l'Institut, vous contribuerez au développement d'un programme en R, ainsi que de son interface en Shiny, pour simplifier ce type d'analyses au sein de la plateforme protéomique. Une première version de l'application est déjà en cours d'élaboration, mais plusieurs défis restent à relever, notamment la mise en place de méthodes statistiques pour plus de deux conditions biologiques et pour la visualisation des résultats. Ces améliorations sont essentielles pour rendre l'application pleinement opérationnelle dans le cadre des activités quotidiennes de la plateforme. Une comparaison exhaustive de méthodes d’intégration de ce type de données est à mener pour déterminer quelle approche statistique est la plus optimale à utiliser. Nous recherchons un(e) candidat(e) motivé(e) par cette problématique biologique concrète, par le développement de méthodes statistiques en R et par la création d’interfaces intuitives en Shiny, permettant d’exporter des résultats sous forme de tableurs Excel, fichiers PowerPoint ou Word. Idéalement, le/la candidat(e) possède de solides connaissances en mathématiques/statistiques, notamment en modèles de régression, clustering et analyses multivariées, et des connaissances en R, qu’il/elle pourra approfondir durant le stage.
En savoir plus :https://research.pasteur.fr/fr/team/proteomics/
stageIP.pdf
Contact :quentin.giaigianetto@pasteur.fr
Protocoles séquentiels et adaptatifs pour planifier les études de bioéquivalence (données éparses)
Publiée le 05/02/2025 10:39.
Stage, Lille.
Entreprise/Organisme :Université de Lille, ULR 2694 Metrics
Niveau d'études :Master
Sujet :Approches par modélisation pour la planification de protocoles séquentiels ou adaptatifs dans les études de bioéquivalence avec échantillonnage épars
Date de début :dès que possible
Durée du contrat :6 mois
Rémunération :Standard stage de M2
Secteur d'activité :Statistique
Description :L'approche non compartimentales (NCA), recommandée pour analyser et planifier les études de bioequivalence (BE) en pharmacocinétique (PK), nécessite de nombreuses concentrations pour chaque sujet. Cela rend difficile son application à certaines populations, telles que les patients atteints de cancer. C'est pourquoi une approche alternative, basée sur une modélisation par modèle non linéaire à effets mixtes, a été developpée (approche MBBE). Plus récemment, la planification en 2 étapes avec des protocoles séquentiels (TSS) et adaptatifs (TSA) des études de BE par NCA a été transposée à l'approche MBBE, et évaluée sur des études avec échantillons PK riches. L'objectif de ce stage est d'étendre et d'évaluer cette approche à des études de BE avec échantillons épars. Différentes approches non-asymptotiques seront développées afin de corriger l'erreur standard d'estimation de l'effet du traitement sur les paramètres sur lesquels est effectué le test de BE : 1) un terme de correction tenant compte du nombre de paramètres du modèle PK, 2) la distribution a posteriori de l'effet traitement obtenue par Monte Carlo Hamiltonien (HMC) implémenté dans le langage Stan, 3) la méthode Sampling Importance Resampling 4) un bootstrap non paramétrique (rééchantillonnage de cas). Ces solutions seront ensuite évaluées par des simulations d'essais cliniques utilisant une étude de cas d’un médicament anticancéreux à haute variabilité indiqué pour le traitement de la leucémie myéloïde chronique. Les critères d'évaluation comprendront la taille finale de l'échantillon nécessaire, le taux d'erreur de type I (la proportion de jeux de données pour lesquels l'hypothèse nulle de non BE (H0) est rejetée en simulant sous H0), et la puissance (la proportion de jeux de données pour lesquels H0 est rejetée en simulant sous l'hypothèse alternative de BE).
En savoir plus :No link
Stage M2 Statistique Bioequivalence 2025.pdf
Contact :florence.loingeville@univ-lille.fr
Post-Doc in Machine Learning (Multiple Fairness in Recommending Systems)
Publiée le 05/02/2025 10:39.
Référence : Postdoc in Télécom Paris.
CDD, Télécom Paris, 19 Place Marguerite Perey, 91120 Palaiseau.
Entreprise/Organisme :Télécom Paris
Niveau d'études :Doctorat
Date de début :Printemps 2025
Durée du contrat :18 ou 36 mois
Secteur d'activité :Intelligence Artificielle
Description :Post-Doc in Machine Learning (Multiple Fairness in Recommending Systems) The group dedicated to Research in Machine Learning, Statistics & Signal Processing (the research group S2A) in Télécom Paris is recruiting a postdoc in Machine Learning (18 months contact, extendable to 36 months). The post-doc recruited will take part in an interdisciplinary collaborative research project involving the SES (Economics and Social Sciences) department of Télécom Paris and the Caisse des Dépôts et Consignations, a leading French public financial institution. Research assignment Research activities will focus on fairness issues for recommendation engines designed by means of machine-learning methods. With the explosion of digitized content available online, recommender systems have become an essential technology and a key element in the development of new services. In a commercial context, the algorithmic principles at work (e.g. collaborative filtering, user/content-based methods, hybrid approaches) in their operation are most often aimed exclusively at maximizing user satisfaction and increasing the platform's level of use. In the context of a public service, many other criteria and objectives must be integrated to ensure a fair service from the point of view of both users and suppliers (multi-sided fairness). It is precisely the subject of this collaborative project to propose and analyze (theoretically and empirically) methods for achieving acceptable trade-offs between the relevance of recommendations and bias mitigation. In addition to producing methodological research, the post-doc's mission will also include applied work on the current version of a deployed recommendation system, aimed at quantifying the presence of different types of bias resulting from its operation. Keywords: public service recommender system, fair and explainable AI, bias mitigation, multi-sided fairness Supervision: the recruit will work under the supervision of Sephan Clémençon (https://perso.telecom-paristech.fr/clemenco/) Winston Maxwell (https://www.telecom-paris.fr/winston-maxwell). Charlotte Laclau (https://laclauc.github.io/) Skills Education : PhD in Computer Science or in Applied Maths A short international postdoctoral experience is welcome but not mandatory English: fluent Expertise in Python programming, familiarity with database queries Capacity to work in a team and develop good relationships with colleagues in other disciplines Excellent writing and pedagogical skills Knowledge and experience required Research publications in Machine Learning (e.g. in Neurips, ICML, AISTATS, …) Knowledge of how recommending systems work Taste for AI applications and interest in its societal aspects Additional information The position does not involve teaching. However, on a voluntary basis, the postdoc recruited may take part in machine-learning courses (undergraduate/master level) coordinated by the supervisory team. The position 18 months position (extendable to 36 months) Télécom Paris, 9 place Marguerite Perey - 91120 Palaiseau - France Application Applicants should submit a single PDF file that includes: motivation letter curriculum vitae one or two major publications contact information for one or two references Important dates First-Quarter 2025: interviews with candidates (by visio-conference eventually) Spring 2025: beginning Contact for information/application Stephan Clémençon stephan.clemencon@telecom-paris.fr Charlotte Laclau charlotte.laclau@telecom-paris.fr Winston Maxwell winston.maxwell@telecom-paris.fr Related Websites https://s2a.telecom-paris.fr/ www.telecom-paris.fr/ai-ethics
En savoir plus :https://s2a.telecom-paris.fr/
Post-Doc in Machine Learning (Multiple Fairness in Recommending Systems).pdf
Contact :stephan.clemencon@telecom-paris.fr
Modélisation d'un espace latent complexe au moyen de Normalizing flow dans un modèle à effets mixtes
Publiée le 30/12/2024 15:08.
Référence : stage master 2 modélisation d'un espace latent complexe dans un modèle à effets mixtes.
Stage, Centre INRAE Jouy-En-Josas.
Entreprise/Organisme :INRAE
Niveau d'études :Master
Sujet :voir fichier joint
Date de début :début 2025
Durée du contrat :5 à 6 mois
Rémunération :gratification de stage standard
Secteur d'activité :recherche en mathématiques
Description :voir fichier joint
En savoir plus :http://genome.jouy.inra.fr/~ekuhn/
2025_stage_NF_MixedModels.pdf
Contact :estelle.kuhn@inrae.fr
2-year Postdoctoral Position: Statistical Learning for Survey Sampling and Missing Data
Publiée le 30/12/2024 15:08.
Référence : 2-year Postdoctoral Position: in Statistical Learning for Survey Sampling and Missing Data.
Postdoc, Montreal and Ottawa, Canada.
Entreprise/Organisme :McGill University and the University of Ottawa
Niveau d'études :Doctorat
Date de début :01/09/2025, or flexible
Durée du contrat :2 years
Rémunération :70 000$
Secteur d'activité :Statistical learning, Missing data, Survey sampling, Causal Inference
Description :National statistical offices increasingly use machine learning to address unit nonresponse with inverse probability weighting. Machine learning may be used to model complex, high- dimensional relationships but introduces challenges such as variance estimation and model selection. We plan to investigate the Riesz Representer approach, combined with cross-fitting, to ensure consistent variance estimation and obtain square-root consistent estimators. This proposal will also explore hyperparameter selection and adaptive weight trimming to improve stability. This research aims to enhance the reliability of statistical inference in surveys with nonresponse.
En savoir plus :https://canssi.ca/wp-content/uploads/Statistical-Learning-for-Unit-Nonresponse-Treatment-in-Surveys-
Statistical-Learning-for-Unit-Nonresponse-Treatment-in-Surveys-Using-Riesz-Representers.pdf
Contact :mehdi.dagdoug@mcgill.ca
Exploring Transfer Learning techniques with Generative AI for the prediction of chemical processes
Publiée le 22/12/2024 18:11.
Stage, Solaize, Lyon, France.
Entreprise/Organisme :IFP Energies Nouvelles
Niveau d'études :Master
Sujet :Exploring Transfer Learning techniques with Generative AI for the prediction of chemical processes performance
Date de début :Mars 2025
Durée du contrat :5-6 mois
Secteur d'activité :Energies Renouvelables
Description :IFPEN is an important player in the triple energy, ecological, and digital transition by offering differentiating technological solutions in response to societal and industrial challenges of energy and climate. The implementation of new methodological approaches combining "data science and experimentation" is among the studied solutions that allow for faster progress and reduced R&I costs. The prediction of the output impurities content, such as sulphur or nitrogen, is a key factor when developing new catalysts or new processes. Data scarcity and poor generalization to new experimental conditions often limit the quality of the kinetic models or even and standard machine learning techniques. One of the solutions for improving models is reusing knowledge from previous datasets. Transfer Learning is a promising approach to model new catalysts or processes. Previous studies conducted at IFPEN led to important improvements using a Bayesian approach. Other techniques, that use Generative Adversarial Networks (GANs), along with feature augmentation, allow model’s deep understanding of the dataset’s feature distribution, thus improving model training and robustness.
En savoir plus :NA
TL_GAN_Internship_proposition2024.pdf
Contact :youba.abed@ifpen.fr
M2 Research internship in mathematical statistics: Censored Deconvolution for relative survival.
Publiée le 19/12/2024 09:16.
Stage, Marseille.
Entreprise/Organisme :SESSTIM, Université Aix-Marseille
Niveau d'études :Master
Sujet :Context Survival analysis is a statistical theory targeted at the study of human lifetime. In particular, relative survival methodology deals with the case of datasets that do not contain the reason of death of the patients, this information (supposed binary: studied cause or other causes) being unavailable. This is often the case in large cancer studies extracted from cancer registries. The relative survival methodology [1], developed explicitly for this issue, is based on competing risks and considers the overall lifetime of patients as being the minimum between a populational survival time and an excess survival time. This is unfortunately not very practical to estimate the lost lifetime due to the disease, a key metric in the literature [2]. This internship explores new deconvolutional approaches to estimate the lost lifetime due to the disease. Objectives The main objective of the internship is to explore deconvolutional approaches in relative survival field targeted at direct estimation of the distribution of the lost lifetime w.r.t. the disease in a relative survival setup. A few different leads are already identified to propose non-parametric estimations procedures for this distribution: extending the work of [3] to a slightly different setup and/or the proposals in [4] are two of the potential directions to construct relevant estimators. We expect the development of theoretical results for the produced estimators, alongside small and large sample properties. The proposed work is part of the NetPlus project funded by the Cancéropôle PACA. Communication and publication of the results will be integral part of the work. Simulations and real data applications will be done in the –rising—Julia programing language. Upon success and common agreement, a follow-up through a 1-year contract is possible. Candidate’s profile The following are strictly required: - A master 2 level in mathematics, with majors in analysis, probability and statistics - Strong knowledge in mathematical modeling and theoretical statistics - Very good written English and programming skills, with good experience in latex and git Knowledges of standard survival analysis, deconvolutional statistics and the Julia programming language (which will be used for investigations) are not required but will be nice bonuses. Additional information - Length: 5 to 6 months, with a potential follow-up by a one-year engineer contract. - Location: At SESSTIM, on the Faculté des Sciences Médicales et Paramédicales in Marseille, France. - Wages: Regulatory internship stipend at the Université Aix-Marseille (4€35/hour for 35h/week, about 600€/month) - To apply: Please carefully read the announcement and review the references before applying. Then, please send your application with a resume and a few motivational lines by mail, with [Internship2025] in the subject, to oskar.laverny@univ-amu.fr. You can add link to previous scientific (unrelated) projects you did, if any. [1] M. Pohar Perme, J. Stare, et J. Estève, « On Estimation in Relative Survival », Biometrics, vol. 68, no 1, p. 113‑120, mars 2012, doi: 10.1111/j.1541-0420.2011.01640.x. [2] D. Manevski, N. Ružić Gorenjec, P. K. Andersen, et M. Pohar Perme, « Expected life years compared to the general population », Biomedical journal 2023, doi: 10.1002/bimj.202200070. [3] F. Comte, A. Samson, et J. J. Stirnemann, « Hazard estimation with censoring and measurement error: application to length of pregnancy », Test 2018, doi: 10.1007/s11749-017-0548-0. [4] I. Van Keilegom et E. Kekeç, « Estimation of the density for censored and contaminated data », Stat, vol. 13, no 1, p. e651, 2024, doi: 10.1002/sta4.651.
Durée du contrat :6 mois
Description :Stage de 5 à 6 mois en statistiques visant à la construction d'estimateurs déconvolutionels sous censure dans le champ de l'analyse de survie dite relative.
En savoir plus :https://sesstim.univ-amu.fr/sites/default/files/intership_offer_1.pdf
intership_offer.pdf
Contact :oskar.laverny@univ-amu.fr
Stage/thèse en modélisation des sols
Publiée le 11/12/2024 11:14.
Référence : DeepHorizon.
Stage, Palaiseau.
Entreprise/Organisme :UMR MIA, AgroParisTech
Niveau d'études :Master
Sujet :Système d’inférence spatiale des sols avec incertitude quantifiée
Date de début :février 2025 ou plus tard
Durée du contrat :4 à 6 mois
Secteur d'activité :Recherche interdisciplinaire entre apprentissage statistique et science environnementales
Description :In the framework of the EU-project DeepHorizon (https://cordis.europa.eu/project/id/101156701), we are looking for an excellent PhD candidate to develop statistical methods supporting the development of a spatial soil inference system for European soils. A soil inference system uses known measurements, each with a certain level of uncertainty, to predict related soil properties with minimal error, by applying a series of logically connected (pedo)transfer functions (PTFs). The PhD candidate will start with an inventory of existing soil pedotransfer functions relevant to European soils and to calibrate usual mechanistic biogeochemical models. A large part of the work involves the exploration, development and application of new statistical approaches relevant for the inference system. The approaches should handle missing data along with uncertainty quantification of the input soil properties and propagation of the uncertainty throughout the inference engine. The candidate is expected to collaborate closely with other PhD candidates of the project consortium and with a project partner in Belgium, for which temporary stay could be envisioned. There is the possibility of a Master internship (4-6 months) on a sub-topic of the thesis.
En savoir plus :https://cordis.europa.eu/project/id/101156701
PhD_topic_PTFs.pdf
Contact :tabea.rebafka1@agroparistech.fr
PhD in modeling of soils
Publiée le 11/12/2024 11:14.
Référence : DeepHorizon.
Thèse, AgroParisTech , Palaiseau.
Entreprise/Organisme :UMR MIA, AgroParisTech
Niveau d'études :Master
Sujet :Developing a statistical spatial soil inference system with quantified uncertainty
Date de début :march 2025 or later
Durée du contrat :3 years
Rémunération :monthly gross salary ~ 2,100 €
Secteur d'activité :Interdisciplinary research in statistical machine learning and environmental sciences
Description :In the framework of the EU-project DeepHorizon (https://cordis.europa.eu/project/id/101156701), we are looking for an excellent PhD candidate to develop statistical methods supporting the development of a spatial soil inference system for European soils. A soil inference system uses known measurements, each with a certain level of uncertainty, to predict related soil properties with minimal error, by applying a series of logically connected (pedo)transfer functions (PTFs). The PhD candidate will start with an inventory of existing soil pedotransfer functions relevant to European soils and to calibrate usual mechanistic biogeochemical models. A large part of the work involves the exploration, development and application of new statistical approaches relevant for the inference system. The approaches should handle missing data along with uncertainty quantification of the input soil properties and propagation of the uncertainty throughout the inference engine. The candidate is expected to collaborate closely with other PhD candidates of the project consortium and with a project partner in Belgium, for which temporary stay could be envisioned.
En savoir plus :https://cordis.europa.eu/project/id/101156701
PhD_topic_PTFs.pdf
Contact :tabea.rebafka1@agroparistech.fr
Étude de l’impact de la discrétisation pour l’estimation du modèle linéaire fonctionnel
Publiée le 02/12/2024 09:55.
Référence : Stage de M2.
Stage, Paris (CEREMADE) ou Rouen (LMRS).
Entreprise/Organisme :Université Paris-Dauphine/Université de Rouen Normandie/Université Paris Cité
Niveau d'études :Master
Sujet :voir fichier pdf joint
Date de début :Printemps 2025
Durée du contrat :4 à 6 mois
Secteur d'activité :Recherche
Description :L'analyse des données fonctionnelles est une branche de la statistique dont l'objectif est d'étudier des données qui se présentent sous forme de courbes (évolution de la température, électricité,...). La majorité des résultats de statistique mathématique existants supposent que les courbes sont observées en tout point, ce qui n'est pas le cas en général en pratique. L'objectif du stage sera d'explorer les vitesses de convergence dans le modèle de régression linéaire fonctionnel lorsque l'on tient compte du fait que les données sont observées sur une grille. Le stage pourra se prolonger par une thèse financée par le projet ANR FUNMathStat.
En savoir plus :https://sites.google.com/view/funmathstatanrproj/job-and-internship-offers
Sujet_Stage_M2_these.pdf
Contact :gaelle.chagny@univ-rouen.fr
PhD position in mathematical statistics
Publiée le 27/11/2024 11:32.
Référence : PhD position Post-selection inference for latent variable models.
Thèse, Toulouse.
Entreprise/Organisme :Institut de Mathématiques de Toulouse
Niveau d'études :Master
Sujet :Post-selection inference for latent variable models
Date de début :Octobre 2025
Durée du contrat :3 ans
Description :Post-selection inference for latent variable models
En savoir plus :https://www.math.univ-toulouse.fr/~fbachoc/PhD_offer_post_selection_inference_latent_variables.pdf
Contact :francois.bachoc@math.univ-toulouse.fr
Maître de conférences en "Statistiques, Machine Learning et application aux SHS"
Publiée le 27/11/2024 11:31.
CDI, Campus Portes des Alpes, Bron.
Entreprise/Organisme :Université Lyon 2
Niveau d'études :Doctorat
Date de début :01/09/2025
Description :Maître de conférences en "Statistiques, Machine Learning et application aux SHS"
En savoir plus :https://eric.msh-lse.fr/wp-content/uploads/2024/11/2025-univlyon2-posteMCF26.pdf
Contact :julien.jacques@univ-lyon2.fr
Développement d'algorithmes pour l'analyse de la perte d'autonomie des personnes âgées
Publiée le 21/10/2024 17:47.
Référence : Offre d'emploi pour jeune docteur en R&D chez SIPAD.
CDI, 38 rue Blomet, 75015 Paris.
Entreprise/Organisme :SIPAD
Niveau d'études :Doctorat
Date de début :Dès que possible
Durée du contrat :CDI
Rémunération :Entre 50 000 à 60 000 euros par an
Secteur d'activité :Accompagnement des personnes en perte d'autonomie à domicile
Description :Au sein du l’entreprise Sipad, dans le cadre de votre premier contrat CDI depuis votre soutenance (statut de Jeune Docteur), en lien permanent avec les équipes des différentes entités opérationnelles, votre rôle de « Jeune docteur » sera d'identifier et utiliser les travaux de Recherche les plus récents sur les différents domaines cités, d'accompagner le directeur technique et ses équipes sur la mise en œuvre de projets pour ses clients, d'apporter votre expertise en conduite de projets de recherche et de participer à la consolidation d’une première phase de recherche déjà menée par l’entreprise dans le domaine de l’analyse automatique de la perte d’autonomie des personnes âgées. Vos missions principales consisteront donc en : - Investiguer et évaluer les dernières avancées en recherche et technologiques (veille scientifique, veille technique) - Implémenter des algorithmes et entraîner des modèles d’intelligence artificielle - Identifier des sources de réflexions sur des évolutions possibles des technologies ou des méthodes de management - Travailler en étroite coopération avec les équipes opérationnelles pour passer de la phase recherche à la phase de mise en production (intégration et recherche finalisée) - Présenter régulièrement le fruit de vos découvertes et de vos réflexions - Rédiger des dossiers de recherche avec les équipes projets - Suivant les avancées de recherche, publier des articles scientifiques ou participer à des conférences Ce poste évoluera vers un rôle de soutien et d’accompagnement d’étudiants en M2 et éventuellement dans leur parcours de thèse Cifre. Nos avantages : - Locaux dans le cœur du 15ème arrondissement de Paris - Télétravail jusqu'à 2 jours par semaine - Proximité et convivialité cultivées à tous les niveaux de l'entreprise Le profil recherché Jeune docteur spécialisé en Data Science, Informatique, Math Appliquées, Intelligence Artificielle Vous maîtrisez également la programmation informatique permettant de concevoir et d'implémenter les solutions de Machine Learning ou Deep Learning (Python, R, …) ainsi que des outils collaboratifs de versioning comme Git. Vous avez une bonne connaissance de méthodes de conduite de projet et de l'organisation des entreprises. La maîtrise du français et de l'anglais à l'écrit et à l'oral est nécessaire.
En savoir plus :https://sipad.com/notre-solution
SIPAD_Offre Emploi_Jeune Docteur.pdf
Contact :c.faure@sipad.com

Page précédente  1  2  3  <4>  5  Page suivante

 
 
©2025 SFdS
Société Française de Statistique
Institut Henri Poincaré
11 rue Pierre et Marie Curie
75231 Paris cedex 5
Tél. : +33 (0)1 44 27 66 60
Notre site a été supporté par :