Consulter les offres d’emploi

Ingénieur Biostatistiques
Publiée le 05/11/2018 21:47.
CDD, SFR ICAT - UFR Santé - Angers.
Entreprise/Organisme :Université d'Angers
Niveau d'études :Master
Date de début :Janvier 2019
Durée du contrat :11 mois
Rémunération :Entre 2043 € et 2628,86 €
Secteur d'activité :Recherche Santé
Description :Le profil de poste est détaillé dans le document pdf joint. Il est également important de savoir qu'une prolongation de contrat est possible à l'issu de ces 11 mois.
En savoir plus :NA
FP_Ingé Biostatistiques_Santé_JR.pdf
Contact :jeremie.riou@univ-angers.fr
Stage de fin d'étude: Data science / IA
Publiée le 05/11/2018 14:16.
Stage, 50, rue carnot SURESNES.
Entreprise/Organisme :SERVIER
Niveau d'études :Master
Durée du contrat :6 mois
Secteur d'activité :Data science / IA
Description :Recherche des meilleurs Réseaux de Neurones appliqués aux essais cliniques. Mission: Ce stage a pour but de recenser les méthodes et techniques des Réseaux de Neurones supervisés et non supervisés existants (Long Short Term Memory, Tensorflow, etc…). Le stagiaire décryptera les réseaux de neurones les plus adaptés à la recherche clinique et nos projets afin de réaliser un benchmark et maitriser les plus pertinents (classification ,modélisation, …). Il en établira les limites , les processus d’apprentissage, et différences  en développant en particulier l’explicabilité de ces modèles. Il s’agit notamment de justifier de façon raisonnable le choix de l’architecture, la qualité et la robustesse des apprentissages et performances en fonction du nombre d’exemples d’entrainement et de l’objectif. Activités: Recherche bibliographique. Benchmark des performances des Réseaux de Neurones (forces et faiblesses). Création d’un catalogue des Réseaux de Neurones et codes associés en fonction des problématiques supervisées, non supervisées, série chronologique, big data. Le stage sera réalisé sur des données internes (données d’imagerie et/ou cliniques). Profil: Etudiant (BAC+5) en Data Science ou Intelligence Artificielle (Ecole Ingénieur ou M2). Compétences recherchées: -Formation et fortes connaissances en Machine Learning, Intelligence Artificielle, modèles supervisés et non supervisés,… -Langages de programmation: Python, R -Intérêt pour les sciences de la vie, esprit curieux et entreprenant
En savoir plus :https://www.servier-campus.com/fr/
Contact :fabrice.couvelard@servier.com
Phd in Statistics
Publiée le 01/11/2018 19:17.
Référence : EWI2018-74.
Thèse, Delft, Netherlands.
Entreprise/Organisme :TU Delft
Niveau d'études :Master
Sujet :Data science for injury prevention and performance improvement
Date de début :1 March 2019, flexible
Durée du contrat :4 years
Rémunération :€2266—€2897 per month
Secteur d'activité :Research
Description :Job Description The program “Citius, Altius, Sanius” aims to stimulate people of all performance levels to engage in physical activity through sports and fitness to improve their health and performance by providing informative and motivating information using advanced sensor and data science techniques. The program comprises six applied projects and three fundamental projects. For one of the fundamental projects, entitled “Data science for injury prevention and performance improvement” we are looking for a PhD candidate. “Data science for injury prevention and performance improvement” concentrates on providing a data-based tailored advice for health and performance. The PhD position is based within the Statistics Group of the Delft Institute of Applied Mathematics. In the research, a personalized model will be developed allowing to give tailor made advice to individual athletes. The research comprises both methodological research in statistics as well as research in the domain of sports engineering and will make contributions to both fields. Requirements The candidate possesses an MSc degree in mathematics (specialization statistics or probability theory) or a related discipline in which mathematics, statistics and/or machine learning forms a prominent part. Some experience with epidemiology, statistical modelling and handling / analysis of data sets is advantageous but not a necessary requirement. We require very good communication skills and fluently spoken and written English. The position includes modest teaching duties. Candidates are expected to finish their project with a PhD thesis, and disseminate the results through publications in peer-reviewed journals, and presentations at international conferences. 
En savoir plus :https://www.academictransfer.com/nl/50691/
Contact :j.soehl@tudelft.nl
Stage de fin d'étude : Fréquentiste vs Bayésien, valorisation des données antérieures
Publiée le 31/10/2018 02:43.
Stage, Suresnes.
Entreprise/Organisme :SERVIER
Niveau d'études :Master
Durée du contrat :6 mois
Secteur d'activité :Biostatistiques / Statistiques appliquées / Préclinique
Description :Fréquentiste vs Bayésien : qui sera le plus à même de valoriser les données antérieures pour évaluer le potentiel d'un candidat médicament ? Mission: La Recherche de nouveaux candidat-médicaments en industrie pharmaceutique passe par de nombreuses étapes et de nombreux modèles (in vitro et in vivo) afin de d’acquérir suffisamment d’information concernant l’efficacité et la sureté du produit. De fait, des données sont collectées sur différents modèles et ces données antérieures peuvent être utilisées pour apporter de la puissance statistique aux études actuelles et réduire le biais venant de la variabilité inter-études. Différentes approches méthodologiques existent, comme l’utilisation de modèles mixte (approche fréquentiste) avec le facteur étude en aléatoire ; des approches bayésiennes estimant une distribution a posteriori à partir des données antérieures. Mais la non-utilisation des données antérieures restent majoritaire. L’absence de consensus sur le choix de la méthodologie statistique dans le but de valoriser les données antérieures nécessite de tester différentes approches. Dans ce but, une revue de la littérature sera nécessaire pour initier ce travail, afin de sélectionner les techniques potentielles ainsi que leur éventuels biais et limites d’utilisations. Ces techniques seront ensuite mis en œuvre sur la base de simulation faisant varier, entre autre, le nombre d’études antérieures, la variabilité inter-étude, la variabilité intra-étude, la distribution des données, … Différents indices pourront alors être estimés (puissance, risque d’erreur, …) pour chaque approche et scenario de simulation, afin de comparer les différentes approches méthodologiques. L’objectif du stage est d’identifier et de comparer différentes méthodes fréquentistes et bayésiennes pour la valorisation de données antérieures, en s’appuyant sur des données réelles déjà disponible. Activités: Revue bibliographique des différentes méthodes statistiques existantes Programmation des méthodologies sélectionnées et des simulations sous R Compétences principales : Programmation R Statistiques fréquentistes et bayésiennes Curiosité Anglais (lecture) Ce stage se déroulera au sein du Département Biostatistiques Préclinique et sera encadré par un biostatisticien préclinique (Bastien Gamboa).
En savoir plus :www.servier.fr
Contact :bastien.gamboa@servier.com
Stage de fin d'étude : Estimands, missing data handling & treatment effect estimation
Publiée le 31/10/2018 02:43.
Stage, Suresnes.
Entreprise/Organisme :SERVIER
Niveau d'études :Master
Durée du contrat :6 mois
Secteur d'activité :Biostatistiques / Statistiques appliquées
Description :The new challenge of clinical trials: Estimands, missing data handling and treatment effect estimation. ICH-E9 (“Statistical principles for clinical trials”) addendum on estimands and sensitivity analysis in clinical trials, out for public consultation in august 2017 aims to clarify clinical trials objectives to answer a scientific question of interest. This objectives clarification allow a precise definition of the treatment effect, primarily by taking into account intercurrent events (i.e.: events occurring after randomization that can affect the primary endpoint of interest). In the context of several intercurrent events with different strategies, associated statistical methods could be complex and rely on various assumptions that cannot be verified from the data (missing at random, missing not at random). In such cases, sensitivity analyses play an important role. The objective of this internship if, in a biostatistician team, to work on different intercurrent and missing data handling methodologies (Multiple Imputation, Pattern-Mixture Model, …) and to make a literature review on sensitivity analyses of those different mechanisms of missingness. Mission 1: Familiarization with ICH-E9 addendum and intercurrent events and missing data handling methods, based on existing literature Mission 2: Literature review on sensitivity analyses to missing data Mission 3: Implementation and comparison of those methods on a simulated data set Mission 4: Application to a real data set Skills in software R and SAS, as well as interest in life sciences are necessary.
En savoir plus :www.servier.fr
Contact :damien.chimits@servier.com
Stage de fin d'étude : méthodes de sélection de variables OMICS predictives
Publiée le 31/10/2018 02:42.
Stage, Suresnes.
Entreprise/Organisme :SERVIER
Niveau d'études :Master
Durée du contrat :6 mois
Secteur d'activité :Biostatistiques/ Biomathématiques / Statistiques appliquées
Description :Recherche, évaluation et implémentation de méthodes de sélection de variables OMICS prédictives. Dans le cadre de la médecine personnalisée, l’identification de biomarqueurs – issus notamment de technologies OMICS - tient une place essentielle dans le développement de nouveaux médicaments. Les biomarqueurs peuvent jouer trois rôles : pharmacodynamique, pronostique et prédictif. On s’intéressera ici à la sélection d’un ensemble de biomarqueurs prédictifs, c’est-à-dire permettant l’identification d’un sous-groupe de patients montrant une meilleure réponse au traitement. Au sein du Centre d’Excellence « Méthodologie et Valorisation des Données » (dans une équipe dédiée à l’analyse statistique des biomarqueurs dans les études pré-cliniques et cliniques), vous serez responsable de l’identification et de l’implémentation de méthodes permettant de sélectionner des biomarqueurs prédictifs d’une réponse binaire ou prédictifs de survie. Mission 1 : Identifier les méthodes statistiques permettant de faire de la sélection de variables (OMICs) dans le cadre d’un essai clinique comparatif, avec une réponse binaire (ex. : Virtual Twins, …) ou en survie (ex. : stepwise, Cox-LASSO, Random Survival Forest, …). Mission 2 : Implémenter quelques méthodes retenues sur un jeu de données réelles et un jeu de données simulées Mission 3 : Evaluer la robustesse des méthodes et les comparer en terme de champ d’application : type de réponse, type(s) de variable(s) utilisable(s), taille d’échantillon, nombre de variables, … Des compétences en langage R et SAS et un intérêt pour les sciences de la vie sont nécessaires.
En savoir plus :www.servier.fr
Contact :guillaume.desachy@servier.com
Identification de la topologie d'un réseau de distribution
Publiée le 28/10/2018 09:13.
Stage, Grenoble.
Entreprise/Organisme :Odit-e
Niveau d'études :Master
Sujet :L'objectif du stage sera de travailler à l'identification de la topologie des réseaux de distribution Basse Tension, qui sont en grande partie inconnus. Ce stage requiert des compétences en data sciences (graphs, clustering, traitement des données) et s'adresse à des personnes ayant une appétence pour les problématiques énergétique, et une volonté de contribuer à la transition énergétique.
Date de début :février 2019
Durée du contrat :5 mois
Secteur d'activité :Smart Grids, Energies renouvelables
Description :Odit-e, une jeune startup basée à Grenoble, est à la recherche d'un stagiaire en mathématiques appliquées, avec poursuite en thèse CIFRE possible. Odit-e développe des algorithmes d'aide à la décision pour les gestionnaires de réseaux électriques, dans le but de favoriser la transition énergétique.
En savoir plus :www.odit-e.com
Odit-e_stage_recherche.pdf
Contact :clementine@odit-e.com
Analyse de tests graphomoteurs par machine learning pour une aide au diagnostic de la dysgraphie
Publiée le 06/10/2018 11:03.
Stage, Grenoble.
Entreprise/Organisme :CEA
Niveau d'études :Master
Sujet :Ce stage se situe dans le cadre de la capture de contexte et fait suite à des premiers travaux exploitant les paramètres cinématiques de l’écriture appliqués au test BHK, test de référence pour le diagnostic de la dysgraphie. Cependant, cette approche est dépendante de l’écriture cursive latine et n’est donc pas universelle. Elle ne permet pas non plus d’envisager un diagnostic de la dysgraphie avant le CE1, lorsque l’écriture cursive est globalement acquise par l’enfant. La base de données acquise auprès de 400 à 500 enfants présentant ou non des troubles de l'écriture - dysgraphie (collaboration avec C Jolly, LPNC – UGA) inclut non seulement les traces numériques d’écriture mais également celles obtenues lors de tests graphomoteurs (reproduction de dessins, tracés guidés). Le stage proposé vise à exploiter des caractéristiques extraites de ces tests graphomoteurs afin de proposer une approche d’aide au diagnostic de la dysgraphie qui soit plus précoce et indépendante de l’écriture. Dans cette approche, l’annotation de la base de données effectuée sur les tests BHK permet de distinguer les enfants dysgraphiques des enfants non dysgraphiques. Ainsi, les patterns obtenus à partir des tests graphomoteurs pourront être mis en relation avec ces scores afin de définir un pattern graphomoteur typique de la dysgraphie. Cependant, les variables extraites à partir des tests graphomoteurs évoluant avec l’âge, une modélisation de leur évolution en fonction de l’âge devra d’abord être effectuée afin d’évaluer quelles variables sont les plus pertinentes pour le diagnostic de la dysgraphie (collaboration avec V Brault, LJK (IMAG) - UGA). Le but est de trouver les paramètres, ou toute autre caractéristique, qui seraient les plus discriminants pour alimenter les modèles visant à évaluer si un enfant est dysgraphique ou non. A l’issue de cette étape, le lien entre l’écart d’un comportement « typique » et la possibilité qu’un enfant soit dysgraphique sera estimé à l’aide de modèles statistiques (par exemple, la régression logistique) et par des techniques de machine learning (algorithme de classification).A terme, le modèle proposé devrait permettre d'identifier des paramètres discriminant formellement les enfants dysgraphiques des enfants non dysgraphiques sans se baser sur l’écriture, proposant ainsi une aide au diagnostic de la dysgraphie applicable chez le jeune enfant et universelle.
Durée du contrat :6 mois
Rémunération :Grille suivant diplôme
Description :Ce stage se situe dans le cadre de la capture de contexte et fait suite à des premiers travaux exploitant les paramètres cinématiques de l’écriture appliqués au test BHK, test de référence pour le diagnostic de la dysgraphie. Cependant, cette approche est dépendante de l’écriture cursive latine et n’est donc pas universelle. Elle ne permet pas non plus d’envisager un diagnostic de la dysgraphie avant le CE1, lorsque l’écriture cursive est globalement acquise par l’enfant. La base de données acquise auprès de 400 à 500 enfants présentant ou non des troubles de l'écriture - dysgraphie (collaboration avec C Jolly, LPNC – UGA) inclut non seulement les traces numériques d’écriture mais également celles obtenues lors de tests graphomoteurs (reproduction de dessins, tracés guidés). Le stage proposé vise à exploiter des caractéristiques extraites de ces tests graphomoteurs afin de proposer une approche d’aide au diagnostic de la dysgraphie qui soit plus précoce et indépendante de l’écriture. Dans cette approche, l’annotation de la base de données effectuée sur les tests BHK permet de distinguer les enfants dysgraphiques des enfants non dysgraphiques. Ainsi, les patterns obtenus à partir des tests graphomoteurs pourront être mis en relation avec ces scores afin de définir un pattern graphomoteur typique de la dysgraphie. Cependant, les variables extraites à partir des tests graphomoteurs évoluant avec l’âge, une modélisation de leur évolution en fonction de l’âge devra d’abord être effectuée afin d’évaluer quelles variables sont les plus pertinentes pour le diagnostic de la dysgraphie (collaboration avec V Brault, LJK (IMAG) - UGA). Le but est de trouver les paramètres, ou toute autre caractéristique, qui seraient les plus discriminants pour alimenter les modèles visant à évaluer si un enfant est dysgraphique ou non. A l’issue de cette étape, le lien entre l’écart d’un comportement « typique » et la possibilité qu’un enfant soit dysgraphique sera estimé à l’aide de modèles statistiques (par exemple, la régression logistique) et par des techniques de machine learning (algorithme de classification).A terme, le modèle proposé devrait permettre d'identifier des paramètres discriminant formellement les enfants dysgraphiques des enfants non dysgraphiques sans se baser sur l’écriture, proposant ainsi une aide au diagnostic de la dysgraphie applicable chez le jeune enfant et universelle.
En savoir plus :NA
SujetStage_ECRITURE_2019.pdf
Contact :etienne.labyt@cea.fr
Analyse de données métabolomiques et génomiques pour résoudre un problème de bien-être animal
Publiée le 03/10/2018 11:41.
Stage, Toulouse.
Entreprise/Organisme :INRA
Niveau d'études :Master
Rémunération :Taux légal (environ 550€/mois)
Description :voir pdf
En savoir plus :http://www.biostat.envt.fr/wp-content/uploads/2018/10/sujet_stage_subpig.pdf
sujet_stage_subpig.pdf
Contact :subpig@nathalievialaneix.eu
Postdoctoral Research Fellow - Stochastic Simulation, Uncertainty Quantification, Statistical modeli
Publiée le 17/09/2018 08:51.
Référence : Postdoc - Chaire StressTest.
CDD, Palaiseau.
Entreprise/Organisme :Ecole Polytechnique, France
Niveau d'études :Doctorat
Date de début :dès que possible
Durée du contrat :3 ans
Rémunération :2400€ nets mensuels dépendant de l'expérience
Secteur d'activité :Stochastic Simulation, Uncertainty Quantification, Statistical modeling
Description :Location. École Polytechnique is a French public institution of higher education and research in Palaiseau, in the southwest of Paris. It was established in 1794 by the mathematician Gaspard Monge during the French Revolution. It is one of the most prestigious and selective French grandes écoles. Polytechnique has several research laboratories operating in various scientific fields (physics, mathematics, computer science, economics, chemistry, biology, etc.). Research program. The Chaire “Stress Testing” is a specific research program between Ecole Polytechnique and BNP Paribas, and is hosted at Polytechnique by the Center of Applied Mathematics https://portail.polytechnique.edu/cmap/en This research project is part of an in-depth reflection on the increasingly sophisticated issues surrounding stress tests (under the impulse of the upcoming European Banking regulation). Simulation of extreme adverse scenarios is an important topic to better understand which critical configurations can lead to financial and systemic crises. These scenarios may depend on complex phenomena, for which we partially lack information, making the modeling incomplete and uncertain. Last, the data are multivariate and reflect the dependency between driving variables. From the above observations, different lines of research are considered: 1) the generation of stress test and meta-modeling scenarios using machine learning 2) the quantification of uncertainties in risk metrics 3) modeling and estimation of multidimensional dependencies Keywords: Bayesian Networks, copulas, dependent data, Deep Learning, Gaussian processes, machine learning, Markov Chain Monte Carlo, meta-modeling, multivariate statistics, rare event simulation, risk metrics, splitting methods, stochastic algorithms, stochastic and Bayesian optimization, uncertainty propagation Candidate profile: • A PhD in Probability and Statistics, or equivalent • A proven track record in quality research, as evidenced by research publications in top scientific journals and conferences • Solid working knowledge of some of the topics listed above (see keywords) • An understanding of financial risks is desirable • Exposure to development of numerical methods or data analysis (with Python, R) is desirable Position: 3 years, extension is possible. Although this is mainly a research position, there is the possibility of a small teaching load Net salary: about 2400€/month depending on the experience How to Apply: Your application should include a Cover Letter, Resume, publications. With your application, we ask that you briefly outline your experience against the selection criteria in the position description. Contact for application: emmanuel.gobet@polytechnique.edu
En savoir plus :https://drive.google.com/file/d/1vPBXCjCTzHh447pvphxSPH2zihYlF90z
PostDocChaireStressTest.pdf
Contact :emmanuel.gobet@polytechnique.edu
Lecturer - Stochastic Simulation, Uncertainty Quantification, Statistical modeling
Publiée le 17/09/2018 08:51.
Référence : Lecturer - Chaire Stress Test.
CDD, Palaiseau.
Entreprise/Organisme :Ecole Polytechnique, France
Niveau d'études :Doctorat
Date de début :Dès que possible
Durée du contrat :3 ans
Rémunération :2800€ net mensuel en fonction de l'expérience
Secteur d'activité :Stochastic Simulation, Uncertainty Quantification, Statistical modeling
Description :Location. École Polytechnique is a French public institution of higher education and research in Palaiseau, in the southwest of Paris. It was established in 1794 by the mathematician Gaspard Monge during the French Revolution. It is one of the most prestigious and selective French grandes écoles. Polytechnique has several research laboratories operating in various scientific fields (physics, mathematics, computer science, economics, chemistry, biology, etc.). Research program. The Chaire “Stress Testing” is a specific research program between Ecole Polytechnique and BNP Paribas, and is hosted at Polytechnique by the Center of Applied Mathematics https://portail.polytechnique.edu/cmap/en This research project is part of an in-depth reflection on the increasingly sophisticated issues surrounding stress tests (under the impulse of the upcoming European Banking regulation). Simulation of extreme adverse scenarios is an important topic to better understand which critical configurations can lead to financial and systemic crises. These scenarios may depend on complex phenomena, for which we partially lack information, making the modeling incomplete and uncertain. Last, the data are multivariate and reflect the dependency between driving variables. From the above observations, different lines of research are considered: 1) the generation of stress test and meta-modeling scenarios using machine learning 2) the quantification of uncertainties in risk metrics 3) modeling and estimation of multidimensional dependencies Keywords: Bayesian Networks, copulas, dependent data, Deep Learning, Gaussian processes, machine learning, Markov Chain Monte Carlo, meta-modeling, multivariate statistics, rare event simulation, risk metrics, splitting methods, stochastic algorithms, stochastic and Bayesian optimization, uncertainty propagation Candidate profile: • A PhD in Probability and Statistics, or equivalent • A proven track record in quality research, as evidenced by research publications in the top scientific journals and conferences • Solid working knowledge of some of the topics listed above (see keywords), both in research and teaching • Solid working knowledge in the development of numerical methods or data analysis (with Python, R) • An understanding of financial risks is desirable • Good communication and management skills, allowing to be involved in the scientific life of the Chaire Position: 3 years, extension is possible. The teaching load will be about 70 hours/year. Net salary: about 2800€/month depending on the experience How to Apply: Your application should include a Cover Letter, Resume, publications, description of teaching experience. With your application, we ask that you briefly outline your experience against the selection criteria in the position description.
En savoir plus :https://drive.google.com/open?id=1iVZwCZrIshtBVo_gca6NeE5JnfKcp8ei
LecturerChaireStressTest.pdf
Contact :emmanuel.gobet@polytechnique.edu
Mixture regression to identify latent pathways for genetic association studies
Publiée le 05/09/2018 11:34.
Stage, Paris.
Entreprise/Organisme :Institut Pasteur
Niveau d'études :Master
Sujet :Mixture regression to identify latent pathways for genetic association studies
Date de début :from 01/10/2018
Durée du contrat :6 months
Rémunération :Monthly allowance (approx. 500eur/mois)
Secteur d'activité :statistical genetics
Description :Large genome-wide association studies (GWAS) have been successful in identifying thousands of significant genetic associations for multiple traits and diseases. While the application of standard univariate approaches for detecting new genetic variants associated with traits and diseases will continue as sample size increases, a range of multi-traits analyses have been proposed in parallel to address questions about the joint genetic architecture of human phenotypes. In particular, several recent studies have discussed the application of Mendelian Randomization (MR) principle to GWAS summary statistics to assess potential causal relationship between human phenotypes. Our group recently explored similar approaches based on mixture regression with a primary objective of determining latent classes across genetic variants. The goal of this internship is to continue the development and application of the approach.
En savoir plus :https://research.pasteur.fr/en/team/statistical-genetics/
2018_Job.description_multivariateMethod.pdf
Contact :hugues.aschard@pasteur.fr
Inferring disease subtype from genetic data
Publiée le 05/09/2018 11:34.
Stage, Paris.
Entreprise/Organisme :Institut Pasteur
Niveau d'études :Master
Sujet :Inferring disease subtype from genetic data
Date de début :from 01/10/2018
Durée du contrat :6 months
Rémunération :Monthly allowance (approx. 500eur/mois)
Secteur d'activité :statistical genetics
Description :Several common human diseases are not single entity but rather composed of multiple heterogeneous disease subtypes. For example inflammatory bowel disease encompasses Crohn’s disease and ulcerative colitis, while breast cancer can be either ER (estrogen receptor) positive or negative. Subtypes are expected for many other diseases, but have not yet been characterized. Identifying latent disease subtypes is important both for elucidating the causes of disease, and for effective clinical treatment. Genetic and genomic data, which have led to new insights about causal variants, genes, pathways, and cell types for disease, have the potential to be informative also about disease subtypes. Indeed, disease heterogeneity commonly implies heterogeneous genetic architecture and subtype’s specific pattern of gene expression and other endophenotypes. We recently developed new approaches for assessing and quantifying potential disease heterogeneity from genetic data. The primary objective of this internship will be to assess the strength and limitation of these approaches while matching knowledge gathered from real case scenarios, and to perform a real data analysis in breast cancer data including over 70,000 individuals.
En savoir plus :https://research.pasteur.fr/en/team/statistical-genetics/
2018_Job.description_genetHeterogeneity.pdf
Contact :hugues.aschard@pasteur.fr
Stage 6 mois : Etude de la sur-représentation des plus jeunes dans les enquêtes Coset
Publiée le 22/08/2018 11:37.
Stage, 12 rue du Val d'Osne, 94415 Saint-Maurice Cedex.
Entreprise/Organisme :Santé publique France
Niveau d'études :Master
Sujet :Impact d’un plan de sondage à allocations inégales sur la variance des estimations : étude de la sur-représentation des plus jeunes dans les enquêtes Coset
Date de début :Mai/juin 2019
Durée du contrat :6 mois
Rémunération :oui
Secteur d'activité :Santé publique / enquêtes /sondages
Description :Santé publique France est l’agence nationale de santé publique française. Elle intervient au service de la santé des populations. Agence scientifique et d’expertise du champ sanitaire, elle a pour missions : (1) l'observation épidémiologique et la surveillance de l'état de santé des populations ; (2) la veille sur les risques sanitaires menaçant les populations ; (3) la promotion de la santé et la réduction des risques pour la santé ; (4) le développement de la prévention et de l'éducation pour la santé ; (5) La préparation et la réponse aux menaces, alertes et crises sanitaires ; (6) le lancement de l'alerte sanitaire. Le stage se déroulera dans l’unité « Appui à la conception, à la mise en place et à l’exploitation des enquêtes » de la Direction Appui, Traitements et Analyses des données (DATA). Cette unité a de nombreuses missions au sein de l’agence dont le montage d’enquêtes et la participation à leur coordination, la contribution à l’élaboration du plan de sondage, le data-management des données, la réalisation des analyses statistiques prenant en compte le plan de sondage… Le stage portera sur les données des enquêtes en ligne Coset (Cohortes pour la surveillance épidémiologique en lien avec le travail, http://www.coset.fr/ ) et en particulier sur les spécificités de son plan de sondage. Les échantillons des enquêtes Coset ont été construits en sur-représentant les plus jeunes (18-34 ans). Cette technique est classiquement utilisée dans les enquêtes dans le but d’approcher des populations d’intérêt rares et ainsi d’obtenir une puissance suffisante pour des analyses sur cette population. Ici, la sur-représentation a été utilisée de manière originale, afin de compenser un faible taux de réponse anticipé. En effet, l’enquête pilote avait montré que les plus jeunes avait un taux de réponse plus faible à nos enquêtes. Ainsi, lors de l’élaboration de l’échantillonnage de ces enquêtes, le faible taux de réponse des 18-34 ans a été anticipé et cette sous-population a été sur-représentée dans l’échantillon. L’objectif de la sur-représentation était d’obtenir suffisamment de jeunes dans l’échantillon des répondants pour effectuer des analyses sur cette sous-population, mais également d’obtenir une répartition des répondants par âge proche de celle de la population source. Ainsi, la sur-représentation doit améliorer la précision des estimations en particulier chez les jeunes. L’objectif de ce stage est d’étudier l’impact de la sur-représentation sur la répartition des répondants et sur la variance des estimations (globales et par classe d’âge), afin d’établir les bénéfices de cette stratégie pour les enquêtes Coset. Ce travail permettra de guider les stratégies d’échantillonnage des futures enquêtes menées par Santé publique France. Pour cela, le stagiaire étudiera les données des enquêtes Coset et simulera un échantillon à allocations proportionnelles (sans sur-représentation) à partir de ces données. Il sera nécessaire de simuler l’ensemble du processus d’enquête : tirage au sort de l’échantillon à interroger, simulation de l’échantillon des répondants, calcul des poids calés. Le stagiaire comparera ensuite les résultats pondérés obtenus sur l’échantillon des répondants Coset et sur l’échantillon simulé, notamment en termes de variances. Ce travail pourra faire l’objet d’une valorisation.
En savoir plus :xx
Offre stage 2018_2019_DATA_COSET2.pdf
Contact :noemie.soullier@santepubliquefrance.fr
Stage 3 mois : Etude des paradonnées et effet du mode de collecte internet dans les enquêtes Coset
Publiée le 22/08/2018 11:37.
Stage, 12 rue du Val d'Osne, 94415 Saint-Maurice Cedex.
Entreprise/Organisme :Santé publique France
Niveau d'études :Master
Sujet :Etude des paradonnées et de l'effet du mode de collecte internet dans les enquêtes Coset
Date de début :1er semestre 2019
Durée du contrat :3 mois
Rémunération :oui
Secteur d'activité :Santé publique / enquêtes
Description :Santé publique France est l’agence nationale de santé publique française. Elle intervient au service de la santé des populations. Agence scientifique et d’expertise du champ sanitaire, elle a pour missions : (1) l'observation épidémiologique et la surveillance de l'état de santé des populations ; (2) la veille sur les risques sanitaires menaçant les populations ; (3) la promotion de la santé et la réduction des risques pour la santé ; (4) le développement de la prévention et de l'éducation pour la santé ; (5) La préparation et la réponse aux menaces, alertes et crises sanitaires ; (6) le lancement de l'alerte sanitaire. Le stage se déroulera dans l’unité « Appui à la conception, à la mise en place et à l’exploitation des enquêtes » de la Direction Appui, Traitements et Analyses des données (DATA). Cette unité a de nombreuses missions au sein de l’agence dont le montage d’enquêtes et la participation à leur coordination, la contribution à l’élaboration du plan de sondage, le data-management des données, la réalisation des analyses statistiques prenant en compte le plan de sondage… Le stage portera sur les données des enquêtes en ligne Coset (Cohortes pour la surveillance épidémiologique en lien avec le travail, http://www.coset.fr/ ) et en particulier sur les spécificités du mode de collecte internet. Ce travail servira à investiguer les profils des répondants à ces enquêtes en ligne, afin : - D’apporter un éclairage sur les résultats issus des réponses au questionnaire, - D’améliorer les questionnaires pour le suivi des cohortes Coset, ainsi que de manière générale pour les futures enquêtes par internet menées par Santé publique France. Lors d’une enquête par internet, de nombreuses données sont recueillies sur le processus de collecte : ce sont les paradonnées. La première partie du stage aura pour objectif d’étudier ces paradonnées, en lien avec les caractéristiques des répondants. Pour cela, le stagiaire s’attachera à décrire les paradonnées (temps de remplissage du questionnaire, nombre de connexions au questionnaire par utilisateur…) puis à les analyser en fonction des caractéristiques des répondants à l’aide de régressions multivariées. Le remplissage du questionnaire sera également analysé, en fonction des paradonnées et des caractéristiques des répondants. Dans un deuxième temps, le stagiaire analysera l’effet du mode de collecte, en comparant l’enquête par internet à l’enquête pilote conduite à partir de questionnaires papiers. Cette analyse explorera les différents biais possibles liés au mode : - Le biais de sélection : le stagiaire comparera les caractéristiques des répondants aux deux enquêtes et testera les différences, - Le biais de non-réponse : le stagiaire étudiera si la non-réponse partielle est plus importante avec un mode de collecte, - Le biais de mesure : le stagiaire étudiera si les réponses à l’enquête sont différentes selon le mode, en utilisant des régressions multivariées ajustées sur les caractéristiques des répondants le cas échéant. Les deux parties de ce travail pourront faire l’objet d’une valorisation.
En savoir plus :xx
Offre stage 2018_2019_DATA_COSET1.pdf
Contact :laetitia.benezet@santepubliquefrance.fr

Page précédente  1  2  3  4  5  6  7  <8> 

 
 
©2019 SFdS
Société Française de Statistique
Institut Henri Poincaré
11 rue Pierre et Marie Curie
75231 Paris cedex 5
Tél. : +33 (0)1 44 27 66 60
Notre site a été supporté par :