Consulter les offres d’emploi

Etude de l’adaptation du colza au changement climatique
Publiée le 18/12/2018 13:45.
Référence : Offre de stage pour un étudiant(e) en Master.
Stage, Thiverval - Grignon (78).
Entreprise/Organisme :Terres Inovia
Niveau d'études :Master
Sujet :Etude de l’adaptation du colza au changement climatique
Date de début :suivant calendrier de l'étudiant(e) mars ou avril
Durée du contrat :6 mois
Rémunération :Selon la réglementation en vigueur, la gratification du stage s’élève à 570 euros net par mois.
Secteur d'activité :agronomie
Description :Le travail de stage se découpe en 4 étapes : 1. Prise en main du modèle, réalisation de simulations tests, prise de contacts avec l’équipe projet 2. Choix des sites qui seront étudiées dans le stage, mise au format des données et réalisation des simulations avec le modèle. Comparaison avec les données observées. 3. Calculs des principaux stress environnementaux pouvant impacter la culture (mise en œuvre de méthodes de régression PLS) et définir pour chacun un indicateur permettant d’en évaluer le niveau. 4. Illustration de ces indicateurs (graphiques et cartes) et échanges avec les ingénieurs de terrain.
En savoir plus :www.terresinovia.fr
sujet_de_stage_master2_Terres_Inovia.pdf
Contact :s.gervois@terresinovia.fr
POST DOC POSITION IN STATISTICAL GENETICS
Publiée le 18/12/2018 12:07.
Postdoc, INSERM CESP - Equipe cancer et environnement, 16 avenue Paul Vaillant Couturier 94800 Villejuif.
Entreprise/Organisme :INSERM
Niveau d'études :Doctorat
Date de début :à partir de février 2019
Durée du contrat :12 mois ou 24 mois
Rémunération :~2100 euros net
Description :Context This position is one of the two postdoctoral positions funded by the project CCGIP (Cross Cancer Genomic Investigation of Pleiotropy effect and GxE interactions at pathway level: application to breast and thyroid cancers) which is granted by “La Ligue contre le Cancer”. Our objective is to develop novel statistical methods for testing GxE interactions and pleiotropy through gene set analysis (GSA). These methods will be applied to data from GWAS of differentiated thyroid cancer and breast cancer. Both tumors have been shown to be associated to common hormonal risk factors and shared genetic susceptibility is suspected. We aim to elucidate the common mechanisms between the two cancers. We will extend methods that test for pleiotropic effects for testing GxE interactions. This project will permit the development of new statistical methods that will benefit both the epidemiology and statistical communities. Details about the other position are listed here https://lma-umr5142.univ-pau.fr/fr/vie-du-laboratoire/recrutement/post-doctorat.html. The two successful postdoctoral researchers will work both in parallel as well as collaboratively for achieving the tasks of the funded project. Profile requirements • Phd in Biostatistics, Statistical Genetics or Computer Science • Strong experience in computer programming. • Experience in the development and application of Bayesian and Frequentist methods for computationally challenging problems. • Knowledge of genetics will be appreciated. • Good communication skills and interest in working in a cross-disciplinary team. Supervision • Therese Truong, INSERM-CESP, Villejuif, France • Marina Evangelou, Imperial College London
En savoir plus :xx
Post-Doc-position-CCGIP_M1T2B0.pdf
Contact :therese.truong@inserm.fr
Le Département d'Information Médicale du CHU de Montpellier recherche un statisticien
Publiée le 18/12/2018 12:07.
CDD, Montpellier.
Entreprise/Organisme :Centre Hospitalier Universitaire de Montpellier
Niveau d'études :Master
Date de début :à partir de février 2019
Durée du contrat :CDD 6 mois (possibilité évolution en CDI)
Secteur d'activité :Santé
Description :Le poste est situé dans l'Unité d'Evaluation et d’Etude épidémiologiques sur les Bases Nationales d'activité hospitalière, dans le Département d’Information Médicale du CHU de Montpellier. Elle est constituée de : un médecin épidémiologiste, un Ingénieur informaticien, un ingénieur statisticien. L'unité a pour mission le traitement de bases de données hospitalières pour le compte de la Base Inter-CHU (Ensemble des CHU français) et de la Fédération Hospitalière de France (Ensemble des établissements publics). L'Unité est incluse dans le DIM et travaille en collaboration : - avec les représentants des DIM des autres CHU français - avec les représentants de la Fédération Hospitalière de France - avec les autres équipes du DIM (Informatique, PMSI, Recherche Clinique). Missions de l'Unité : • Fournir aux établissements hospitaliers, par le traitement statistique des données d'activité hospitalière et le développement d'indicateurs pertinents, les éléments de réflexion nécessaires à l'organisation et la défense de leur activité : en interne, dans le tissu sanitaire régional et national. • Répondre aux demandes ponctuelles des conférences des CHU (Présidents de CME, Directeurs Généraux), ou de la Fédération Hospitalière de France, en vue d'enrichir leur argumentaire sur les questions d'actualité impactant les établissements hospitaliers publics. • Les principales bases traitées sont les fichiers du PMSI (Court séjour et Soins de Suite et de Réadaptation). • L'unité prend en charge : o la gestion de la Base d'activité des CHU : Traitements pluri annuels (réguliers ou études spécifiques) des données du Programme de Médicalisation des Systèmes d'Information des établissements et mise à disposition des résultats sur le site internet de la Base Inter-CHU o la gestion de la Base Nationale d'activité des établissements français (convention avec la FHF) : traitements statistiques entrant dans le cahier des charges prévu par la convention • Développer des études de recherche en épidémiologie hospitalière, répondre à la demande d’étude des CHU, sur des données hospitalières, éventuellement associées à d’autres base de données de santé (SNDS). Profil souhaité : • Formation initiale en mathématiques et statistique, et jusqu’au niveau master 2 ou plus (ou diplôme d'ingénieur dans la spécialité) • Très bonne maîtrise des méthodes d’analyse multivariée (notamment modèle linéaire, modèle linéaire généralisé, modèle mixte). Une expérience dans l'analyse temporelle et/ou spatiale serait un plus • Bonne maîtrise des méthodes de data mining, analyses de données (classifications, arbres de décision et forêt aléatoires, méthodes factorielles, règles d'association…). • Expérience dans la réalisation d'études portant sur de grandes masses d'informations, du recueil au traitement. Une expérience sur les bases de données hospitalières et/ou sur les autres données du SNDS serait un plus. • Très bonne maîtrise de la programmation en environnement SAS (langage Macro, SQL et modules graphiques) et R. La maitrise d’outils SIG et logiciels de cartographie serait un plus. • Qualités requises : rigueur, esprit d’analyse, de synthèse et d’initiative, sens des responsabilités, autonomie et organisation dans le travail, bonne aptitude au travail en équipe multidisciplinaire. Missions du statisticien : • Participation à la réalisation de travaux de recherche en évaluation et épidémiologie hospitalière et péri-hospitalière : développement de méthodologies d'analyse statistiques et d'indicateurs d'activité innovants, incluant l'utilisation et/ou le développement de modélisation mathématique. • Participation au développement des programmes de traitements réguliers des Bases traitées • Participation à la rédaction d'articles scientifiques, communications en congrès • Recherche documentaire (traitements réguliers), recherche bibliographique (études spécifiques) Liaisons fonctionnelles : - Membres de l'unité - Membres des autres unités du DIM - Médecin DIM des établissements de la Base CHU - Représentants de la FHF
En savoir plus :http://www.chu-montpellier.fr/fileadmin/user_upload/DRH/OFFRES/2018_Fiche_de_publication_Ingenieur_S
Fiche_poste_Statisticien.pdf
Contact :f-seguret@chu-montpellier.fr
DATA SCIENTIST / BIOSTATISTICIEN (NE)
Publiée le 18/12/2018 08:59.
Référence : DATA_SCIENTIST_2019.
CDI, Saint-Herblain, France (44).
Entreprise/Organisme :Biofortis Mérieux NutriSciences
Niveau d'études :Master
Date de début :Dès que possible
Secteur d'activité :CRO / Santé
Description :Biofortis, une compagnie Mérieux NutriSciences, est une CRO offrant des services tels que la conduite d’essais cliniques, des projets de recherche et des tests bioanalytiques. Biofortis a développé ces dernières années une forte expertise autour de l’analyse des microflores complexes dont le microbiote intestinal. Celle-ci est appuyée par une plate-forme analytique intégrant différents outils (biochimie, enzymologie, métagénomique ciblée par NGS ADNr 16S, métagénomique shotgun, typage bactérien par WGS...) permettant la production des données ad hoc qui sont ensuite traitées et analysées par une équipe dédiée de bioinformaticiens et statisticiens. Dans le cadre de nos activités NGS et d’analyse des microbiotes, nous recherchons un(e) Data Scientist / Biostatisticien(ne). Les missions/responsabilités principales de ce poste sont les suivantes : . Conduite de projets R&D internes - Veille bibliographique, synthèse et recommandations sur les méthodes d’analyses de données de métagénomique ciblée ou shotgun - Développement/Optimisation de workflows d’analyses statistiques - Participation à la rédaction de publications scientifiques . Gestion de projets clients : - Elaboration des hypothèses statistiques en collaboration avec les équipes scientifiques et le client - Définition des approches méthodologiques - Conduite des analyses et rédaction de rapports d’études Profil et compétences : . Formation supérieure en statistiques/data science, dès Bac+5 . Expérience d’au moins 3 ans dans un poste similaire . Connaissances en NGS, génomiques et/ou métagénomiques . Expérience démontrée en programmation statistique, notamment R (Shiny serait apprécié) et Python. . Larges compétences en modélisation statistique (analyse différentielle, lasso, …), machine learning (random forest, PLS, SVM, …) et intégration/analyse de données hétérogènes et grandes dimensions . Connaissances en analyses de réseaux seraient un plus . Bon niveau d’anglais scientifique . Capacité à interagir dans un environnement pluridisciplinaire . Autonomie, rigueur, très bon relationnel, esprit de synthèse et d’initiative Lieu de travail : Saint-Herblain, France Poste à pourvoir dès que possible. Si vous êtes intéressé par ce poste, merci d’envoyer votre CV et lettre de motivation, incluant votre disponibilité et vos prétentions à : Sébastien Leuillet CTO / Statistics & Bioinformatics Manager sebastien.leuillet@mxns.com
En savoir plus :https://www.merieuxnutrisciences.com/fr/biofortis-innovation-services
Contact :sebastien.leuillet@mxns.com
POST DOC POSITION IN STATISTICS AND COMPUTER SCIENCE
Publiée le 14/12/2018 15:10.
Référence : STATISTICS AND COMPUTER SCIENCE.
Postdoc, Université de Pau et Pays de L'Adour (Anglet campus) and MRC (Cambridge).
Entreprise/Organisme :Université de Pau et Pays de L' Adour
Niveau d'études :Doctorat
Date de début :As soon as possible
Durée du contrat :2 years
Rémunération :The salary will be around 2700 euros/month (gross salary). Possibility of teaching
Secteur d'activité :Statistics and Computer Science
Description :Recently, several approaches were developed for completing the agnostic genome-wide association studies (GWAS) in the discovery of new genetic risk factors. One such approach is gene set analysis (GSA) that incorporates the available biological knowledge of genes in order to provide additional insights into the mechanisms involved in carcinogenesis. Another approach proposed to test variants for association for multiple phenotypes as over the years multiple loci have been found to be associated to several distinct traits revealing the existence of pleiotropic effects. Although a number of statistical approaches have been proposed in the literature for identifying the existence of pleiotropy at SNP-level, not a lot of work has been conducted for investigating pleiotropy at gene- and pathway-levels. We aim to fill this gap by developing advanced statistical methods that test for pleiotropic effects at a pathway level. Also, we will extend these methods for the analysis of GxE interactions. This project will lead to the development of new statistical methods that will benefit both the epidemiology and statistical communities. These methods will permit to gain novel insights into the inherited genetic basis of Breast Cancer and differentiated thyroid cancer by identifying the common biological elements that contribute to their aetiology.
En savoir plus :https://lma-umr5142.univ-pau.fr/_resources/Post-Doc-position-CCGIP.pdf?download=true
Post-Doc-position-CCGIP.pdf
Contact :benoit.liquet@univ-pau.fr
Analyse de sensibilité pour modèles stochastiques
Publiée le 13/12/2018 14:24.
Stage, Jouy-en-Josas.
Entreprise/Organisme :unité MaIAGE, INRA
Niveau d'études :Master
Sujet :La simulation numérique occupe aujourd'hui une place prépondérante en science et en ingéniérie. Les méthodes utilisées, souvent empiriques, ouvrent de nombreuses perspectives de recherche en mathématique et en informatique. Par exemple, les modèles construits pour simuler un phénomène d'intérêt dépendent en général de paramètres inconnus. Pour palier ce problème, il est naturel de spécifier une plage de valeurs à l'intérieur de laquelle les paramètres sont tirés au hasard, et d'observer les sorties qui en résultent. La sortie est donc vue comme un variable aléatoire dont la variance représente l'incertitude due à notre méconnaissance des entrées. On parle de propagation d'incertitude : l'incertitude sur les paramètres est propagée jusqu'à la sortie du modèle. Quels sont, dés lors, les paramètres importants à prendre en compte ? L'analyse de sensibilité peut apporter des éléments de réponse, en ce qu'elle permet de quantifier l'influence de chaque entrée. Plus précisément, elle permet de calculer, par échantillonnage Monte-Carlo, la proportion de variance qui serait éliminée si tel ou tel paramètre était fixé. Les quantités calculées sont appelées des indices de Sobol. Cela permet au scientifique ou à l'ingénieur de mettre des oeuvre des stratégies de réduction de la complexité du modèle ou de son incertitude. Il existe des modèles intrinsèquement stochastiques, c'est à dire que, même si les paramètres étaient fixés, la sortie du modèle serait aléatoire. Dans ce cas, réaliser une analyse de sensibilité est plus complexe car sa performance dépendra d'un compromis entre le nombre d'explorations de l'espace des paramètres et du nombre de répétitions du modèle. Dans un travail en cours, nous avons proposé une approche théorique qui exploite le rapport signal-sur-bruit et avons démontré son optimalité asymptotique. Néanmoins, sa performance doit être évaluée à taille d'échantillon finie et sur des modèles réalistes. Objectifs L'objectif de ce stage est d'évaluer la performance de la méthode que nous avons proposée sur des modèles réalistes de propagation d'épidémies. Il s'agit de savoir si cette méthode permet effectivement d'obtenir des estimations des indices de Sobol plus précises que les méthodes empiriques utilisées aujourd'hui. L'étudiant mènera une étude de cas qui, idéalement, donnera lieu à la publication d'un article de recherche. Sous réserve de l'obtention de financement, il est envisagé que ce stage se prolonge par une thèse dans laquelle une extension de notre méthode à des modèles dynamiques devra être proposée. Ainsi, en plus de l'aspect pratique, la thèse comportera un important volet théorique.
Date de début :01/03/18 ou 01/04/18
Durée du contrat :5-6 mois
Rémunération :550 euros/mois environ (taux légal)
Secteur d'activité :Statistique
Description :Compétences recherchées Master 2 en mathématiques appliquées avec une forte composante en statistique. Compétences en programmation (R ou Python ou C++), inférence statistique, bon équilibre entre intérêts pour les applications et théorie. Déroulement du stage Le stage se déroulera dans l'unité MaIAGE (Mathématiques et Informatique Appliquées du Génome à l’Environnement) du centre INRA de Jouy-en-Josas (78350). La durée prévue est de 5 à 6 mois. Gratification : 550 euros/mois environ (taux légal). Candidature Envoyer une lettre de motivation, votre CV et la liste des cours suivis en M1/M2 avec toutes les notes disponibles à texttt{gildas.mazo@inra.fr}, texttt{elisabeta.vergu@inra.fr}.
En savoir plus :http://maiage.jouy.inra.fr/
stage-ansens.pdf
Contact :gildas.mazo@inra.fr
Automatisation d’un algorithme de phénotypage de trajectoires biologiques en élevage
Publiée le 13/12/2018 08:19.
Stage, MIAT Toulouse.
Entreprise/Organisme :INRA
Niveau d'études :Master
Date de début :au plus tôt le 01/01/2019
Durée du contrat :6 mois
Rémunération :554.40€/mois
Description :- Problématique: Le travail proposé s’insère dans le projet FLECHE “Fromages et Laits issus d’Elevages de Chèvres conduites à l’Herbe” financé par le programme PSDR Grand Ouest (Nouvelle-Aquitaine, Pays de la Loire, Bretagne, Normandie). Un des volets de recherche porte sur la prédiction des impacts d’un système alimentaire basé sur l’herbe sur les réponses biologiques des animaux. Le poids vif (PV) est un bon indicateur de ces réponses et il est aujourd’hui possible d’avoir des mesures individuelles en élevage. Un modèle mathématique a été développé pour convertir les trajectoires individuelles de PV en un ensemble de valeurs de paramètres, considérées comme un vecteur phénotypique. Le modèle est basé sur une décomposition de la trajectoire de PV en processus élémentaires associés aux successions d’états physiologiques tout au long de la carrière : élaboration d’un poids mature piloté génétiquement et adapté à l’environnement, développement et alimentation d’une portée, stockage et mobilisation de réserves corporelles. Les paramètres du modèle fournissent une quantification de ces processus élémentaires. Le formalisme est basé sur des équations différentielles ordinaires et la procédure d’ajustement du modèle aux données se fait via un processus séquentiel non automatisé. - Travail à effectuer: La première étape du travail sera d’automatiser la procédure d’ajustement du modèle aux données individuelles. Différentes méthodes d'estimation de paramètres seront envisagées puis éventuellement mises en œuvre et comparées (algorithmes évolutionnaires, estimation bayésiennes, ...). Cette étape devra ainsi permettre le traitement rapide d’un grand nombre d’individus. La deuxième étape du travail sera de tester si la procédure d’ajustement peut fonctionner avec des données manquantes/moins fréquentes. La mise en œuvre de ces étapes de travail permettra à l’étudiant, avec l’appui des informaticiens de l’équipe d’accueil, de tester le workflow mis en place par la plateforme Record (enchaînements de scripts R et utilisation de ressources de calcul). - Profil recherché: Master 2 en mathématiques/informatique appliqués ou école d’ingénieur Bonnes connaissances en statistiques et optimisation Maitrise du langage R Aucune connaissance préalable en agronomie n’est nécessaire mais un intérêt pour ce domaine appliqué serait un plus. Maitrise de l’anglais scientifique nécessaire
En savoir plus :http://redcap.terredeschevres.fr/spip.php?rubrique72
Stage_GRUM_2019.pdf
Contact :laurence.puillet@inra.fr
IA et apprentissage statistique pour la prévision probabiliste de la consommation
Publiée le 12/12/2018 08:21.
Stage, La Défense.
Entreprise/Organisme :Réseau de Transport d'Electricité
Niveau d'études :Master
Date de début :Mars-avril 2019
Durée du contrat :5-6 mois
Rémunération :en fonction de l’expérience et de la formation
Description :Afin de garantir en permanence l’équilibre entre offre et demande d’électricité, RTE développe et maintient en conditions opérationnelles ses propres modèles de prévision de consommation et de productions renouvelables (éolien, solaire). Dans un souci constant d’amélioration de la qualité de ces prévisions, l’objectif du stage est de contribuer au perfectionnement des prévisions de consommation nationale et régionale. Les modèles opérationnels ont été construits sur des historiques relativement longs mais stables et les prévisions bénéficient d’une forte expertise pour la prise en compte des périodes spéciales. Du fait de l’évolution des usages, notamment du développement de l’auto-consommation, de la potentielle disparition du changement d’heure, il est nécessaire d’étudier des modèles dont l’estimation serait plus automatique et plus réactive à ces évolutions. Les modèles attendus devront fournir une prévision déterministe et probabiliste (quantiles 10 et 90%). L’objectif du stage est de s’appuyer sur la littérature récente en data science et intelligence artificielle pour proposer des évolutions des modèles de consommation existants.
En savoir plus :Xx
Stage_conso.pdf
Contact :lucie.montuelle@rte-france.com
Stage en analyse d'image (application à l'agronomie)
Publiée le 12/12/2018 08:21.
Référence : IRIT_INRA_imagerie.
Stage, Toulouse.
Entreprise/Organisme :IRIT, INRA
Niveau d'études :Master
Sujet :"Vision par ordinateur pour la caractérisation par imagerie et LiDAR de couverts mélangés blé - pois/féverole" (voir pdf joint)
Date de début :mars 2019
Durée du contrat :5 à 6 mois
Rémunération :500 euros / mois
Secteur d'activité :Recherche et développement
Description :voir pdf joint
En savoir plus :http://www.inra-transfert.fr/fr/actualites/103-3-infrastructures/310-phenome
Stage Phenotypage.pdf
Contact :noemie.gaudio@inra.fr
Modèles à blocs latents pour la caractérisation de la biodiversité
Publiée le 10/12/2018 15:21.
Stage, Toulouse.
Entreprise/Organisme :Unité de Mathématiques et Informatique Appliquées de Toulouse, INRA
Niveau d'études :Master
Sujet :sujet M2 sur "Modèles à blocs latents pour la caractérisation de la biodiversité " (voir pdf joint)
Date de début :entre mars et avril
Durée du contrat :5 à 6 mois
Rémunération :environ 560€ /mois
Secteur d'activité :Recherche
Description :sujet M2, voir pdf joint
En savoir plus :https://mia.toulouse.inra.fr/Emplois
sujetM2_SBM4biodiv.pdf
Contact :nathalie.peyrard@inra.fr
A Bayesian approach for event predictions in clinical trials with time-to-event outcomes
Publiée le 10/12/2018 15:21.
Stage, Suresnes (92150).
Entreprise/Organisme :Institut de Recherches Internationales Servier
Niveau d'études :Master
Sujet :A Bayesian approach for event predictions in clinical trials with time-to-event outcomes
Date de début :Flexible : February to April 2019
Durée du contrat :6 months
Rémunération :Intéressante
Secteur d'activité :Biopharmacie & Santé
Description :In clinical trials with a time-to-event outcome as primary endpoint, the statistical power is based on the number of observed events, which drives the sample size calculation. The planned statistical analysis is conducted when a pre-specified number of events is reached. However, the calendar date of the last event and of the end of the study remains unknown. Statistical methods are developed to predict, at interim analyses, the date when the targeted number of events is reached, given the observed event rate. The objective of the internship is to participate in the development of a new Bayesian method, taking into account the variability and specificities of enrollment of the newly recruited patients, time to event and time to censorship processes and significant covariates. The approach is based on Weibull models with MCMC algorithms and informative priors in a Bayesian framework. Missions  - Literature review in order to identify existing approaches already published  - Validation of the method’s performance using a simulation plan investigating many scenarios (study sample size, target number of events, enrollment processes, available information, …).  - Conduct a comparison of the proposed algorithm with existing approaches.  - Improvement, if needed, of the method’s performance and flexibility.  - Application to real clinical trials.  - This work may result in the publication of an article in a statistical journal.
En savoir plus :https://www.servier-campus.com/fr/
Servier_Internship_EventsPredictions.pdf
Contact :paul.aubel@servier.com
POSTDOC in Statistical modelling of ecosystem services
Publiée le 09/12/2018 13:52.
Référence : INRA_POSTDOC_QUANTICONTROL.
Postdoc, RENNES, FRANCE.
Entreprise/Organisme :INRA - Agrocampus Ouest
Niveau d'études :Doctorat
Date de début :01 March 2019
Durée du contrat :A one year position (possibly once renewable)
Rémunération :An Annual Gross Salary of 42.6 k€ plus funding for scientific conferences
Secteur d'activité :Agriculture, Ecology
Description :The project aims to test a new method for estimating natural pest regulation from Bayesian hierarchical modelling of field-collected pest-predators time series. This approach should allow testing how predator traits (e.g. dispersal capacity, diet specialization) relate to pest control and spatial scales in different agricultural contexts. You will perform the statistical modelling on available datasets and build an index measuring biological control intensity at field scale. You will collaborate with partners to develop field applications of the index for evaluating agro ecological systems.
En savoir plus :https://www6.rennes.inra.fr/igepp_eng/Offers/Postdoctoral-Researcher
Postdoc Position_Quanticontrol.pdf
Contact :sylvain.poggi@inra.fr
Data Manager /Data Scientist
Publiée le 09/12/2018 13:52.
CDI, Malakoff 92.
Entreprise/Organisme :Inbox SARL
Niveau d'études :Master
Secteur d'activité :Big Data
Description :Voir Fichier Joint
En savoir plus :https://inbox.fr/
Data Manager..pdf
Contact :mprince@inbox.fr
Co-clustering de séries temporelles
Publiée le 07/12/2018 18:44.
Référence : Co-clustering de séries temporelles.
Stage, Saclay (PARIS).
Entreprise/Organisme :CEA
Niveau d'études :Master
Sujet :Classification croisée non supervisée de séries temporelles : application aux signaux énergétiques
Date de début :02-03/2019
Durée du contrat :6 mois
Rémunération :à partir de 600€ bruts selon profil
Secteur d'activité :Datascience, énergie
Description :La classification croisée (co-clustering) a pour objectif d'identifier la structure en blocs homogènes d'un tableau de données à partir d'une classification jointe des lignes et des colonnes. Depuis 1965, ce problème a été développé sous plusieurs variantes mais son intérêt s'est considérablement accru ces dernières années avec l'arrivée de nombreuses applications comme l'analyse de données textuelles, l'analyse marketing, la génomie, les systèmes de recommandations ou bien encore l’étude de données énergétiques. Ce type d'approches organise simultanément les lignes et les colonnes d'un tableau pour découvrir des blocs homogènes alignés. Ce procédé identifie alors un couple de partitions en ligne et en colonne. Parmi les méthodes développées, l’approche probabiliste par modèles de blocs latents utilisent des variables latentes pour définir les classes en ligne et en colonne. Le but du stage est d’étudier l’utilisation de ce modèle de blocs latents pour le cas particulier des données temporelles. Ce type de méthode est particulièrement intéressant dans le cadre de l’étude de consommation énergétique par exemple ou dans l’analyse de signaux pour les comprendre, les résumer mais aussi pour en extraire des caractéristiques pertinentes (feature engineering). Une récente approche propose de transformer ces données en fonction puis d’utiliser une FPCA (Functional principal component analysis) dans le cadre d’un prétraitement pour appliquer le modèle de blocs latents. Une seconde approche qui considère aussi les signaux comme des fonctions s’appuie sur une transformation du modèle de blocs latent pour données fonctionnelles (FunLBL). Pendant le stage, l’étudiant devra dans un premier temps faire un état de l’art des méthodes de co-clustering pour les données temporelles. Dans un second temps, il s’agira d’implémenter les méthodes décrites dans le paragraphe précédent pour les tester sur des signaux énergétiques. L’application directe du modèle de blocs latents sera aussi réalisée afin de les comparer et d’identifier les forces et les faiblesses des différentes approches. Le stage pourra être suivi d’une thèse. Les formalités nécessaires au recrutement du candidat étant assez longues, il est recommandé de commencer les démarches au moins 3 mois avant le début du stage.
En savoir plus :NA
2018 sujet de stage 6 mois co_clustering.pdf
Contact :aurore.lomet@cea.fr
Post doc position in simultaneous/selective inference
Publiée le 07/12/2018 15:50.
Référence : postdoc-sansSouci.
Postdoc, Toulouse and/or Paris.
Entreprise/Organisme :Université Paul Sabatier
Niveau d'études :Autre
Date de début :From January 2019
Durée du contrat :12 à 16 months
Description :Statistical data analyses typically involve model or variable selection steps. Accounting for the effect of the selection is a challenging task, which has gained a lot of interest recently in the statistical litterature as well as in various applications including genomics and neuroimaging. The postdoc will be part of the SansSouci project (2016-2020), which aims at developing novel multiple testing methodology providing interpretable statistical guarantees in the presence of selection. This project is funded by the French National Research Agency (ANR). The postdoc will take a leading role in extending and testing the methodology initially developed by the project investigators, so as to accommodate the requirements of specific genomic applications. One possible direction is the use of permutation/bootstrap to adapt to the dependence structure of DNA copy number data. Expected is a willingness to contribute in theoretical/analytical as well as computational aspects.
En savoir plus :https://www.math.univ-toulouse.fr/~pneuvial/sanssouci
postdoc_subject-v0.pdf
Contact :pierre.neuvial@math.univ-toulouse.fr

<1>  2  3  4  5  6  7  8  9  Page suivante

 
 
©2018 SFdS
Société Française de Statistique
Institut Henri Poincaré
11 rue Pierre et Marie Curie
75231 Paris cedex 5
Tél. : +33 (0)1 44 27 66 60
Notre site a été supporté par :