Consulter les offres d’emploi

Stage : déterminants de l’antibiorésistance en milieu hospitalier
Publiée le 04/12/2024 17:58.
Stage, Paris 3ème.
Entreprise/Organisme :Conservatoire national des Arts et Métiers (laboratoire MESuRS)
Niveau d'études :Master
Date de début :Entre février et mai 2025
Durée du contrat :5 à 6 mois
Description :L’objectif de ce stage est d’analyser des données longitudinale de surveillance hospitalière, afin de mieux comprendre les déterminants de l’antibiorésistance à l'hôpital. En particulier, il s’agira (1) d’évaluer l’impact à long terme d'une intervention sur les prescriptions antibiotiques et (2) d’étudier l’impact de la pandémie de COVID-19 sur la dynamique de l’antibiorésistance.
En savoir plus :https://mesurs.cnam.fr/rejoindre-le-labo/
Offre_stage_AMR_Lyon.pdf
Contact :laura.temime@lecnam.net
Data Engineer H/F
Publiée le 04/12/2024 17:57.
Stage, Créteil, Île-de-France.
Entreprise/Organisme :Essilor International
Niveau d'études :Master
Sujet :Si vous avez déjà porté des lunettes, nous nous sommes déjà rencontrés. Nous sommes un leader mondial dans la conception, la fabrication et la distribution de verres ophtalmiques, de montures et de lunettes de soleil. Nous offrons à nos partenaires de l’industrie dans plus de 150 pays l’accès à une plateforme mondiale de produits de soins de la vue de haute qualité (tels que la marque Essilor, avec Varilux, Crizal, Eyezen, Stellest et Transitions), des marques emblématiques que les consommateurs adorent (telles que Ray-Ban, Oakley, Persol, Oliver Peoples, Vogue Eyewear et Costa), ainsi qu’un réseau qui offre aux consommateurs des soins de la vue de haute qualité et des expériences d’achat de premier ordre (tels que Sunglass Hut, LensCrafters, Salmoiraghi & Viganò et le réseau GrandVision), et des plateformes de e-commerce de premier plan. Rejoignez notre communauté mondiale de plus de 190 000 employés dévoués à travers le monde pour conduire la transformation de l’industrie des lunettes et des soins de la vue. Découvrez-en plus en nous suivant sur LinkedIn ! Votre #FutureInSight avec EssilorLuxottica Êtes-vous prêt à explorer de nouveaux horizons, à favoriser l’inclusivité et la collaboration, l’agilité, à éveiller la passion et à avoir un impact positif sur le monde ? Rejoignez-nous pour redéfinir les limites de ce qui est possible ! Votre rôle : Développement d'un outil automatisé pour les analyses statistiques et la rédaction d'un rapport d'analyse de données : • Codage d'un outil d'analyse statistique de bout en bout, adapté à différents types de jeux de données. • Débogage/validation avec des données simulées i. Le stagiaire recevra une description claire du format des données et du plan d'analyse statistique à coder (statistiques descriptives, tests t, validations des hypothèses de normalité...) ii. Dans le cadre du processus de validation, il/elle devra également préparer un jeu de données simulées iii. Un commentaire détaillé sur le script sera requis afin que le script puisse être manipulé par d'autres membres de l'équipe après la fin du stage• Rédaction d'un rapport d'analyse de données. i. L'outil développé servira à rédiger un rapport d'analyse statistique ii. Le stagiaire devra rédiger le texte d'interprétation des analyses de données. • Connaissance de base des concepts statistiques requise : statistiques descriptives, tests d'hypothèses, tests unilatéraux... • Bonnes compétences en manipulation de R et/ou Python requises : exécution des tests statistiques mentionnés ci-dessus, boucles, préparation de tableaux de résultats ; expérience avec les bibliothèques ggplot2 est un plus ; expérience avec RShiny est un plus • Compétences de base en manipulation de la boîte à outils Office (Word, Excel) • Rédaction d'un article : Cet outil servira à la rédaction du rapport d'analyse des données d'une enquête clinique. L'intention est qu'une partie de ces résultats soit revue par des pairs et publiée. Livrable : • Le stagiaire devra préparer le brouillon de l'article qu'il/elle co-signera. Profil : • Formation en analyse de données et ingénierie des données • Solides compétences en résolution de problèmes • Expérience solide avec R et/ou Python ; compétences de base en manipulation de la boîte à outils Microsoft Office • Expérience solide en rédaction en anglais (Niveau C1) Ce que nous vous offrons : Chez EssilorLuxottica, vous n’êtes pas défini uniquement par votre titre de poste. Chaque aventure professionnelle est unique, mais voici un aperçu des avantages et des bénéfices que vous pouvez obtenir en nous choisissant. Rejoindre EssilorLuxottica, c'est plonger au cœur d'un environnement international dynamique et stimulant. Vous aurez l'opportunité de collaborer avec des équipes diversifiées provenant de nombreux pays, enrichissant ainsi votre perspective culturelle et professionnelle. L'innovation est au cœur de notre ADN. Vous serez impliqué dans des projets novateurs qui façonnent l'avenir de l'optique et de la lunetterie. Vous aurez l'occasion de contribuer activement à des initiatives qui ont un impact réel sur le marché et sur la vie des consommateurs. Parce que nous tenons à soutenir nos stagiaires sur le plan pratique, nous prenons en charge 55 % du votre abonnement de transport journalier. De plus, vous bénéficiez de titresrestaurant d’une valeur journalière de 10€, dont 5,60€ sont pris en charge par EssilorLuxottica. La Diversité, l’Equité et l’Inclusion font partie des valeurs fondamentales de notre Groupe. Depuis de longues années, nous nous attachons à créer un environnement de travail où chaque personne se sent soutenue, valorisée et respectée, quel que soit son profil.Rejoignez-nous, vos talents uniques feront la différence ! Processus de recrutement : Premier entretien RH avec un membre de l’équipe recrutement Early Careers Entretien métier avec le manager Le processus de recrutement veut varier ; si vous êtes sélectionné, vous serez contacté par nos recruteurs pour vous guider dans les étapes de votre candidature. Prise de poste : à partir de janvier 2025 (flexible) Localisation : Créteil Dates/période du stage : 6 mois
Durée du contrat :6 mois
Description :(ci-dessus)
En savoir plus :https://careers.essilorluxottica.com/jobinvite/868282/
Annonce stage - Data Engineer HF.pdf
Contact :chountas@essilor.fr
Ingénieur d’études biostatistiques H/F
Publiée le 04/12/2024 17:57.
Stage, Créteil, Île-de-France.
Entreprise/Organisme :Essilor International
Niveau d'études :Master
Sujet :STAGE – Ingénieur d’études biostatistiques H/F
Durée du contrat :6 mois
Description :Votre rôle : Dans le cadre d'une analyse exploratoire de données cliniques, les valeurs seuils de cinq indices oculaires différents doivent être définies. Chacun de ces indices est associé à différentes mesures prises par les appareils Essilor et suit un système de notation. Le stagiaire devra effectuer une revue bibliographique des modèles de classification afin de définir l'algorithme le plus approprié pour chaque indice séparément. Le stagiaire devra ajuster plusieurs algorithmes de classification différents et réaliser une analyse de sensibilité pour évaluer lequel fonctionne le mieux. Pour évaluer la sensibilité et la spécificité de chaque algorithme, le stagiaire devra comparer la capacité prédictive de chaque modèle de classification au diagnostic du professionnel de la santé oculaire. Ensuite, en comparant la courbe ROC au taux de vrais positifs, le stagiaire pourra définir le seuil optimal pour chaque indice séparément.• Un rapport de la recherche bibliographique du stagiaire en méthodologie statistique • Une version propre du script • Un rapport court pour chacun des indices avec les résultats de l'application de la méthodologie • Un brouillon pour un article en vue d'une publication avec comité de lecture Profil : • Bac+5 avec une spécialisation en modélisation statistique • Compétences en résolution de problèmes • Maîtrise de R et/ou Python (modélisation, comparaison de modèles, analyse de sensibilité, expérience avec ggplot2 est un plus) • Une première expérience en statistiques/biostatistiques serait un plus • Niveau C1 en anglais
En savoir plus :https://careers.essilorluxottica.com/jobinvite/868277/
Annonce stage - Ingénieur d'études statistiques.pdf
Contact :chountas@essilor.fr
Stage M2 Génétique Quantitative du Tournesol et Impact de la Densité de Peuplement
Publiée le 04/12/2024 17:57.
Stage, Mondonville 31700.
Entreprise/Organisme :SOLTIS
Niveau d'études :Master
Sujet :Génétique Quantitative du Tournesol et Impact de la Densité de Peuplement
Date de début :février-mars 2025
Durée du contrat :6 mois
Secteur d'activité :Recherche en amélioration des plantes
Description :SOLTIS est une société de recherche dédiée à la sélection de semences de tournesol et se positionne comme leader européen sur cette espèce Type de contrat: Stage Durée du contrat: 6 mois Temps de travail: Temps complet Localisation: SOLTIS, 6 chemin de Panedautes, 31700 Mondonville Contexte SOLTIS recherche un(e) stagiaire de niveau Master 2 ou Ingénieur pour contribuer à un projet de recherche innovant visant à mieux comprendre l'impact de la densité de peuplement sur le rendement et d'autres caractères agronomiques du tournesol. Ce projet s'inscrit dans une démarche d'amélioration variétale plus durable et efficiente. Le/la stagiaire intégrera l’équipe Analytics & Breeding Support dédiée à l’analyse de données, aux développements méthodologiques et plus largement au support des programmes de sélection. Missions Le/la stagiaire sera amené(e) à : Analyser un jeu de données conséquent issu d'un réseau expérimental multi-sites, multi-années, multi-sources (manuel, drone, satellite). Mettre en œuvre des analyses statistiques descriptives et inférentielles afin de caractériser la réponse génétique du tournesol à différentes densités de peuplement dans les environnements cibles. Mettre en œuvre des analyses de génétique quantitative (QTL, GWAS, GxE) afin d’identifier et caractériser les facteurs génétiques sous-jacents à la variation des caractères ciblés en fonction de la densité. Profil recherché Formation: Bac+5 (Ecole d’ingénieur / Master 2) Spécialité en Amélioration des plantes, Génétique ou Statistiques. Compétences: Solides connaissances en génétique, statistiques et en modélisation (modèles mixtes). Maîtrise du logiciel R. Intérêt marqué pour la sélection et l'amélioration des plantes. Qualités: Autonomie, rigueur scientifique et esprit d'équipe. Curiosité, capacité d'analyse et de synthèse. Goût pour le travail en équipe et la communication scientifique. Afin de se familiariser avec tous les aspects d’un programme de sélection, l’étudiant(e) pourra également être amené(e) à participer aux activités saisonnières de l’entreprise, en lien avec la création de nouvelles lignées parentales, d’hybrides et de leur évaluation. Permis et véhicule recommandé, le site étant difficilement accessible en transports en commun Pour postuler, merci de déposer votre CV et une lettre de motivation sur notre site à l’adresse suivante: https://euralis.nos-recrutements.fr/job/48354
En savoir plus :https://euralis.nos-recrutements.fr/job/48354
241107_StageDensité (1).pdf
Contact :gregoire.marandel@soltis-research.com
Data scientist
Publiée le 04/12/2024 17:57.
CDD, Paris.
Entreprise/Organisme :Cour des Comptes
Niveau d'études :Master
Durée du contrat :3 ans
Secteur d'activité :Administration publique
Description :Analyse de données et évaluation de politiques publiques au profit des juridictions financières
En savoir plus :https://choisirleservicepublic.gouv.fr/offre-emploi/une-ou-un-data-scientist-reference-2024-1603046/
true.pdf
Contact :benjamin.belrhomari@ccomptes.fr
Étude de l’impact de la discrétisation pour l’estimation du modèle linéaire fonctionnel
Publiée le 02/12/2024 09:55.
Référence : Stage de M2.
Stage, Paris (CEREMADE) ou Rouen (LMRS).
Entreprise/Organisme :Université Paris-Dauphine/Université de Rouen Normandie/Université Paris Cité
Niveau d'études :Master
Sujet :voir fichier pdf joint
Date de début :Printemps 2025
Durée du contrat :4 à 6 mois
Secteur d'activité :Recherche
Description :L'analyse des données fonctionnelles est une branche de la statistique dont l'objectif est d'étudier des données qui se présentent sous forme de courbes (évolution de la température, électricité,...). La majorité des résultats de statistique mathématique existants supposent que les courbes sont observées en tout point, ce qui n'est pas le cas en général en pratique. L'objectif du stage sera d'explorer les vitesses de convergence dans le modèle de régression linéaire fonctionnel lorsque l'on tient compte du fait que les données sont observées sur une grille. Le stage pourra se prolonger par une thèse financée par le projet ANR FUNMathStat.
En savoir plus :https://sites.google.com/view/funmathstatanrproj/job-and-internship-offers
Sujet_Stage_M2_these.pdf
Contact :gaelle.chagny@univ-rouen.fr
Méthodes de réduction de dimension pour optimiser les simulations numériques du projet Cigeo
Publiée le 02/12/2024 09:55.
Référence : Stage M2 (+thèse ?) Andra et Université Paris Cité (LPSM).
Stage, Campus des Grands Moulins Paris 13ème et/ou Andra (Châtenay-Malabry (92)).
Entreprise/Organisme :Université Paris Cité (LPSM) et Andra (Agence nationale pour la gestion des déchets radioactifs)
Niveau d'études :Master
Date de début :mars-avril 2025
Durée du contrat :5 à 6 mois
Rémunération :Statut stagiaire Andra qui dépend du niveau de qualification du stagaire
Description :L’objet de ce stage sera de développer des méthodes d'apprentissage statistique et plus précisément de réduction de dimension et d’estimation de fonctions dans un cadre non paramétrique multivarié et d’étudier leur potentiel pour réduire les temps de calcul obtenus par des méthodes classiques de résolution d’EDP.
En savoir plus :https://drive.google.com/file/d/1r2kQ9ol_lvyMxDhkuC8KWP_Sq2hOpcsn/view?usp=sharing
Stage_Andra_Methodes_Statistiq_hydro_insature_v3.pdf
Contact :celine.levy-leduc@lpsm.paris
Master 2 internship: Development of a deep latent block model for co-clustering
Publiée le 02/12/2024 09:55.
Référence : DeepCoClustInternship.
Stage, 2004 Rte des Lucioles, 06902 Valbonne.
Entreprise/Organisme :Centre Inria d'Université Côte d'Azur
Niveau d'études :Master
Sujet :The proposed internship is in the context of co-clustering which consists in simultaneously clustering the rows and the columns of an array of data [1], this is particularly useful to summarize large datasets (see Figure 1). A popular probabilistic co-clustering model is the latent block model [3](LBM), it assumes that the clusters in each row and each column are drawn independently from two multinomial distributions and that given these clusters all the entries of the data array are independent, and that each entry follows a distribution only depending on its clusters in row and column. In the internship, we propose to develop an extension of the LBM in the case of binary data by assuming that each row and each column can be encoded by a latent position in an Euclidean space and that the parameter of the distribution of each entry only depends on these latent positions similarly to [5]. This model will allow to perform both co-clustering and visualization of the data through the latent positions as in [2]. For the parameters inference we will consider a variational approach as in [2] by making use of a neural network architecture for the approximate posterior distribution of the latent variables. Missions The main mission of the internship will be to write the mathematical model and its parameters inference, and perform its implementations on Python. Moreover, the accuracy of the proposed methodology will also be studied on real data sets. A thesis subject may be proposed as a continuation of this internship. References [1] Christophe Biernacki, Julien Jacques, and Christine Keribin. A survey on model-based co-clustering: High dimension and estimation challenges. 2022. [2] Rémi Boutin, Pierre Latouche, and Charles Bouveyron. The deep latent position topic model for clustering and representation of networks with textual edges, 2024. [3] Vincent Brault and Mahendra Mariadassou. Co-clustering through latent bloc model: A review. Journal de la Société Française de Statistique, 156(3):120–139, 2015. [4] Gérard Govaert and Mohamed Nadif. Block clustering with bernoulli mixture models: Comparison of different approaches. Computational Statistics and Data Analysis, 52(6):3233–3245, 2008. [5] Mark S Handcock, Adrian E Raftery, and Jeremy M Tantrum. Model-based clustering for social networks. Journal of the Royal Statistical Society: Series A (Statistics in Society), 170(2):301–354, 2007.
Date de début :March 2025
Durée du contrat :6 months
Rémunération :About 660 euros per month
Secteur d'activité :Recherche
Description :The proposed internship is in the context of co-clustering which consists in simultaneously clustering the rows and the columns of an array of data [1], this is particularly useful to summarize large datasets (see Figure 1). A popular probabilistic co-clustering model is the latent block model [3](LBM), it assumes that the clusters in each row and each column are drawn independently from two multinomial distributions and that given these clusters all the entries of the data array are independent, and that each entry follows a distribution only depending on its clusters in row and column. In the internship, we propose to develop an extension of the LBM in the case of binary data by assuming that each row and each column can be encoded by a latent position in an Euclidean space and that the parameter of the distribution of each entry only depends on these latent positions similarly to [5]. This model will allow to perform both co-clustering and visualization of the data through the latent positions as in [2]. For the parameters inference we will consider a variational approach as in [2] by making use of a neural network architecture for the approximate posterior distribution of the latent variables. Missions The main mission of the internship will be to write the mathematical model and its parameters inference, and perform its implementations on Python. Moreover, the accuracy of the proposed methodology will also be studied on real data sets. A thesis subject may be proposed as a continuation of this internship. References [1] Christophe Biernacki, Julien Jacques, and Christine Keribin. A survey on model-based co-clustering: High dimension and estimation challenges. 2022. [2] Rémi Boutin, Pierre Latouche, and Charles Bouveyron. The deep latent position topic model for clustering and representation of networks with textual edges, 2024. [3] Vincent Brault and Mahendra Mariadassou. Co-clustering through latent bloc model: A review. Journal de la Société Française de Statistique, 156(3):120–139, 2015. [4] Gérard Govaert and Mohamed Nadif. Block clustering with bernoulli mixture models: Comparison of different approaches. Computational Statistics and Data Analysis, 52(6):3233–3245, 2008. [5] Mark S Handcock, Adrian E Raftery, and Jeremy M Tantrum. Model-based clustering for social networks. Journal of the Royal Statistical Society: Series A (Statistics in Society), 170(2):301–354, 2007.
En savoir plus :NA
stage_coclustering.pdf
Contact :vincent.vandewalle@inria.fr
Evaluation de l’exposition au bruit professionnel dans la population des travailleurs de Constances
Publiée le 02/12/2024 09:54.
Référence : Stage UMRESTTE - Lyon - Projet BruiSaCo.
Stage, Campus Rockefeller, Lyon.
Entreprise/Organisme :UMRESTTE - Université Lyon 1
Niveau d'études :Master
Sujet :Introduction : La cohorte Constances est basée sur un échantillon représentatif de la population française âgé entre 18-69 ans (né entre 1941 et 2000) au moment de l’invitation et affilié au Régime général de Sécurité sociale. Le recrutement a eu lieu entre 2012 et 2019 et s’est terminé en 2021 avec 220 000 volontaires (54% de femmes). 198 108 calendriers professionnels complets pour 636 597 épisodes professionnels ont été codés en PCS2003 et NAF2008. Deux questions posées aux salariés permettaient également d’évaluer l’exposition au bruit professionnel. Objectif du stage : L’objectif de ce travail de stage sera d’évaluer l’exposition au bruit professionnel des salariés de la cohorte Constances par croisement des données d’emplois avec la matrice emplois-expositions au bruit développée par Santé publique France et l’Umrestte et l’exploitation des réponses collectées sur les 2 questions se rapportant au bruit professionnel. L’exposition au bruit professionnel sera déclinée selon les déterminants classiques des emplois : sexe, âge, PCS, NAF. Une évaluation de la cohérence entre la matrice et le déclaratif des individus sera également réalisée. Enfin, une analyse des divergences sera faite à partir des autres variables du questionnaire à l’inclusion. L’utilisation des données de suivis à T+4 ans et T+8 ans permettront d’évaluer l’exposition professionnelle au bruit au cours du temps.
Date de début :Février 2025
Durée du contrat :6 mois
Rémunération :Selon la grille en vigueur
Secteur d'activité :Laboratoire épidémiologique - Recherche publique
Description :L’UMRESTTE (UMR T 9405), Unité Mixte de Recherche Epidémiologique et de Surveillance Transport Travail Environnement, est une UMR associant l'Université Gustave Eiffel et l’UCBL. Elle dépend du Département Transport Santé Sécurité (TS2) de l'Université Gustave Eiffel. Elle est associée à Santé Publique France et accueille aussi plusieurs praticiens hospitaliers des HCL. Elle a été créée pour assurer des missions de recherches épidémiologiques et de surveillance en matière de traumatologie routière, de santé environnementale et de santé au travail. Les missions de l’UMRESTTE sont d'améliorer la connaissance et la prévention de la traumatologie accidentelle, des effets des nuisances environnementales et des conditions de travail sur la santé, notamment par des recherches épidémiologiques portant sur les facteurs de risque, la prise en charge et le devenir des victimes dans les domaines des transports, de l’environnement et du travail.
En savoir plus :https://umrestte.univ-gustave-eiffel.fr/
Annonce Stage 2025_Umrestte_Projet Bruit Constances.pdf
Contact :emmanuel.fort@univ-lyon1.fr
Stage Master 2 : Modélisation aléatoire et inférence statistique pour des processus de dégradation
Publiée le 02/12/2024 09:54.
Stage, Grenoble.
Entreprise/Organisme :Laboratoire Jean Kuntzmann - Université Grenoble Alpes
Niveau d'études :Master
Sujet :Modélisation aléatoire et inférence statistique pour des processus de dégradation
Date de début :Février/mars 2025
Durée du contrat :5 ou 6 mois
Rémunération :Gratification de stage règlementaire
Secteur d'activité :Recherche
Description :Voir fichier pdf
En savoir plus :https://www-ljk.imag.fr/
Stage LJK-EDF 2025.pdf
Contact :olivier.gaudoin@univ-grenoble-alpes.fr
Analyse statistique de données caractéristiques de dimensions de poids lourds
Publiée le 02/12/2024 09:54.
Stage, Université Gustave Eiffel, Champs-sur-Marne.
Entreprise/Organisme :Université Gustave Eiffel, Département COSYS, Laboratoires PICS-L & GRETTIA
Niveau d'études :Master
Sujet :Analyse statistique de données caractéristiques de dimensions de poids lourds en vue de la détection d’essieux relevés dans un contexte de sécurité routière - Identification et simulation de variables clés, modèles prévisionnels de détection
Date de début :février/mars 2025
Durée du contrat :6 mois
Rémunération :Environ 600€ / mois + 75% frais RATP sur justificatif
Description :Introduction au sujet : La plupart des codes de la route et autres réglementations sur les poids maximum des véhicules de type poids lourds fixent des limites liées au nombre d'essieux. Avec l'introduction envisagée de la verbalisation automatique à l'aide de systèmes de pesage en marche (WIM), il faut que le système sache précisément le nombre d'essieux du véhicule mis en cause en cas de surcharge. Or si des essieux sont relevés, le système WIM voit et compte n-p essieux si p essieux sont relevés. Il va donc appliquer la limite de charge pour n-p essieux. En outre la législation est floue sur la valeur maximale du poids autorisé. Par exemple, celle qui se base uniquement sur le nombre total d’essieux indiqué sur la carte grise du véhicule ne tient pas compte du fait qu’au moment du contrôle, il est possible qu’un ou plusieurs essieux soient relevés. D’où la nécessité de détecter correctement le nombre d’essieux relevés afin de pouvoir identifier la bonne catégorie et les éventuelles fraudes à sanctionner. Ajoutons également qu’une utilisation adéquate de ces dispositifs va dans le sens de la préservation des infrastructures routières. En effet, en cas de charge importante, un essieu relevé à tort contribue à l’endommagement de la route et engendre de l’insécurité routière. A contrario, en cas de charge modérée, un essieu abaissé à tort augmente forces de frottements et consommation énergétique. Le travail à réaliser dans ce stage s’appuiera principalement sur des bases de mesures WIM issues d’autoroutes européennes (A63 en France, A4 en Belgique, ...). Ces mesures pleinement disponibles ont été recueillies dans le cadre du projet de recherche européen SETO (Smart Enforcement of Transport Operations). Ce projet a pour objectifs de préserver l’intégrité des infrastructures, de promouvoir la sécurité routière, de gérer et d’optimiser le transport de marchandises. État de l’art et travaux à mener : Les études menées dans [1] et [2] proposent de comparer la distribution des essieux (ou séquences des distances inter-essieux d’un véhicule) à des clusters liés à la silhouette des PL. Une méthode k-means est – entre autres - proposée. Bien entendu, ces approches descriptives ne permettent pas de détecter des essieux relevés mais apportent un éclairage sur les données. Les études réalisées dans [4] ont permis de se doter de premiers modèles de détection d’essieux relevés pour la catégorie de poids lourds la plus fréquente du trafic autoroutier. En particulier, une méthode de type Random Forest ([3]) a donné des résultats encourageants tant sur les données réelles que des données simulées. Aussi, il reste de nombreuses méthodes susceptibles de donner des résultats intéressants à investiguer. Un état de l’art pourra être réalisé sur le sujet. On pourra notamment se focaliser sur des méthodes adaptées à des données non linéaires (K-NN, réseaux de neurones, …). On pourra également investiguer d’autres approches du machine learning comme les mélanges d’expert (MoE). Les méthodes retenues et les algorithmes sous-jacents seront déployés sur de nouveaux jeux de données réelles (données de fin 2024) et sur des données simulées afin de parfaire la validation. Bien entendu les performances des différentes méthodes seront comparées. Références [1] Quoy O, Interdistances et silhouettes de poids lourds sur autoroute, Revue Générale des Routes (RGRA), 1er trimestre 2021 [2] Stocchetti A, Statistiques de comptage de poids lourds et détermination de silhouettes, Rapport de la Société de Calcul Mathématique, octobre 2020 [3] Tuffery S, Data Mining et Statistiques Décisionnelles. La science des données, Technip, 2017 [4] Iahaya S-H, Analyse statistique et modélisation de données géométriques inter-essieux de poids-lourds, Université Gustave Eiffel, novembre 2024 Disciplines abordées : Statistiques, probabilités, informatique, analyse et fouille de données, Data scientist Profil recherché : étudiant de M2 ou équivalent (M1 exclu)
En savoir plus :https://pics-l.univ-gustave-eiffel.fr
StageM2_PICSL_GRETTIA.pdf
Contact :allou.same@univ-eiffel.fr
Modélisation de données de contamination environnementale issues de méthodes d’analyse non-ciblées
Publiée le 27/11/2024 11:32.
Stage, Rennes.
Entreprise/Organisme :IRMAR / IRSET
Niveau d'études :Master
Sujet :Modélisation de données de contamination environnementale issues de méthodes d’analyse non-ciblées
Durée du contrat :6 mois
Description :Problématique. L'exposome représente l'ensemble des expositions auxquelles une personne est soumise tout au long de sa vie, incluant les environnements chimiques, microbiologiques, physiques, récréatifs et médicaux, ainsi que le mode de vie, l'alimentation et les infections. La grossesse (période prénatale), l'enfance et la puberté ont été identifiées comme des périodes particulièrement sensibles, durant lesquelles les expositions environnementales peuvent influencer les trajectoires de santé individuelles. L'épidémiologie au cours de la vie a besoin d'outils pour étudier les marqueurs d'exposition et leurs effets sur la santé de plus en plus complexes. Les analyses non-ciblées basées sur l’utilisation de la chromatographie liquide couplée à la spectrométrie de masse haute résolution (LC-HRMS) offrent la promesse d’identifier, voire quantifier de manière globale les polluants présents dans les matrices biologiques telles que les urines, le sang, les cheveux. Le spectromètre de masse joue le rôle de détecteur et mesure le rapport masse/charge des ions détectés dans un échantillon, ainsi que l’abondance associée. La chromatographie liquide en amont permet de séparer les composés de manière à décomplexifier un échantillon. Des données en 3 dimensions formant des pics sont ainsi obtenues (m/z, intensité, temps de rétention). Dans une approche non ciblée, nous ne nous intéressons pas à des polluants particuliers prédéfinis, mais à l’ensemble de l’empreinte chimique caractérisée par de multiples pics correspondant à des molécules identifiées ou non. Plusieurs défis restent à relever pour exploiter de manière efficace ces données massives: les polluants d’intérêt sont peu abondants et sont masqués par les composés endogènes, ils sont donc particulièrement difficiles à détecter. Par ailleurs, tous les pics ne peuvent être décrits par la même "courbe mathématique" ( i.e., gaussienne). Enfin, les techniques utilisées pour l’enregistrement de ces données sont spécifiques aux laboratoires et l’analyse conjointe des profils d’exposition produits par ces différents laboratoires est aussi un challenge non résolu. Objectifs. L'analyse de ces données vise, comme premier objectif, à mettre en relation les pics détectés avec un événement de santé pour identifier ceux qui lui sont associés puis à les interpréter en termes de molécules en essayant de les annoter. Un deuxième objectif, non supervisé, est l'identification de profils d’expositions homogènes. Projet. Approche existante. Cet objectif global est actuellement traité en deux grandes étapes dans la littérature. Une première étape de pré-traitement, concomittante à l'acquisition des spectres, consiste à réduire l'ensemble du spectre à une matrice position/intensité résumant l'information moléculaire de l'échantillon. Cette matrice est ensuite utilisée, dans une deuxième étape, comme entrée de modèles d'apprentissage classiques, dans un cadre supervisé ou non, pour expliquer/prédire un événement ou identifier des profils d'individus. Une telle approche présente plusieurs limites. En premier lieu, le pré-traitement des spectres par ces méthodes sont composées de plusieurs étapes. Ces différentes étapes dépendent de nombreux paramètres à spécifier et accroissent de ce fait la subjectivité liée à l'utilisateur. Un des défis est donc de chercher à réduire ce nombre de paramètres ou d'automatiser leur choix. Par ailleurs, chaque étape est source d'erreurs statistiques qui ne sont que peu quantifiées ou prises en compte dans les méthodes existantes. Il est ainsi nécessaire de quantifier l'incertitude découlant de chaque étape du processus de traitement comme un moyen d'assurer une meilleure évaluation de la qualité des données. Approche proposée. Notre projet est d'adopter une approche plus globale afin de réduire les étapes de prétraitement et l'incertitude découlant des erreurs propagées par les étapes successives. Pour ce faire, nous proposons une modélisation fonctionnelle du spectre à l'aide de bases de fonctions flexibles et adaptées aux caractéristiques des spectres acquis. Parmi les difficultés liées aux spectres, une première est que les pics observés de ces données de LC-HRMS pour les différents individus ne sont pas correctement alignés, nous pourrons intégrer dans nos modèles une étape d'alignement basé sur le transport optimal et la distance de Wassertein. Par ailleurs, les polluants présents dans les échantillons biologiques correspondent généralement à des pics de petite taille dont l'intensité est proche du niveau du bruit, notre modèle devra donc en tenir compte afin de séparer les pics associés à des molécules réelles de ceux correspondant à du bruit. Enfin, les différentes variabilités, telles que celles dues aux différentes techniques des laboratoires, ou structures de groupes seront prises en compte dans le modèle final à l'aide d'effets mixtes. Nous définirons également un terme de pénalité spécifiquement adapté à la sélection de portions de courbes. Cette modélisation nous permettra d'identifier, sans a priori, les polluants dont l'effet est le plus significatif sur un événement de santé et pourra être adaptée au cas où la variable d'intérêt est une durée de vie telle que le décès ou l'apparition d'un cancer. Ce stage est susceptible de déboucher sur une thèse.
En savoir plus :NA
Sujet_stage_IRSET_IRMAR.pdf
Contact :valerie.gares@insa-rennes.fr
PhD position in mathematical statistics
Publiée le 27/11/2024 11:32.
Référence : PhD position Post-selection inference for latent variable models.
Thèse, Toulouse.
Entreprise/Organisme :Institut de Mathématiques de Toulouse
Niveau d'études :Master
Sujet :Post-selection inference for latent variable models
Date de début :Octobre 2025
Durée du contrat :3 ans
Description :Post-selection inference for latent variable models
En savoir plus :https://www.math.univ-toulouse.fr/~fbachoc/PhD_offer_post_selection_inference_latent_variables.pdf
Contact :francois.bachoc@math.univ-toulouse.fr
Transport optimal pour l’analyse de la pathologie moléculaire des maladies neuro-dégénératives
Publiée le 27/11/2024 11:32.
Stage, Paris.
Entreprise/Organisme :Sorbonne Université/IBPS
Niveau d'études :Master
Date de début :02/01/2025
Durée du contrat :6 mois
Secteur d'activité :Recherche et enseignement
Description :Contexte : L’équipe Brain-C de l’Institut de Biologie Paris-Seine (IBPS) développe plusieurs projets de recherche originaux visant à comprendre la dynamique des mécanismes de compensation neuronale au cours de la progression des maladies neuro-dégénératives (MD) comme la maladie de Huntington et la sclérose amyotrophique latérale (ALS). L’équipe, pluridisciplinaire, se compose de biologistes et de mathématicien.e.s et s’appuie sur un réseau de collaborateur.rice.s locaux et internationaux, aussi bien pour la production de données multi-omiques que pour leur analyse. Dans ce cadre, l’équipe Brain-C dispose de grands jeux de données temporelles (RNA-seq, ChIP-seq) obtenus dans des populations neuronales spécifiques, notamment dans les modèles souris, qu’elle analyse à des fins d’innovation thérapeutique (sélection de cibles). En collaboration avec l’Ecole Polytechnique et Telecom Paris, l’objectif du stage est d’identifier à une échelle fine les points communs et les différences dans les dynamiques moléculaires de ces maladies. La dérégulation à l’échelle du génome est modélisée à l’aide de graphes. Le transport optimal permet de disposer d’une métrique adaptée à la comparaison de tels objets à différents niveaux de granularité. Résultats attendus : - Proposer un clustering pour comparer les MD. - Identifier les sous-structures dans ces graphes portant la similarité ou la divergence et les interpréter en termes de mécanismes biologiques - Effectuer un recensement des problématiques posées qui seront ensuite développées dans le cadre d’un futur projet de thèse.
En savoir plus :https://www.ibps.sorbonne-universite.fr/fr/Recherche/umr-8256/brainc
Offre_Stage_OT_Graphs.pdf
Contact :lucile.megret@sorbonne-universite.fr
Maître de conférences en "Statistiques, Machine Learning et application aux SHS"
Publiée le 27/11/2024 11:31.
CDI, Campus Portes des Alpes, Bron.
Entreprise/Organisme :Université Lyon 2
Niveau d'études :Doctorat
Date de début :01/09/2025
Description :Maître de conférences en "Statistiques, Machine Learning et application aux SHS"
En savoir plus :https://eric.msh-lse.fr/wp-content/uploads/2024/11/2025-univlyon2-posteMCF26.pdf
Contact :julien.jacques@univ-lyon2.fr

<1>  2  3  4  5  Page suivante

 
 
©2024 SFdS
Société Française de Statistique
Institut Henri Poincaré
11 rue Pierre et Marie Curie
75231 Paris cedex 5
Tél. : +33 (0)1 44 27 66 60
Notre site a été supporté par :