Consulter les offres d’emploi

Personnalisation et optimisation de la prise en charge des patients traités par PPC
Publiée le 16/11/2021 08:25.
Référence : LVLHP2.
Thèse, Lyon.
Entreprise/Organisme :LVL Médical / Laboratoire HP2 INSERM
Niveau d'études :Master
Sujet :Personnalisation et optimisation de la prise en charge des patients traités par pression positive continue à domicile pour un syndrome d’apnées du sommeil : Amélioration et validation des algorithmes d’alertes de télésuivi pour la prise en charge des patients.
Date de début :(dès validation par ANRT) estimation Janvier 2022
Durée du contrat :3 ans
Secteur d'activité :Santé à Domicile
Description :L’objectif général de cette thèse consiste à analyser les données de suivi journalière de patients ayant un syndrome d’apnées du sommeil traités par pression positive continue (PPC) pour identifier les prises en charge optimales pour le maintien ou l’amélioration de l’observance à la PPC. Pour atteindre cet objectif les travaux s’articuleront en trois parties : - Description de la prise en charge actuelle des patients et constitution d’outils de visualisation des trajectoires d’observance après les alertes déjà mises en place par l’entreprise. - Modélisation de l’impact d’une prise en charge après une alerte d’observance à partir d’une approche observationnelle basée sur l’analyse des données existantes avec une approche causale. Développement d’algorithmes. - Développement d’une approche multidimensionnelle visant à intégrer l’ensemble des éléments recueillis pour caractériser les trajectoires d’observance des patients.
En savoir plus :https://www.lvlmedical.com/
Candidature CIFRE LVL Médical HP2.pdf
Contact :clementine.mouroux@lvlmedical.fr
TECHNICIEN SUPPORT UTILISATEURS LOGICIEL SPHINX H/F
Publiée le 05/11/2021 17:36.
CDI, CHAVANOD (74).
Entreprise/Organisme :LE SPHINX DEVELOPPEMENT
Niveau d'études :DUT/Licence ou équivalent
Date de début :Dès que possible
Secteur d'activité :Edition de logiciels applicatifs d'enquêtes statistiques et d'analyse de données
Description :La société Le Sphinx Développement, leader sur son marché avec plus de 30 000 clients, propose une gamme complète de logiciels dédiés à l’enquête et à l’analyse de données. 70 collaborateurs répartis sur 2 sites (Grenoble et Annecy) travaillent avec un objectif commun : améliorer la qualité des solutions et la satisfaction des utilisateurs. Dans le cadre de son développement, la société cherche aujourd’hui à renforcer son équipe de support utilisateurs logiciels. Missions Au sein d’un service de 4 personnes, vous intervenez auprès de nos clients logiciels par téléphone et par mail, pour leur apporter un conseil technique et méthodologique, à toutes les étapes de leur projet : conception de questionnaires, diffusion (internet, sms, face à face, téléphone), analyse des résultats. Vous êtes de plus chargé(e) de suivre et de documenter l’évolution de la demande (solution, remontée de bug) dans notre outil de ticketing. Enfin vous intervenez sur différentes taches auprès de nos utilisateurs à savoir : • Demandes concernant le bon fonctionnement du logiciel (installation, activation de licences, exécution) • Gestion des comptes utilisateurs Sphinx Online (création, modification, suppression) • Demandes d’améliorations concernant nos solutions Profil • De formation Bac+2/3 minimum, idéalement issu d’un DUT STID ou d’une Licence Professionnelle Statistiques (ESSM), vous avez un intérêt marqué pour les enquêtes statistiques et l'informatique. • Dans le but de solutionner les demandes de nos clients, vous êtes à l’aise au téléphone, vous disposez d’un forte capacité d’écoute et de qualités pédagogiques. • Vous êtes quelqu'un d'enthousiaste, patient, dynamique, rigoureux avec de l’empathie et savez faire preuve de diplomatie • Votre adaptabilité, votre réactivité et votre curiosité vous permettent de trouver rapidement une solution à la problématique de nos clients. • Votre curiosité et envie d’apprendre vous permettront de développer votre niveau de connaissance des nouvelles versions de logiciels Sphinx et des nouvelles technologies que nous mettons en place régulièrement Compétences • Vous maitrisez les méthodologies d’études quantitatives : vous connaissez le fonctionnement d'une étude, vous savez ce qu'est une "condition de présentation", un "renvoi", une question fermée / ouverte / échelle. • La maitrise des solutions Sphinx (IQ2 / Declic / Dataviv) est fortement appréciée et vous permettra d'être rapidement autonome. • Des compétences informatique (notion de programmation, notions de serveurs) et en statistiques (les termes khi2, corrélations, ACP ne vous sont pas inconnus) seraient un plus. Avantages 13ème mois / Tickets restaurants / Chèques vacances / Intéressement / Télétravail / RTT Merci d’envoyer vos candidatures (CV + lettre de motivation) par mail à l’attention de Rémi Montes à l’adresse suivante : rmontes@lesphinx.eu
En savoir plus :https://www.lesphinx-developpement.fr/
Offre_Support_technique.pdf
Contact :rmontes@lesphinx.eu
Stage M2/Ecole Ingénieur en biostatistique/data science
Publiée le 05/11/2021 17:36.
Stage, Fontenay-Aux-Roses (92).
Entreprise/Organisme :Institut de Radioprotection et de Sûreté Nucléaire (IRSN)
Niveau d'études :Master
Sujet :Modélisation hiérarchique bayésienne pour l’estimation corrigée d’un risque sanitaire radio-induit en présence d’erreurs de mesure d’exposition
Date de début :Février à avril 2022
Durée du contrat :6 mois
Rémunération :1250 euros + accès self-service IRSN à prix réduit + prise en charge partielle titres de transport
Secteur d'activité :data science, santé
Description :Modélisation hiérarchique bayésienne pour l’estimation corrigée d’un risque sanitaire radio-induit en présence d’erreurs de mesure d’exposition
En savoir plus :https://www.irsn.fr/FR/Pages/Home.aspx
Stage_RADONORM_Ancelet.pdf
Contact :sophie.ancelet@irsn.fr
Stage M2 : Modélisation statistique appliquée à la transition écologique
Publiée le 04/11/2021 18:10.
Stage, Rennes.
Entreprise/Organisme :IRMAR - Institut Agro/Agrocampus Ouest
Niveau d'études :Master
Sujet :Sélection de variables dans les modèles d'équations structurelles : application à la transition écologique
Durée du contrat :4 à 6 mois
Secteur d'activité :Statistique, AgroEcologie
Description :La modélisation holistique de systèmes complexes et en particulier d'agrosystèmes doit pouvoir tenir compte du caractère multi-échelle et multi-compartiment du système ainsi que des relations causales qui pilotent l'évolution du système. Les modèles d'équations structurelles offrent un cadre mathématique et théorique particulièrement adapté à ces caractéristiques, notamment en s'appuyant sur la définition d'un graphe orienté acyclique (DAG) et sur l'utilisation d'une structure latente permettant une hiérarchisation du système [Bollen, 1989]. Plus précisemment les modèles d'équations structurelles, par un principe de systèmes d'équations (linéaires ou non-linéaires), permettent de définir les relations causales directes et indirectes entre les variables caractérisant un système d'étude [Pearl et al., 2016]. Les approches parcimonieuses dans les modèles d'équations structurelles se sont pour l'instant limitées à un ensemble de variables observées choisi et/ou des DAGs fixe dans des approches confirmatoires [Shipley, 2016]. Le stage s'inscrit dans une approche exploratoire où plusieurs DAGs peuvent être confrontés aux observations et pour laquelle il est attendu que plusieurs modèles ne soit pas rejetés par les données. Dans ce contexte, il est nécessaire de pouvoir comparer les modèles entre eux afin de déterminer, de façon parcimonieuse, un ensemble de variables ``suffisant'' pour caractériser la structure causale globale du système. Le/la candidat/e sera amené/e à proposer et étudier une procédure de sélection de variables dans les modèles d'équations structurelles à variables latentes. Une attention toute particulière sera portée à la comparaison de cette nouvelle avec des pratiques existantes pour identifier les situations expérimentales favorables.
En savoir plus :http://emily.perso.math.cnrs.fr/StageM2/StageM2_AO_2122.pdf
StageM2_AO_2122.pdf
Contact :mathieu.emily@agrocampus-ouest.fr
Stage M2/Ecole Ingénieur: Prise en compte des événements récurrents dans l’analyse des toxicités
Publiée le 02/11/2021 13:09.
Stage, IUCT-O. Institut Claudius Regaud. 1 avenue Irène Joliot-Curie. 31059 TOULOUSE Cedex 9.
Entreprise/Organisme :Institut Claudius Regaud. IUCT-O
Niveau d'études :Master
Description :Contexte scientifique : Dans la recherche clinique en oncologie, l’analyse et le report des toxicités liées au traitement à l’étude sont d’une importance capitale. En effet, en plus de l’efficacité du traitement, une bonne connaissance du profil de toxicité et de l’impact de celle-ci sur la qualité de vie du patient est cruciale dans le choix de la stratégie thérapeutique. Contrairement aux chimiothérapies, les nouveaux traitements développés à l’heure actuelle, comme les thérapies ciblées ou les immunothérapies, sont administrés de manière continue pendant des mois voire des années jusqu’à la rechute ou la progression de la maladie. Cependant, les méthodes d’analyse des toxicités n’ont pas réellement évolué depuis le début des années 2000 (report de l’incidence des toxicités, grade maximum, …). Il est donc primordial d’utiliser des méthodologies adaptées permettant de capturer et modéliser la durée et le caractère récurrent des toxicités induites par ces durées de traitement prolongées. Plusieurs approches comme la fonction de prévalence, la « ToxT approach » ou encore la modélisation Q-TWiST ont été utilisées afin de modéliser l’évolution des toxicités au cours du temps (Thanarajasingam, 2015 ; Cabarrou, 2016). Des approches alternatives basées sur les modèles pour événements récurrents ont également été proposées dans la littérature (Gong, 2014 ; Henglebrock, 2016). Ces méthodologies permettent notamment de comparer les profils de toxicité entre des groupes de traitement ou d’estimer son effet sur le risque d’apparition d’une toxicité pouvant survenir de manière récurrente. Les auteurs recommandent également d’utiliser la « mean frequency function » qui correspond au nombre cumulé d’évènements survenus au cours du temps (Ghosh, 2000). Objectif : L’objectif de ce stage est d’étudier les méthodologies statistiques basées sur les modèles pour événements récurrents et leur intérêt dans l’analyse des toxicités associées aux nouvelles thérapeutiques en oncologie. Pour cela, les différents modèles étudiés seront notamment appliqués aux données d’un essai clinique (NCT03447483) qui avait pour objectif de recueillir et analyser les toxicités chez des patients traités par immunothérapie. Encadrement / Information Pratique : Le stagiaire bénéficiera d’un encadrement sur le plan méthodologique et sur le plan clinique. Profil recherché : Master 2 en Biostatistique / Dernière année d'école d’ingénieurs Prérequis : Bonnes connaissances en biostatistique (modélisation) et programmation sous les logiciels R et/ou STATA. Un caractère dynamique, entreprenant et motivé, ainsi qu’un esprit multidisciplinaire seront des atouts
En savoir plus :www.iuct-oncopole.fr
Stage_M2_RecurEvent_v01.pdf
Contact :filleron.thomas@iuct-oncopole.fr
Stage M2 : étude de convergence des algorithmes d’apprentissage fédéré dans le cas non-iid
Publiée le 02/11/2021 10:39.
Stage, Saclay (Ile-de-France).
Entreprise/Organisme :CEA LIST
Niveau d'études :Master
Sujet :En 2016, Google publie les principes fondateurs de l’apprentissage fédéré avec la promesse de créer des IA sans compromettre les données des utilisateurs. Cette méthode est en train de changer le paradigme actuel de l’IA centralisée, où construire de meilleurs modèles se résume souvent à collecter toujours plus de données personnelles et les centraliser sur un serveur. L’apprentissage fédéré est une approche collaborative où tous les utilisateurs d’un service participent à l’apprentissage du modèle sans transmettre leurs données personnelles mais uniquement les paramètres du modèle mis à jour localement. Au lieu de centraliser les données, seuls les paramètres du modèle sont agrégés sur le serveur central ce qui permet d’améliorer la confidentialité des données et de limiter les coûts de communication. L’apprentissage d’un réseau de neurones nécessite un ensemble de données iid (indépendantes et identiquement distribuées) afin de garantir que le gradient stochastique soit une estimation non biaisée du gradient entier. Contrairement à un apprentissage centralisé, il est impossible dans le cadre de l’apprentissage fédéré d’assurer que les données locales de chaque utilisateur soient toujours iid. Le cas non-iid (où la distribution des données entre utilisateurs sera différente) va entrainer une dégradation des performances du modèle fédéré par rapport à l’approche centralisée. L’objectif du stage consiste à étudier les algorithmes qui permettent d’améliorer le processus d’apprentissage d’un modèle fédéré avec données non-iid. L’analyse portera sur la vitesse de convergence de l’optimisation ainsi que la précision du modèle. L’étude sera menée de manière empirique en évaluant les algorithmes sur la base de données EMNIST et également de manière théorique en étudiant les preuves de convergence.
Durée du contrat :6 mois
Description :Situé à Saclay, en Ile-de-France sud, le CEA LIST (http://www-list.cea.fr/) est un centre de recherche scientifique et technologique dédié au développement de logiciels, de systèmes embarqués et de capteurs pour des applications destinées à la défense, la sécurité, l’énergie, le nucléaire, l’environnement et la santé. Le CEA LIST fait partie de l’écosystème dynamique et stimulant de l'Université Paris Saclay - le plus grand pôle scientifique français comptant 60 000 étudiants. Il compte plus de 700 chercheurs se focalisant sur les systèmes numériques intelligents, centrés autour de l’intelligence artificielle, l’usine du futur, l’instrumentation innovante, les systèmes cyberphysiques et la santé numérique. Au sein de cet institut, le SID (Service d’Intelligence des Données) travaille sur les algorithmes et méthodologies de l'intelligence artificielle et du traitement du signal. Les recherches et avancées technologiques du service sont guidées par des applications variées, pour lesquelles les spécificités et contraintes sur les données ou l’environnement d’exécution nécessitent une conception fine des IA et de leur intégration comme briques unitaires de systèmes complexes. Le stagiaire intégrera l'équipe dédiée à l'apprentissage décentralisé.
En savoir plus :http://www-list.cea.fr/
poste_stage_FL_CEA.pdf
Contact :aurelien.mayoue@cea.fr
Statisticien Auditeur Senior
Publiée le 27/10/2021 10:37.
Référence : 684751.
CDI, Levallois-Perret (92).
Entreprise/Organisme :CESP (Centre d'Etude des Supports de Publicité)
Niveau d'études :Master
Date de début :Dès que possible
Rémunération :Selon expérience
Secteur d'activité :Etude de l'audience des médias
Description :Statisticien Auditeur Senior, vous aurez un rôle d'expert référent au sein du CESP (Centre d'Etude des Supports de Publicité) qui est l’organisme interprofessionnel, tiers de confiance de l'industrie des médias et de la publicité. Vous serez amené à prendre part à des projets variés à fort enjeu méthodologique dans le secteur des médias et de la publicité. Vous serez rattaché au Directeur Data Science au sein de l'équipe Data, et vos missions évolueront avec les besoins du marché publicitaire et selon les innovations technologiques.
En savoir plus :https://www.michaelpage.fr/job-detail/statisticien-auditeur-senior-hf/ref/684751
Offre Statisticien Auditeur Senior.pdf
Contact :bastiendjimbi@michaelpage.fr
Assistant/Associate Professor in Statistics
Publiée le 27/10/2021 10:36.
CDI, Bruz.
Entreprise/Organisme :ENSAI
Niveau d'études :Doctorat
Description :See the attached file
En savoir plus :https://ensai.fr/recruitment-statistics/​
20212022_Position_Statistics-1.pdf
Contact :lionel.truquet@ensai.fr
Chargé(e) de production statistiques sur le marché du travail
Publiée le 25/10/2021 18:18.
Référence : Dares/2021-31.
CDD, 39-43, Quai André-Citroën 75015 Paris.
Entreprise/Organisme :Ministère du travail/direction de l'animation de la recherche, des études et des statistiques
Niveau d'études :Master
Date de début :01/01/2022
Durée du contrat :36 mois
Rémunération :35-50 k€ annuel brut
Secteur d'activité :Statistiques économiques
Description :Encadrement: non Au sein du département Suivi et indemnisation des demandeurs d'emploi (D-SIDE), vous serez, avec d'autres membres du département, en charge de la production et de l'analyse mensuelle et trimestrielle des statistiques sur les demandeurs d'emploi inscrits à Pôle emploi, source cruciale pour l’'analyse conjoncturelle du marché du travail. Dans ce cadre, vous serez responsable du contrôle de l'exactitude et de la pertinence des statistiques produites, de l'analyse des évolutions atypiques et de l'évaluation de l'impact des événements pouvant affecter les statistiques. Vous réaliserez la publication "Dares Indicateurs" trimestrielle sur les demandeurs d'emploi inscrits à Pôle emploi. Plus généralement, vous contribuerez aux évolutions méthodologiques de cette source de données. En binôme, vous développerez une expertise méthodologique sur les données des demandeurs d’'emploi, notamment en ce qui concerne les modèles de correction des variations saisonnières et des effets des jours ouvrables, que vous mettrez à jour une fois par an, en les faisant évoluer en cas de besoin. En binôme avec un autre membre du département, vous serez également amené.e à réaliser des analyses pour répondre aux questions de la direction de la Dares, des cabinets ministériels, ou des corps d’'inspection concernant les demandeurs d'emploi. Vous pourrez également être conduit.e à mener des études plus approfondies sur ce thème. Partenaires institutionnels : Outre les membres du département, vous travaillerez avec les statisticiens de Pôle emploi, de la mission de l'Action régionale de la Dares, et avec les services études, statistiques et évaluation des Dreets. Vous serez également amené.e à échanger avec l'Insee. Spécificités du poste / Contraintes : Comme tout agent du service statistique public, vous serez soumis au secret statistique. Des contraintes de présence lors des périodes de production statistique pourront être appliquées (trois jours tous les deux mois).
En savoir plus :NA
2021-31_Chargé(e) de production statistiques sur le marché du travail_rplt DLN.pdf
Contact :dares.recrutement@travail.gouv.fr
[Stage M2/thèse] Apprentissage de modèles à base de règles pour la prédiction de séries temporelles
Publiée le 25/10/2021 16:21.
Référence : [Stage M2/thèse] Apprentissage de modèles à base de règles pour la prédiction de séries temporelles.
Stage, CEA Paris-Saclay.
Entreprise/Organisme :CEA
Niveau d'études :Master
Sujet :La réduction des coûts liés à l'instrumentation et au stockage permet de disposer aujourd'hui de nombreuses bases de données permettant la mise en œuvre de modèles prédictifs (c'est-à-dire capables de prédire des événements). Le traitement des séries temporelles a fait l'objet de nombreux travaux dans ces différents domaines de l'IA. Nous nous intéressons ici aux algorithmes d'IA symbolique. Contrairement aux réseaux de neurones, les algorithmes d'intelligence artificielle symbolique permettent d'exploiter des connaissances et de simuler un raisonnement humain. Ces algorithmes permettent d'obtenir des modèles interprétables, c'est-à-dire facilement compréhensibles par un humain. Dans certains domaines dans lesquels l'humain est le sujet principal, comme en médecine ou dans la sécurité, de tels modèles sont nécessaires pour obtenir une IA de confiance. Dans ce cadre, le CEA List développe sa propre plate-forme logicielle ExpressIF (https://expressif.cea.fr) qui est capable d'exploiter des connaissances humaines, d'extraire automatiquement des connaissances depuis des données, et de justifier ses décisions. Les méthodes de l'état de l'art proposent souvent des cas d'étude simplifiés. D'une part, l'analyse des variables prédictives et à prédire repose souvent sur une analyse des corrélations: la corrélation n'étant pas systématiquement une causalité, le lien peut être quelque peu erroné. D'autre part, la temporalité est souvent simplifiée: on considère souvent les valeurs des variables aux mêmes temps. Pourtant, de nombreuses applications ne correspondent pas à ces simplifications. A titre d'exemple: - Dans le domaine du manufacturing, on cherche souvent à prédire la défaillance d'un produit par rapport aux différentes étapes du procédé. Or la défaillance peut être causée par des événements ayant eu lieu à différents moments du procédé. - Dans le domaine de la cybersécurité (et plus généralement en sécurité), une attaque peut être détectée par différentes tentatives ou différents événements au fil du temps. - Dans le cadre de certains capteurs chimiques, les gaz sont transportés par fluidique et présentés à différents capteurs. Les réponses de ces capteurs sont donc décalées dans le temps. Dans ce contexte, cette thèse a pour objectif de développer une solution innovante pour l'apprentissage d'une base de règles pour la prédiction de séries temporelles. Pour ce faire, il est nécessaire dans un premier temps d'avoir une méthode automatique pour déduire les relations de causalité entre les séries temporelles. Dans un second temps, il sera nécessaire d'appliquer ou adapter ou développer des méthodes d'extraction de vocabulaire pour la définition des règles à partir des relations causales établies. De nouveaux opérateurs spécifiques aux séries temporelles pourront être définis et enrichir la plateforme ExpressIF. Ainsi, ce travail devra prendre en compte la finalité d'apprentissage de la base de règles. Plusieurs enjeux seront donc étudiés dans cette thèse : 1. l'ordre temporel devra être pris en compte pour définir les relations causales. On cherchera à développer ou adapter une méthode pour des relations non linéaires et non gaussiennes qui sont les plus fréquentes dans les données réelles. La causalité au sens de Granger et ses extensions pour le cas non linéaire ne pourront pas être directement appliquées du fait qu'elles peuvent exprimer une corrélation avec antécédent. En effet, ces méthodes reposent sur le principe d'amélioration de la prévision d'une série par l'intégration d'information exogène qui est possible avec une corrélation. Dans le but de déduire des bases de règles, l'objectif de ce travail est d'obtenir des relations causales. Ainsi, les graphes causaux bayésiens acycliques peuvent apporter une solution en les adaptant pour les séries temporelles. Du fait de la complexité de ces méthodes, il sera alors nécessaire de proposer une méthode adaptée pour les jeux de données de grande dimension comme dans le domaine du monitoring, par exemple. 2. En lien avec le point précédant, une discrétisation des séries pourra être envisagée pour définir les relations causales suivant les valeurs et les instants des séries. Cette discrétisations pourra être mise en relation avec l'extraction de vocabulaire des règles de décision. Par exemple, on considère les variables X, Y et Z. On souhaite obtenir une règle telle que : si X est grand à l'instant t-k et Y est petit à l'instant t-l alors Z est solide à l'instant t. A partir de cet exemple, on peut noter que les règles pourront considérer des décalages temporels différents suivant les causes. 3. Enfin, les effets joints des causes seront également considérés. Il existe plusieurs types d'effets joints : additifs, multiplicatifs... Ces relations devront être prises en compte dans l'établissement des règles. La thèse sera précédée d'un stage de MASTER2. Dans ce contexte, le premier objectif du stage est d'étudier les différents tests possibles pour l'indépendance/l'influence de séries temporelles (notamment les tests d'indépendance basés sur l'entropie de transfert). Cette étude considérera également les indépendances conditionnelles pour tester une catégorie des effets joints des causes. D'autres types d'effets joints pourront être considérés. On se concentrera également sur la discrétisation des séries temporelles pour tester l'influence par morceau. Enfin, on s'intéressera à la mise en application de réseaux bayésiens pour la causalité existants dans la littérature.
Date de début :Premier semestre 2022 pour le stage et semestre pour la thèse
Durée du contrat :6 mois pour le stage et 3 ans pour la thèse
Rémunération :Selon profil
Secteur d'activité :IA, IA symbolique, machine learning, datascience
Description :Environnement : Situé à Saclay, en Ile-de-France sud, le CEA LIST est un institut de recherche scientifique et technologique dédié au développement de logiciels, de systèmes embarqués et de capteurs pour des applications destinées à la défense, la sécurité, l’énergie, le nucléaire, l’environnement et la santé. Le CEA LIST compte plus de 700 chercheurs travaillant sur les systèmes numériques intelligents, centrés autour de l’intelligence artificielle, l’usine du futur, l’instrumentation innovante, les systèmes cyberphysiques et la santé numérique. Au sein de cet institut, les laboratoires du Service d’Intelligence des Données (SID) travaillent au développement et au transfert industriel de technologies de pointe en IA. Le périmètre technique de nos 50 ingénieurs et chercheurs concerne l’analyse des signaux (c.à.d. des séries temporelles, mais aussi des spectres) produits par les équipements développés en interne, par les équipes du CEA, ou par des sociétés externes. L’exploitation de ces données repose sur un large spectre de méthodes d’apprentissage machine, relevant de l’IA numérique (réseaux de neurones profonds, forêts aléatoires, SVM) et de l’IA symbolique (systèmes à base de règles). Profil : MASTER 2 en IA, datascience, statistique, ingénierie statistique. La capacité à travailler en équipe est nécessaire, tout en faisant preuve d'autonomie dans les tâches au quotidien. Les développements en IA avançant rapidement, il est nécessaire que la candidate ou le candidat ait la capacité de renouveler et enrichir ses compétences de manière continue. Enfin, d'excellentes capacités d'expression, orale et écrite, en anglais, vous seront nécessaires pour échanger avec les nombreux partenaires du projet. Sur le plan scientifique et technique, vous pouvez justifier : - de solides compétences en statistique (traitement de séries temporelles, signal) et en machine learning (data science), - des connaissances et/ou une expérience en étude de causalité sont un plus, - des connaissances en IA symbolique, en particulier (mais non obligatoire) - d’une expérience significative en développement logiciel, s’appuyant idéalement sur : o La maîtrise d’un langage de prototypage (idéalement Python 3 ou R), o L’utilisation d’outils de développement et de partage de code tels que Git ou SVN sera également appréciée.
En savoir plus :Xx
stagethese.pdf
Contact :aurore.lomet@cea.fr
Model-based reinforcement learning for the control of partially observable PDMPs
Publiée le 30/09/2021 15:49.
Référence : HSMM PhD.
Thèse, Montpellier, France.
Entreprise/Organisme :Institut Montpelliérain Alexander Grothendieck
Niveau d'études :Master
Sujet :Model-based reinforcement learning for the control of partially observable piecewise deterministic semi-Markov decision processes
Date de début :september 2022
Durée du contrat :3 years
Rémunération :about 40k€ /year (gross salary)
Description :The long-term treatment of human diseases such as cancer is generally based on monitoring the dynamics of variables (markers in the organism) over time, modeled by a series of contin- uous trajectories defined from a “mode” (conjunction of a stage of the disease and a treatment). The transitions between modes depend both on intrinsic characteristics and on the treatments applied. The transitions between stages and the sojourn times can be modeled by semi-Markov kernels (depending on the treatments applied). Optimal treatment of a disease, in the ideal case where markers and stages are continuously observed and dynamics models are known, amounts to optimizing a strategy based on the patient's condition, for a semi-Markov decision process. In reality, (i) the stages of the disease are not observed, (ii) the markers are only observed during sampling, the dates of which are to be decided together with the treatments and (iii) the models of dynamics are not known (one will make the assump- tion of a parameterized form, of which the parameters are unknown). The objective of this thesis is to propose a framework of representation and optimization algorithms for these problems. Their unifying characteristic is a piecewise deterministic dynamic which should allow the development of specific approaches, more efficient than the general framework of partially observable semi-Markov decision processes. On the application level, we will focus on the problem of cancer monitoring and treatment, for which the members of the consortium have both monitoring data and collaborate with experts.
En savoir plus :https://imag.umontpellier.fr/~saporta/PDF/JOBS/These_en_HSMM.pdf
These_en_HSMM.pdf
Contact :benoite.de-saporta@umontpellier.fr
Inférence dans les modèles à copules pour données non continues par vraisemblance par paires randomi
Publiée le 08/09/2021 17:44.
Stage, Jouy-en-Josas.
Entreprise/Organisme :INRAE, unité MaIAGE
Niveau d'études :Master
Sujet :Inférence dans les modèles à copules pour données non continues par vraisemblance par paires randomisée avec applications en biologie "-omique"
Date de début :01/04/2022
Durée du contrat :5 à 6 mois
Rémunération :550 EUR / mois
Secteur d'activité :Mathématique et statistique
Description :TITRE (ENGLISH BELOW) Inférence dans les modèles à copules pour données non continues par vraisemblance par paires randomisée avec applications en biologie "-omique" SUJET Une copule est une fonction qui prend en arguments des fonctions de répartition univariées arbitraires et retourne une fonction de répartition multivariée. Au vu du caractère arbitraire des lois choisies en entrée, la loi multivariée en sortie, appelée modèle à copules, peut donc modéliser tous types de données (discrètes, continues et mixtes). Cette propriété avantageuse des modèles à copules en font de bons candidats pour traiter les données de type "-omiques" en biologie, dont l'analyse permet de mieux comprendre le lien entre génotype et phénotype. Néanmoins, les données -omiques sont souvent de nature discrète (par exemple, on compte le nombre de fragments d'ARN qui correspondent à un gène donné pour révéler son niveau d'expression dans une condition donnée), ce qui rend l'inférence statistique difficile à cause de la complexité algorithmique du calcul de la vraisemblance. Pour résoudre ce problème, une méthode du maximum de la vraisemblance par paires randomisée a été récemment proposée. Des résultats théoriques (consistence et normalité asymptotique des estimateurs) et numériques encourageants ont été obtenus, et une analyse de données de type RNA-seq a été réalisée dans un cadre simple. L'objectif de ce stage est d'étendre cette méthode à des cadres à plus fort enjeux en biologie, comme l'inférence de réseaux de régulation à partir de données multi-omiques mixtes. CANDIDAT Le stagiaire, issu d'un master 2 recherche en mathématique et/ou statistique, écrira le modèle statistique et la méthode d'inférence, étudiera leurs propriétés théoriques et validera l'approche proposée sur simulations et un jeux de données de type multi-omique produit à l'INRAE. Sous réserve d'obtention de financements, le stage pourra déboucher sur une thèse de doctorat. ENCADREMENT Gildas Mazo (INRAE, UR1404 MaIAGE) et Florence Jaffrézic (INRAE, UMR1313 GABI) DEROULEMENT DU STAGE Le stage se déroulera dans l'unité MaIAGE (Mathématiques et Informatique Appliquées du Génome à l’Environnement) du centre INRAE de Jouy-en-Josas (78350). La durée prévue est de 5 à 6 mois. Gratification : 550 euros/mois environ (taux légal). CANDIDATURE Envoyer une lettre de motivation, votre CV et la liste des cours suivis en M1/M2 avec toutes les notes disponibles à gildas.mazo@inrae.fr et/ou florence.jaffrezic@inrae.fr. =================================================================== TITLE Inference in copula models for non-continuous data by the randomized pairwise likelihood method with applications to "-omics" biology. TOPIC A copula is a function that takes arbitrary cumulative distribution functions as inputs and outputs a multivariate distribution function. Since the input distributions are arbitrary, the multivariate output distribution, called a copula model, can model all types of data (discrete, continuous and mixed). This advantageous property of copula models makes them good candidates to deal with "-omics" data in biology, the analysis of which allows to better understand the link between genotype and phenotype. However, -omics data are often discrete (for instance, one counts the number of RNA fragments that match a given gene to discover its expression level at a given condition), which makes statistical inference difficult due to the algorithmic complexity of the likelihood. To overcome this issue, a method based on a randomized pairwise likelihood was recently proposed. Encouraging theoretical (consistency and asymptotic normality of the estimator) and numerical results were obtained, and a RNA-seq data analysis was performed in a simple framework. The goal of this internship is to extend this method to more ambitious settings in biology, as the inference of regulation networks from mixed multi-omics data. CANDIDATE The internship student, from a "master 2" in mathematics and/or statistics, will write the statistical model and the inference method, study their theoretical properties, and validate the approach on simulations and a multi-omics dataset from INRAE. Upon funding, the internship can lead to a PhD. SUPERVISION Gildas Mazo (INRAE, UR1404 MaIAGE) and Florence Jaffrézic (INRAE, UMR1313 GABI) INTERNSHIP The internship will take place in the MaIAGE ("Mathématiques et Informatique Appliquées du Génome à l’Environnement") unit of the "Jouy-en-Josas" (78350) centre of INRAE. The expected duration is from 5 to 6 months. The internship student will get a "gratification" of about 550 EUR per month. APPLICATION Send a cover letter, a CV and the list of classes taken in Master 1 and Master 2 with all available marks to gildas.mazo@inrae.fr and/or florence.jaffrezic@inrae.fr.
En savoir plus :https://maiage.inrae.fr et http://genome.jouy.inra.fr/~gmazo/
Contact :gildas.mazo@inrae.fr
Classification de données fonctionnelles multivariées pour attester les mobilités écoresponsables
Publiée le 31/08/2021 18:43.
Référence : Stage M2 - Classification de données fonctionnelles multivariées.
Stage, Clermont-Ferrand / Aurillac.
Entreprise/Organisme :Université Clermont Auvergne - Laboratoire de Mathématiques Blaise Pascal
Niveau d'études :Master
Sujet :Depuis une dizaine d’années, plusieurs cryptomonnaies ont été développées afin de promouvoir des échanges dématérialisés de pair à pair et en se passant d’un intermédiaire tels que le sont les banques ou autres organismes financiers. Pour la plupart de ces cryptomonnaies, la création de nouvelles unités repose généralement sur l’accomplissement de tâches virtuelles, comme la résolution d’un problème numérique. Ceci induit aujourd’hui une utilisation intensive de serveurs de calculs et dont le coût environnemental est problématique. Pour pallier ce problème, de récentes cryptomonnaies se développent sur la base de protocoles de création d’unités beaucoup moins énergivores, certains allant même jusqu’à valoriser des comportements écoresponsables. Par exemple Solarcoin récompense en unités monétaires les producteurs d’électricité par panneau photovoltaïques, ou encore Regen qui encourage les agriculteurs mettant en œuvre des pratiques régénératrices des terres. Toutefois, à notre connaissance, aucune tentative n’a encore été amorcée dans le domaine des transports, pourtant majoritairement responsables de l’émission de CO2 dans l’atmosphère, et donc du dérèglement climatique. Une piste innovante est la création d’une cryptomonnaie pour valoriser l’usage des mobilités moins énergivores et polluantes comme le vélo, le covoiturage ou l’utilisation de transports en commun. Pour l’établissement d’une telle cryptomonnaie, une question primordiale est de détecter à partir de données GPS comment se déplacent les individus, avec une précision suffisante pour exclure la possibilité de fraude (individus voulant faire croire à des déplacements écoresponsables). Bien que des solutions existent déjà, les contraintes suivantes du contexte de ce projet ne rendent pas utilisables ces solutions : - Afin de respecter les recommandations du RGPD et la vie privée des citoyens, il ne doit pas être possible de déterminer la présence d’un citoyen à un endroit donné et à un instant donné. Cela implique que les données GPS des utilisateurs doivent être anonymisées. - Le système établi ne doit pas faire appel à des informations fournies par des services tiers qui pourraient constituer autant de failles de sécurité. Cela implique de ne pas pouvoir recouper les données GPS avec des cartes. - Si pour d’autres contextes les conséquences d’une fraude non-détectée (détecter à tort que la personne se déplace de manière écoresponsable) ne sont pas coûteuses, dans ce contexte la précision de détection est un élément important pour l’intérêt et la confiance du système proposé. Plus précisément, ce système économique ne serait pas viable si par des moyens détournés, un fraudeur arrive à générer une grande quantité d’unités monétaires sans avoir accompli de comportement écoresponsable. Ces différentes contraintes impliquent la nécessité de développer une méthodologie spécifique pour ce projet de recherche.
Date de début :Automne 2021 ou printemps 2022
Durée du contrat :6 mois (peut se faire sur un calendrier d'alternant)
Rémunération :Taux légal : une gratification de 536 euros net par mois.
Secteur d'activité :Statistiques
Description :Voir fichier joint.
En savoir plus :NA
sujet_stage_M2_2021-2022_stat.pdf
Contact :paul_marie.grollemund@uca.fr
Applied machine learning to design serological surveillance tools for infectious diseases
Publiée le 11/03/2021 17:17.
Référence : Thèse en IA pour la surveillance et la prévention des maladies infectieuses.
Thèse, 292, rue Saint Martin 75003 Paris.
Entreprise/Organisme :Conservatoire national des arts et métiers
Niveau d'études :Master
Sujet :Développer des outils d'IA qui permettraient d'améliorer la surveillance sérologie et mieux orienter les stratégies de prévention des maladies infectieuses.
Durée du contrat :3 ans
Secteur d'activité :Santé
Description :This PhD project aims to develop algorithms for accurate serological estimation of time since infection with applications to P. vivax malaria and SARS-CoV-2. The P. vivax data is based on measurements of multiple antibody responses using data from Thailand, Brazil and Solomon Islands which represent countries with low endemic malaria transmission. The SARS-CoV-2 data is based on longitudinal follow-up of infected patients and healthcare workers in French hospitals. Secondary objectives will involve the translation of the developed methods to allow serological surveillance of other pathogens. The following objectives are proposed for a doctorate project: 1. To explore a range of machine learning algorithms and assess their performance in different geographical locations to estimate time since P. vivax infection and identify hypnozoite carriers. 2. To apply the machine learning predictive models to analyse antibody responses to SARS-CoV-2. 3. To integrate machine learning algorithms into the serological surveillance of other infectious diseases such as corona viruses and neglected tropical diseases (NTDs). The majority of the methodological development will occur within the first two aims using epidemiologically detailed and well characterised datasets on malaria serology.
En savoir plus :mesurs.cnam.fr
PhD_offer_AI_malaria.pdf
Contact :mounia.hocine@cnam.fr

Page précédente  1  2  3  4  5  6  <7> 

 
 
©2022 SFdS
Société Française de Statistique
Institut Henri Poincaré
11 rue Pierre et Marie Curie
75231 Paris cedex 5
Tél. : +33 (0)1 44 27 66 60
Notre site a été supporté par :