* Ces horaires sont donnés à titre indicatif.
Cette UE nécessite des prérequis en programmation informatique (langage R python et bash) qui sont enseignés dans l’UE ADB (S1) et l’UE “programmation pour la biologie” (S2).
Les différentes technologies d'acquisition de données génomiques et transcriptomiques, ainsi que leurs biais, seront présentées en lien avec des problématiques variées. L'accent sera mis sur les nouvelles technologies de séquençage (e.g. Illumina, Nanopore) et leur utilisation en génomique environnementale.
Les aspects technologiques seront mis en lien avec les spécificités biologiques dépendant de la nature des organismes étudiés (procaryotes ou eucaryotes). Seront abordées deux situations classiques d’assemblage de génome : i) un contexte de séquencage de novo (à partir de short et/ou de long reads) et ii) un contexte de reséquencage avec comparaison à un génome de référence (allant du mapping à l'analyse des polymorphismes découverts par SNP calling). Les différents types de contaminations dans les données de séquençage, leurs conséquences et leur détection seront abordées (TP). Les méthodes d’annotation structurale et fonctionnelle des génomes seront présentées et manipulées (e.g. détection de gènes, d'éléments régulateurs).
Les étudiants apprendront également à analyser des données transcriptomiques (assemblage, quantification d'exons, de jonctions, de gènes, estimation des taux d’expression). Le problème de la reconstruction de tous les transcrits alternatifs d'un gène sera étudié. L'analyse comparative des niveaux d'expression entre deux conditions expérimentales (traité / non traité, tissu1 /tissu2) sera l'occasion d'introduire les méthodes statistiques pour décider si un gène est différentiellement exprimé ou épissé.