1. Les logiciels ↓
    1. Jalview X ↓
    2. Clustal X ↓
    3. TreeView ↓
    4. Annhyb ↓
    5. Phylogene ↓
    6. Traitements de texte ↓
    7. Comparatif ↓
  2. Séquences à télécharger ↓
  3. Références ↓
  4. Tableau du code génétique (ouvrir dans une nouvelle fenêtre)
La comparaion de séquences et la construction d'arbre phylogénétique peut être réalisée "à la main" dans les cas simples (et c'est même ce que l'on peut conseiller pour un apprentissage). Il s'agit cependant de tâches dans lesquelles l'informatique peut apporter une aide précieuse et évite des opérations répétitives et fastidieuses. Nous avons associé ici des tâches voisines telles que l'étude de la transcription et de la traduction, celle des enzymes de restriction et l'analyse des parentés basée sur des caractères phénotypiques.

Les formats de fichiers sont généralement simples et facilement convertibles d'un standard à un autre.

1 Les logiciels

1.1 Coup de coeur : Jalview

Un logiciel libre en Java (donc multiplateforme) qui fait tout ce dont vous aviez révé. Plus de détails bientôt ici même.


1.2 Clustal X

Clustal X utilise une fenêtre unique et utilise un code de couleur (configurable) pour chaque acide aminé mettant en relief les caractéristiques conservées dans l'alignement. Outre les séquences alignées, le logiciel produit des arbres phylogénétiques affichables avec divers logiciels dont Tree View. Une documentation (actuellement minimaliste) pour utiliser Clustal X.

Il est facile de modifier les fichiers Séquaid (INRP) ou Anagène (CNDP) dans un éditeur de texte pour permettre leur lecture par Clustal X. Phylogène utilise les mêmes formats que Clustal X. Les alignements sont d'ailleurs réalisés grâce à une version (malheureusement ancienne)1 de Clustal X installé en même temps que Phylogène.

Clustal X Windows
Copie d'écran (Windows)

www.clustal.org (en anglais)
Thompson J.D. Gibson T.J. Plewniak F. Jeanmougin F. Higgins D.G.. 2003. ClustalX (www-igbmc.u-strasbg.fr/BioInfo/ClustalX/Top.html) page disparue.
téléchargement ftp://ftp.ebi.ac.uk/pub/software/clustalw2
(1) Remplacer cette version par une plus récente comme la 1.83 ne semble pas poser problème.

1.3 TreeView

TreeView réalise le travail d'affichage des arbres phylogénétiques calculés par Clustal X; Tous les formats de fichiers générés par Clustal X sont importables. L'arbre produit par défaut étant non enraciné (unrooted), l'enracinement se réalise en définissant un groupe extérieur (outgroup). Les versions Linux et MacOS X ne permettent pas l'enracinement.
Treeview Windows
Copie d'écran (Windows)

Roderic D. Glasgow University. 2002. Tree View taxonomy.zoology.gla.ac.uk/rod/treeview.html
Page R.. 1996. Treeview : An application to display phylogenetic trees on personal computers. Computer Applications in the Biosciences 12 : 357-358.

1.4 Annhyb

Annhyb est le complément idéal de Clustal X. Il affiche les alignements de séquences (fichiers .aln générés par Clustal X) sous une forme imprimable, assure la traduction des séquences d'ADN en séquences protéiques; affiche la carte de restriction (243 enzymes sont présentes dans sa banque).

Friard O.. . Annhyb bioinformatics.org/annhyb/

1.5 Convertisseur en ligne

Il est possible de traiter en ligne (ou même sans serveur pour Javascript) une séquence entrée dans un formulaire. Le programme qui suit est un exemple : convertisseur ADN → protéine.

1.6 Phylogène

Phylogène est plus qu'une base de donées sur les caractères et la phylogénie, c'est aussi un logiciel d'alignement de séquences; il peut calculer et afficher des matrices de différences et des arbres phylogénétiques. C'est un logiciel gratuit, mais non libre, édité par l'INRP.

Pour pouvoir réaliser des alignements, autorisez en écriture le dossier Molecules (situé lui même dans le dossier de base de l'application); mieux, surtout sur un réseau, modifier le fichier programmes\phylini.ini pour qu'il contienne une redirection vers un dossier local contenant les fichiers temporaires, par exemple :
alignement=c:\temp
(créez cette ligne si elle n'existe pas).


1.7 Votre traitement de texte habituel

Tout traitement de texte permet une modélisation de l'action des enzymes de restriction. Il suffit d'untiliser la fonction recherche/remplacement pour entrer la séquence d'ADN reconnue par l'enzyme de restriction. Cette activité est beaucoup plus "modélisante" que ce qu'offrent Annhyb ou Anagène sur le sujet. Je la recommande fortement.

1.8 Comparatif

Clustal X Treeview Annhyb Anagène Phylogène Traitement de texte (jEdit, BBEdit, Open Office Writer, SciTE, Word)
plateforme Linux, Mac OS X, Windows Linux, Mac Os X, Windows Windows Windows  Windows  
statut du logiciel libre libre libre commercial, version de démonstration gratuite sans enregistrement possible (basée sur v1.0), parfaitement utilisable en classe dans la mesure où l'enregistrement a peu d'intérêt gratuit (inscription nécessaire pour le téléchargement) suivant l'application choisie
traduction ADN -> protéines non non oui oui non non
alignement des séquences oui non non oui oui (basé sur Clustal) non
calcul, affichage et édition d'arbres phylogénétiques calcul et affichage affichages variés et édition non non calcul et affichage (basé sur Clustal) non
étude des enzymes de restriction non non oui oui non oui
langues anglais anglais anglais français français suivant l'application choisie
remarques   Les versions Linux et Mac OS X sont un peu plus limitées.   Une encyclopédie limitée est incorporée au logiciel et peut être enrichie (de façon malheureusement très malcomode); de même il est peu facile d'ajouter de nouvelles séquences à la banque. on peut regretter ces choix qui de plus éloignent les élèves de l'apprentissage de l'utilisation d'un système d'exploitation (B2i). La v.1.0 oblige à quelques contorsions pour régler les problèmes de droits d'écriture et n'est pas compatible réseau.

Personnellement, je l'ai abandonné...
Gère aussi la construction manuelle d'arbres phylogénétiques à partir de caractères discrets (morphologiques, etc.); dispose d'une banque de donnée illustrée sur ces caractères et aide à élaborer une matrice.
 

Anagène. CNDP. www.cndp.fr/svt/anagene/telechargement.htm (téléchargement de la version de démonstration).

2 Séquences à télécharger

Ce sont des fichiers ASCII décrivant la séquence du brin non transcrit de l'ADN pour la partie codante de l'allèle considéré. Les séquences d'ADN sont représentées par la suite des lettres A, T, C ou G. Les séquences protéiques sont représentées par une suite de lettres qui désignent les acides aminés (une lettre par acide aminé) selon le codage présenté sur la page web Amino acid Codes. L'en-tête varie d'un logiciel à l'autre : ouvrez les exemples dans un éditeur texte comme le Bloc note de Windows ou BBEdit sur Mac OS X. Les fichiers qui suivent sont au format de Clustal X :

D-Loop : Hominidés ADN mitochondrial: pour Clustal X, format .pir pour Phylogène

Groupe sanguin principal humain ADN, protéines

NAD déshydrogénase : Hominidés ADN, protéines
Phénylalanine hydroxylase (PAH) ADN, protéines
Tyrosinase humaine ADN, protéines

Famille des globines humaines ADN, protéines
Globine β : humaine (normale, drépanocytaire, microcytaire) ADN, protéines, Hominidés protéines, Primates protéines, Vertébrés protéines
Globine α : Hominidés protéines, Vertébrés protéines
Myoglobine : Vertébrés protéines

Famille des hormones anté-hypophysaires humaines ADN, protéines, Vertébrés protéines

Famille des opsines protéines

Remarque : comme les fichiers .pdb sont des fichiers textes et comportent généralement, lorsqu'ils décrivent des chaînes protéiques, la séquence des acides aminés constitutifs, il est possible d'en extraire un fichier de séquence qui, moyennant quelques traitements simples, sera exploitable dans un logiciel de comparaison de séquences.

Amino Acid Codes. www.hgu.mrc.ac.uk/Softdata/Misc/aacode.htm
Pellerin M.-J.. Conversion d'une séquence protéique d'un fichier PDB en un fichier Anagène. www.snv.jussieu.fr/vie/outils/documents/pdb_to_pro.htm

 Références

Molecular Systematics Group. Cours évolution chapitre phylogénie moléculaire www.unige.ch/sciences/biologie/biani/msg/teaching/evolution.htm
Alignement multiple (pour spécialistes). www.infobiogen.fr/docs/tutoriel/COURS/alignement.html
Phylogeny programs. evolution.genetics.washington.edu/phylip/software.html Plus de 208 logicels.