SIGNALX Ce programme recherche le long d'une sequence des regions presentant certaines caracteristiques (tata box, promoteurs d'E.C, etc...), d'apres une matrice de valeurs proposee par le programme ou saisie par l utilisateur. On peut traiter simultanement de une a cinq matrices de valeurs, ces dernieres etant reliees par des distances minimales et maximales lors de la recherche. Chaque matrice est traitee de facon separee. Le programme affiche les scores minimum et maximum theoriques et observes ainsi que la moyenne et l'ecart- type. Il faut fournir un score minimum au dessus duquel les scores observes seront pris en compte (valeur par defaut = moyenne + 2 fois l'ecart-type) a l'edition. Ce programme (une extension de signal) permet la recherche de signaux sur un ENSEMBLE de sequences definies par un catalogue de sequences personnelles ou present dans un fichier sous forme sequentielle (format FASTA). Un acces a des fichiers predefinis des banques est possible. Sequences definies par un catalogue (C) Sequences definies par une fichier sequentiel (format fasta) (S) s GenBank (Bacterial) format fasta 1 GenBank (Primates) format fasta 2 GenBank (New) format fasta 3 dbEST format fasta 4 autre 0 . Ex : Recherche de TATA BOX Matrice 1 3 4 5 T 10 0 10 0 C 0 0 0 0 A 0 10 0 10 G 0 0 0 0 Soit la sequence suivante AGCTATC Calcul sur le quatrieme nucleotide. T en premiere position 10 A en seconde position 10 T en troisieme position 10 C en quatrieme position 0 Score total = 40 . Les 5 premieres matrices proposees proviennent de la reference " Computer methods to locate signals in nucleic acid sequences" R. Staden, (1984) Nucl.Acids Res. 1, 505-519. Les matrices 6 a 11 ont ete entrees separement (voir references). Mes matrices 12 a 20 sont tirees du livre de Griskov et al " Sequence Analysis Primer" UWBC (1991) Le programme a une option graphique TEKTRONIX , qui trace les profils de recherche des matrices (nombre automatique) entre un seuil minimum variable (donne en ecart-standard par rapport a la moyenne) et la valeur max. EXECUTION. . Q. CHOIX DE LA PORTION DE SEQUENCE ETUDIEE (Cf. generalites) La portion de sequence etudiee doit etre inferieure a 10000 nucleotides . Q. CHOIX DU SIGNAL ETUDIE. 3 prime ends of introns (acceptors) (1) Matrice (-15,+3) (AG en -2,-1) 5 prime ends of introns (donors) (2) Matrice (-4,+8) (GT en 1,2) Prokaryotic ribosome binding site (3) Matrice W101 (-60,-1, 0,+40) ATG en 0-2. Ref: G.Stormo, L.Gold et A. Ehrenfeucht Nuc.Acids.Res. (1982) 10, 2997-3011 Eukaryotic ribosome binding site (4) Matrice (-7,+3) Ref : D.R. Sargan et al. (1982) Febs.Lett. 147, 133-166 Escherichia coli promoters (5) 3 Matrices : (- 35 region, -10 region et (+1 region) -35 region (-50,-26) consensus TATAAT -10 region (-23,-5) consensus TTGACA +1 region (-2,+10) calcul d'un score pondere en affectant le score de la 1ere matrice selon la distance entre les 2 premiers signaux : 1 (17), 0.2 (16, 18), 0.05 (19), 0.02 (15,20,21) Ref : D.K. Hawley, R. Mc Clure (1983) Nucl.Acids Res. 11, 2237-2255 Escherichia coli promoters (6) 2 Matrices : (- 35 region, -10 region) -35 region consensus TATAAT -10 region consensus TTGACA calcul d'un score pondere en faisant un rapport de la somme des 2 scores des matrices + score d'espacement des matrices (14 (17), 6 (16,18), 1 (15, 19,20,21) et le score maximum (score entre 0 et 1). Ref : M.E. Mulligan, D.K Hawley (1984) Nucl.Acids Res. 12, 1 789 Escherichia coli promoteurs (7) 2 Matrices : (- 35 region, -10 region) -35 region consensus TATAAT -10 region consensus TTGACA Calcul d'un score pondere comme le rapport des produits des frequences des bases a une position (sur les 2 matrices de 6 bases) et des frequences maximum des bases, le tout multiplie par un coefficient dependant de la distance des 2 matrices : 1 (17), 0.5 (16,18), 0.2 (15,19) Ref : R. Harr,M. Haggstrom, P. Gustafsson (1983) Nucl.Acids Res. 11, 9 2943 Escherichia coli promoteurs (8) 1 matrice de 58 de longueur optimisee pour la recherche de promoteurs ayant un espace de 16 bases entre les 2 signaux Ref : O.Neill M, (1989) J.Mol.Biol., 207, 301-310. Escherichia coli promoteurs (9) 1 matrice de 58 de longueur optimisee pour la recherche de promoteurs ayant un espace de 17 bases entre les 2 signaux Ref : O.Neill M, (1989) J.Mol.Biol., 207, 301-310. Escherichia coli promoteurs (10) 1 matrice de 58 de longueur optimisee pour la recherche de promoteurs ayant un espace de 18 bases entre les 2 signaux Ref : O.Neill M, (1989) J.Mol.Biol., 207, 301-310. Pour les 3 dernieres matrices de O'Neil , un certain nombre de tests sont faits pour attribuer le signal a un reel promoteur (voir publication) Escherichia coli terminateurs (11) 1 matrice de 50 de longueur (calculee sur les 16 occurences des dinucleotides (TCAG*TCAG) permet al detection des terminateurs caracterises par un hairpin et une suite de TTTT / Ref : Brendel et al. (1984) Nucl.Ac. Res , 12, 4411-27 attention : la matrice est entree sous forme de 200 de longueurs les 4 segments de 50 correspondent aux frequences des 4 types de dinucleotides. ((impression inexacte, et adaptation du programme). Site TATA Eucaryote (12) Site CAP Eucaryote (13) Site CCAAT Eucaryote (14) Site GC Eucaryote (15) Terminateur de transcription Eucaryote (16) Site de polyadenylation Eucaryote (17) Les 6 matrices precedentes sont tirees de : Bucher P., (1990) JMol. Biol. 212 563-578. Extremite 5' des introns (18) Extremite 3' des introns (19) Site de branchement (20) Les 3 dernieres matrices sont tirees de : Senapathy et al (1990) Methods in Enzymology , 183, 252-278. Matrice personnelle (29) FIN = Return . Choisir le signal a etudier. Dans le cas d'une matrice personnelle, il faut saisir soit le nom du fichier de sauvegarde si elle preexiste, soit la nouvelle matrice de valeur. Le programme demande alors si vous desirez une autre matrice. Dans l'affirmative, vous devez indiquer la distance minimale et maximale qui la separe de la precedente. . Q. EDITION DE(S) LA MATRICE(S) Y/N Repondre Y si vous desirez que la ou les matrices soit editees. . Q. VALEUR MINIMALE POUR L EDITION Return = 842 Saisir la valeur minimale pour laquelle les portions de sequence correspondantes seront prises en compte. La question sera posee autant de fois qu'il y aura de matrices dans le signal etudie. . Les portions de sequence repondant aux criteres fixes sont alors editees de la facon suivante. Ex : Promoteurs d E.C Trois matrices -35 region -10 region +1 region distance minimale et maximale entre -35 r et -10 r 1 a 6 nucl. -10 r et +1 r 4 a 8 nucl. . Score 827 445- 469 GCCGAGCCGCCGGTTTGTCGTATAA Score 326 489- 500 CTATGAAAAGAG . Score 809 706- 730 CGCGTGAAAGACGATTTGCAAGAAC Score 659 733- 751 GCAGTGGTCGAATCCTTCC Score 328 754- 765 ACGAAGATCGAA . etc ... Le programme offre une option de recherche sur les sequence directe seule (0) ou sur la sequence directe et complementaire. Attention : la numerotation dans la cas de l'option complementaire est celle de la sequence directe (valeur sup => valeur inf. Les sequences sont affichees de 5' en 3' sur le brin complementaire. Ce qui permet sur deux graphes, par exemple, de conserver la numerotation du brin direct. ----------------------------------------------------------------------------- LISTE DES MATRICES ------------------ EXT.3 PRIME DES INTRONS (ACCEPTEURS) ( 1) EXT.5 PRIME DES INTRONS (DONNEURS) ( 2) SITE FIXATION DE RIBOSOME PROCARYOTE [-60,+40] ( 3) SITE FIXATION DE RIBOSOME EUCARYOTE ( 4) E C PROMOTEURS (STADEN) ( 5) E C PROMOTEURS (MULLIGAN) ( 6) E C PROMOTEURS (STADEN) ( 7) E.C.PROMOTEURS ESPACE 16 (O NEILL) ( 8) E.C.PROMOTEURS ESPACE 17 (O NEILL) ( 9) E.C.PROMOTEURS ESPACE 18 (O NEILL) (10) E.C.TERMINATEURS (BRENDEL) [-42 -1,+1 +8] (11) SITE TATA EUCARYOTE (BUCHER) (12) SITE CAP EUCARYOTE (BUCHER) (13) SITE CCAAT EUCARYOTE (BUCHER) (14) SITE GC EUCARYOTE (BUCHER) (15) TERMINATEUR TRANSCRIPTION EUCARYOTE (BUCHER) (16) SITE DE POLYADENYLATION EUCARYOTE (BUCHER) (17) EXT.5 PRIME DES INTRONS (SENAPATHY) (18) EXT.3 PRIME DES INTRONS (SENAPATHY) (19) SITE DE BRANCHEMENT (SENAPATHY) (20) MATRICE PERSONNELLE (29) 1- EXT.3 PRIME DES INTRONS (ACCEPTEURS) T T T T T T T T T T T T C A G G T C T 58 50 57 67 75 62 62 57 57 73 75 38 40 0 0 11 48 37 C 21 28 35 27 30 38 42 35 46 46 36 28 84 0 0 23 28 42 A 17 11 11 19 8 19 14 24 15 4 13 33 5 130 0 29 22 25 G 17 24 11 13 13 7 9 11 9 6 6 31 1 0 130 67 32 26 2- EXT.5 PRIME DES INTRONS (DONNEURS) A C A G G T A A G T A C T 28 10 18 17 0 139 9 16 7 87 30 36 C 42 60 16 8 0 0 3 13 3 17 28 40 A 42 56 89 12 0 0 86 94 12 23 53 33 G 27 13 16 102 139 0 41 16 117 12 25 27 3- SITE FIXATION DE RIBOSOME PROCARYOTE [-60,+40] A T A T G C T A T C A A T A G C A T T 5 1 -3 9 -14 7 15 -5 3 -16 -17 4 18 5 -3 -1 2 4 C -21 -6 -11 -21 0 8 -7 -12 -1 1 0 -19 12 -3 -1 10 2 -8 A 7 -2 13 -2 -8 -13 -18 5 0 -5 13 8 -15 9 -4 -7 9 0 G -6 -9 -7 0 8 -16 -4 -2 -16 1 -4 8 -14 5 11 -13 -24 3 G G C T C G T G T T A T T C C T T A T 5 -5 7 8 -5 -15 6 3 4 16 -4 7 11 -4 -1 12 8 10 C -5 -11 8 1 23 6 -5 2 -14 -3 -8 -10 -21 2 0 -2 -1 -11 A -8 -11 -10 -6 -7 -5 -6 -12 -1 -27 -3 -6 0 -12 -3 -4 -7 14 G 7 22 -11 -9 -15 10 -4 4 -5 -6 -3 -1 -4 -1 -4 -15 0 -14 G G T T A C T G C T A G G G G G G A T -1 1 8 2 -10 -16 11 1 -3 16 -3 -36 -8 -27 -53 -27 -26 -23 C -3 -1 5 -11 -4 7 0 -14 6 -8 -20 -7 -36 -44 -15 -50 -43 -35 A -2 -4 -6 0 12 5 -9 0 -11 -11 10 8 2 8 0 -3 -5 4 G 3 10 -19 -3 -10 -7 -7 7 1 -8 -6 15 21 42 35 22 16 -6 T T A A A C A T G A C A A T A T T T T 2 -7 -14 -40 -28 0 -53 75 -62 -20 -40 -10 -35 -5 -12 -1 4 14 C -38 -29 -29 1 -9 1 -87 -55 -64 -45 11 -22 -14 -20 -15 -15 -10 -22 A -20 -11 5 6 -2 -15 66 -69 -52 -5 -4 6 8 -24 -7 -10 -7 13 G -5 -15 -25 -33 -28 -53 -36 -50 107 -5 -37 -44 -27 -15 -23 -16 -29 -47 A T C A T C A C C C A T A T C C C A T -23 7 -2 -26 1 4 -7 3 -4 0 -10 8 -18 7 -22 -21 8 4 C -5 2 6 6 -8 19 -7 9 -3 17 -2 3 -9 5 22 22 8 -1 A 14 -9 -18 14 -12 -42 1 -5 -4 -32 12 -10 20 -6 -1 3 -4 4 G -17 -29 -15 -23 -7 -1 -6 -17 -4 0 -15 -14 -4 -17 -10 -5 -13 -8 G C T C A A G C T C C T -3 -6 7 -8 1 -5 -16 -16 7 -6 0 C 1 18 6 11 -10 -8 7 10 0 7 14 A -10 -1 -2 -14 11 14 -3 2 -13 5 5 G 10 -13 -13 9 -4 -3 10 2 4 -8 -21 4 SITE FIXATION DE RIBOSOME EUCARYOTE A G C C A C C A T G T 19 24 31 12 0 18 5 0 102 0 C 20 15 32 65 5 42 52 0 0 0 A 50 27 27 19 86 36 34 102 0 0 G 6 29 12 6 11 6 11 0 0 102 5- E C PROMOTEURS (STADEN) T A T A A A A A T A A T T C T T G A T 41 33 32 25 34 22 35 35 42 27 32 42 47 14 92 94 11 19 C 22 27 18 29 20 14 20 12 22 23 16 25 10 43 7 6 11 18 A 28 38 30 37 35 56 42 42 37 42 39 18 25 26 2 6 2 72 G 16 11 29 19 21 18 13 21 9 19 24 26 29 29 11 6 88 3 C A T A T T T T 15 37 46 34 38 48 34 C 60 8 25 23 23 17 20 A 26 50 26 34 25 26 31 G 11 17 15 21 26 21 27 T A A A A T T T G G T A T A A T A T T 35 28 28 27 39 51 34 43 26 31 89 3 49 15 19 108 31 29 C 34 21 24 27 12 25 20 25 20 27 10 2 16 14 22 3 13 16 A 20 39 33 33 39 23 29 16 23 19 2 106 29 66 57 1 35 23 G 23 24 27 25 22 13 29 28 43 35 11 1 18 17 14 0 33 24 A T 21 C 30 A 31 G 30 C C A T T G A T T A A T T 16 22 2 42 27 23 20 25 27 15 16 29 C 29 49 4 25 25 13 18 22 17 17 16 17 A 20 9 45 16 24 25 28 24 24 32 35 26 G 21 8 37 5 12 27 22 17 20 24 21 16 6- E C PROMOTEURS (MULLIGAN) G G G T G G T T A T T C G A G T T 4 7 7 8 5 6 8 9 3 17 18 2 4 5 7 9 C 3 2 4 2 4 5 5 5 5 2 1 17 1 2 3 3 A 3 4 2 4 4 3 5 2 8 1 1 2 3 11 2 5 G 11 8 8 7 8 7 3 5 5 0 1 0 14 5 9 5 T T T C C T G T G G T G A A T 10 6 8 5 6 17 1 9 3 4 20 6 5 4 C 2 5 5 8 7 2 0 3 3 3 0 6 5 6 A 5 4 5 5 5 2 0 3 3 4 1 2 7 6 G 4 5 3 4 4 0 20 5 12 11 0 7 4 6 7 E C PROMOTEURS (STADEN) T T G A C A T 85 87 13 17 9 31 C 6 2 6 20 67 6 A 6 11 0 61 17 52 G 4 0 81 2 7 11 T A T A A T T 89 9 50 17 7 100 C 4 0 19 4 20 0 A 0 89 24 65 65 0 G 7 2 7 15 7 0 8- E.C.PROMOTEURS ESPACE 16 (O NEILL) T T T C A A A T T A A C G C T T G A T 39 33 33 17 28 17 22 50 56 28 17 17 22 6 89 83 11 28 C 22 22 11 50 0 6 22 6 0 11 11 56 6 50 0 6 0 17 A 22 28 22 17 61 67 44 33 27 44 72 6 28 33 0 6 0 56 G 17 17 33 17 11 11 11 11 17 17 0 22 44 11 11 6 89 0 C A C A G T G G C A G G A A T C C G T 6 33 17 22 6 33 17 33 17 28 33 11 22 28 61 17 11 11 C 61 6 39 28 22 22 22 6 33 22 11 11 0 28 6 44 50 33 A 17 44 17 28 28 22 28 22 17 28 6 33 67 33 11 17 22 17 G 17 17 28 22 44 22 33 39 33 22 50 44 11 11 22 22 17 39 T A T A A T G C G C C C C C C T G G T 89 0 67 22 6 94 6 6 6 6 22 22 0 11 22 50 33 11 C 6 0 6 6 6 6 11 72 11 72 56 44 72 50 33 33 28 22 A 0 100 22 67 78 0 17 6 28 17 17 17 17 22 28 11 0 11 G 6 0 6 6 11 0 67 17 56 6 6 17 11 17 17 6 39 56 A C A C T 17 6 22 11 C 22 50 17 39 A 39 22 39 22 G 22 22 22 22 9- E.C.PROMOTEURS ESPACE 17 (O NEILL) T C T A A A A T A A T T T G T T G A T 38 29 29 29 24 24 24 48 33 29 38 43 48 5 86 81 10 10 C 19 38 19 14 29 14 10 5 29 10 14 24 10 38 0 10 14 38 A 33 24 24 33 29 52 57 38 33 52 29 19 19 10 0 5 0 48 G 10 10 29 24 19 10 10 10 5 10 19 14 24 48 14 5 76 5 C A T A T C T A C C C A A T T T T T T 10 24 43 19 38 29 43 29 24 19 29 24 24 33 43 38 29 33 C 57 0 10 19 19 29 14 14 33 33 29 19 24 14 29 14 24 24 A 29 52 38 38 10 19 24 38 19 19 19 38 29 29 24 19 19 29 G 5 24 10 24 33 24 19 19 24 29 24 19 24 24 5 29 29 14 G T A T A A T A C C A C C C C A A C T 24 71 5 38 0 14 95 29 19 14 10 10 5 24 19 24 33 19 C 24 14 5 14 14 24 0 14 33 38 24 43 48 43 43 29 10 33 A 24 0 90 29 67 43 5 33 29 14 38 24 10 24 19 38 43 29 G 29 14 0 19 19 19 0 24 19 33 29 24 38 10 19 10 14 19 C T T C T 24 33 38 33 C 33 19 14 33 A 14 14 19 24 G 29 33 29 10 10- E.C.PROMOTEURS ESPACE 18 (O NEILL) C A A G A A A A A A T T T C T T G A T 31 15 8 31 8 8 23 15 31 15 46 46 46 23 62 85 23 31 C 31 23 31 15 31 15 23 23 23 23 8 8 15 46 15 8 8 15 A 15 46 38 8 38 69 46 38 38 54 23 31 31 15 8 8 0 54 G 23 15 23 46 23 8 8 23 8 8 23 15 8 15 15 0 69 0 C C T T T T T T G T T A A T T T A T T 31 31 46 38 54 54 38 46 23 54 46 15 23 38 38 62 15 54 C 54 31 31 15 38 15 15 8 23 23 23 8 23 23 15 15 15 15 A 15 23 23 31 8 15 31 23 23 15 15 54 54 23 31 15 38 15 G 0 15 0 15 0 15 15 23 31 8 15 23 0 15 15 8 31 15 G T T A T G A T T T T A G C A A T T T 23 38 77 0 46 8 31 92 46 46 54 23 23 15 8 31 62 46 C 23 23 15 0 23 23 23 8 8 23 15 23 15 46 31 31 8 31 A 8 0 8 100 8 31 31 0 38 8 8 46 23 15 46 38 23 15 G 46 38 0 0 23 38 15 0 8 23 23 8 38 23 15 0 8 8 C A T T T 8 23 69 46 C 38 15 8 23 A 23 46 0 23 G 31 15 23 8 11 E.C.TERMINATEURS (BRENDEL) [-42 -1,+1 +8] A A A A A A A A A A A A A A A A A A T 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 C 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 A 0 0 0 0 0 0 0 0 0 0 40 0 0 0 0 0 0 0 G 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 C A A A A A A T T C A A A A A A A T T 0 0 0 0 0 0 0 100 100 0 0 0 0 0 0 0 0 100 C 100 0 0 0 0 0 0 0 0 100 0 0 0 0 0 0 0 0 A 0 0 0 0 0 0 0 0 0 0 0 40 0 0 0 0 0 0 G 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 T T T T T T A T C A G A A A A A A A T 100 100 100 100 100 100 0 100 0 0 0 0 0 0 0 0 0 0 C 0 0 0 0 0 0 0 0 100 0 0 0 0 0 0 0 0 0 A 0 0 0 0 0 0 100 0 0 0 0 0 63 0 0 0 0 0 G 0 0 0 0 0 0 88 0 0 0 100 0 0 0 0 0 0 0 A A A A A A A A C C C A A C C A A C T 0 0 0 0 0 0 0 0 0 0 0 0 0 71 0 0 0 0 C 0 0 0 0 0 0 0 0 100 100 100 0 0 100 100 0 0 100 A 0 0 100 0 0 100 0 0 0 0 0 0 0 0 0 100 0 0 G 0 0 0 0 0 0 0 0 0 0 100 0 0 0 0 100 0 0 T A A A A A C G G A A A T A A A A A T 100 0 0 0 0 0 0 0 0 0 0 0 83 0 0 0 0 0 C 0 0 0 0 0 0 100 0 0 0 0 0 0 0 0 0 0 0 A 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 G 0 0 0 0 0 0 0 100 54 0 0 0 0 0 0 0 0 0 A A A A A T A A A A A A T A A T A A T 0 0 0 0 0 100 0 0 0 0 0 0 100 0 0 100 0 0 C 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 A 0 0 0 0 0 0 0 0 0 0 0 0 0 0 100 0 0 100 G 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 71 A A A G A A T A A A C A A A A A T A T 0 0 0 0 0 0 100 0 0 0 0 0 0 0 0 0 100 0 C 0 0 40 57 0 0 0 0 0 0 80 0 0 0 0 0 0 0 A 0 100 100 0 0 100 0 0 0 0 0 0 0 0 0 100 0 0 G 0 0 0 100 0 0 0 0 0 0 0 0 0 0 0 0 0 0 A A A A A G A A A A A A A A A T A T T 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 50 0 56 C 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 A 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 G 0 0 0 0 0 25 0 0 0 0 0 0 0 0 0 0 0 0 A A A A A A A A A A T A A A A A A A T 0 0 0 0 0 0 0 0 0 0 71 0 0 0 0 0 0 0 C 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 A 0 0 0 0 100 100 0 0 0 0 0 0 0 0 0 0 0 0 G 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 A A A G C A A A C A A A A A A A A C T 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 C 0 0 0 0 100 0 0 0 100 0 0 0 0 0 0 0 0 50 A 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 G 0 0 0 100 0 0 0 0 0 0 0 0 0 0 0 0 0 0 G G G G T A A A A A A A A A A A A C T 0 0 0 0 100 0 0 0 0 0 0 0 0 0 0 0 0 0 C 0 0 77 83 0 0 0 0 0 0 0 0 0 0 0 0 0 100 A 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 83 G 100 100 100 100 0 0 0 0 0 0 0 0 0 0 0 0 0 0 A A T 0 0 C 0 0 A 0 0 G 0 0 12 SITE TATA EUCARYOTE (BUCHER) G T A T A A A A G G C G G G G T 31 309 35 374 30 121 6 121 33 48 31 52 61 75 71 C 145 46 0 10 0 0 3 2 44 135 147 127 118 107 101 A 61 16 352 3 354 268 360 222 155 56 83 82 82 68 77 G 152 18 2 2 5 0 20 44 157 150 128 128 128 139 140 13- SITE CAP EUCARYOTE (BUCHER) T C A G T C T T T 137 0 15 80 131 72 100 101 C 48 303 0 81 95 118 85 96 A 49 0 288 26 77 67 45 50 G 69 0 0 116 0 46 73 56 14- SITE CCAAT EUCARYOTE (BUCHER) A C T A G C C A A T C A T 52 48 79 2 19 1 1 0 7 143 3 1 C 55 52 47 1 6 173 174 0 8 0 90 6 A 56 32 25 102 51 0 0 175 119 17 23 116 G 12 43 24 70 99 1 0 0 21 15 59 52 15 SITE GC EUCARYOTE (BUCHER) A G G G G G C G G G G C T G T 82 34 64 0 0 0 50 3 48 24 42 73 116 101 C 40 31 6 1 0 0 137 1 3 0 17 166 86 24 A 102 97 50 67 0 2 54 46 1 79 23 0 20 40 G 50 112 154 206 274 272 0 224 222 171 192 35 52 109 16 TERMINATEUR TRANSCRIPTION EUCARYOTE (BUCHER) T G T G T T T T T 36 6 62 2 55 43 39 33 C 12 1 0 0 2 20 15 15 A 9 6 2 2 3 0 8 9 G 13 57 6 66 10 7 8 13 17- SITE DE POLYADENYLATION EUCARYOTE (BUCHER) T T C A A T A A A A A C T 41 33 27 0 2 94 0 0 0 13 24 25 C 19 25 28 0 0 0 0 0 0 21 22 35 A 24 19 24 94 90 0 94 94 94 34 26 22 G 10 17 15 0 2 0 0 0 0 26 22 12 18 EXT.5 PRIME DES INTRONS (SENAPATHY) C A G G T A A G T T 13 15 7 0 100 3 9 6 50 C 37 13 5 0 0 3 9 6 16 A 32 60 9 0 0 59 71 7 16 G 18 12 79 100 0 35 11 82 18 19 EXT.3 PRIME DES INTRONS (SENAPATHY) T T T T T T T T T T C C A G G T 46 44 50 52 48 45 42 43 47 51 23 21 0 0 10 C 29 13 30 30 32 3 37 38 39 36 26 75 0 0 14 A 11 11 10 8 11 10 11 11 7 8 25 3 100 0 27 G 14 12 10 10 9 11 10 9 7 6 26 1 0 100 49 20 SITE DE BRANCHEMENT (SENAPATHY) C T G A C T 21 91 4 0 38 C 76 8 15 1 45 A 1 0 39 99 11 G 2 0 42 0 6