SIGNPT Ce programme permet de rechercher le long d'une sequence proteique une sequence consensus decrite par une syntaxe simple. Cette sequence consensus est traduite en une ou plusieurs matrices en fonction de la presence d'insertions possibles. . Le programme permet de faire la recherche sur : = un motif entre au clavier . Dans cette option, la recherche peut etre faite finement en precisant un score pour chacun des sous-motifs fixes. = une liste des signatures de la bases PROSITE Dans cette option, la recherche peut se faire en limitant les recherches a des probabilites inferieures a un seuil et avec des mismatches. = une liste de motifs de domaines de transcriptions DOMAIN de TFD = une liste personnelle, qui peut etre cree par l'utilisateur dans le repertoire personnel. Ce fichier doit respecter la structure suivante (3 lignes par motifs) : ligne de titre motif consensus // exemple : Protein kinase C phosphorylation sites (ST)X(RK) // . Description des motifs consensus : ================================== L'analyseur syntaxique decompose le pattern en autant de matrices numeriques que de blocs sans intervalle variable. . Les regles suivantes doivent etre respectees : = lettres A-Z correspondant aux acides amines = ambiguite inclusive (ILVM) = ambiguite exclusive {FWY} ( aucun aromatique a cette position) = caractere positionnel indifferent X ou '-' = presence ou absence d'un quelconque caractere '.' la succession de 2 '.' ('..') est equivalent a (0-2) = insertions min-max (2-4) = option motif cadré ŕ gauche (utilisation du caractere < a gauche du motif) = option motif cadré ŕ droite (utilisation du caractere > a droite du motif) Chaque matrice est remplie de 0 ou de 1 selon la presence ou l'absence de lettres a chaque position. Le score correspond au nombre de lettres presentes, cumulees sur toutes les matrices. . Utilisation : ============= Option M -------- Type de donnee : nnelle (P) - NBRF (N) (Retour au menu = Return) p Nom du fichier personnel ? = Liste de vos Fichiers Return = Choix precedent zmrsec PREMIERE POSITION NO = RETURN = 1 FIN = -1 DERNIERE POSITION NO = RETURN = 677 Entree de motifs au clavier M Catalogue signatures PROSITE R Catalogue de domaines de Transcriptions D Liste personnelle P M zmrsec 677 1 677 Saisir le motif : K(ILVM)(ST)(KR)S EDITION DE(S) LA MATRICE(S) ? (O/N) O SIGNAL 1: A 0 0 0 0 0 C 0 0 0 0 0 D 0 0 0 0 0 E 0 0 0 0 0 F 0 0 0 0 0 G 0 0 0 0 0 H 0 0 0 0 0 I 0 1 0 0 0 K 1 0 0 1 0 L 0 1 0 0 0 M 0 1 0 0 0 N 0 0 0 0 0 P 0 0 0 0 0 Q 0 0 0 0 0 R 0 0 0 1 0 S 0 0 1 0 1 T 0 0 1 0 0 V 0 1 0 0 0 W 0 0 0 0 0 Y 0 0 0 0 0 B 0 0 0 0 0 Z 0 0 0 0 0 X 0 0 0 0 0 - 0 0 0 0 0 Recherche du motif exact ? (N/O) O SIGNAL 1: Impression : Totale (1) Condensee (2) (Return = 1) 1 ======================================================================== Consensus K(ILVM)(ST)(KR)S Probabilite motif exact = 0.9293E-05 Nombre prevu au hasard = 0.0063 1. SCORE 5 333 - 337 KMSKS 333 KMSKS ***** ======================================================================== Personnelle (P) - NBRF (N) (Retour au menu = Return) P Nom du fichier personnel ? = Liste de vos Fichiers Return = Choix precedent zfmtsec PREMIERE POSITION NO = RETURN = 1 FIN = -1 DERNIERE POSITION NO = RETURN = 314 Entree de motifs au clavier M Catalogue signatures PROSITE R Catalogue de domaines de Transcriptions D Liste personnelle P R Nom du fichier d'extraction PROSITE (ou meme format) ? (pour le balayage complet de PROSITE, saisir PROSITE) PROSITE Seuil maximum de probabilite du motif ? (RETURN = 1) 0.001 Nombre maximum de mismatchs ? (RETURN = 0) zfmtsec 314 1 314 ======================================================================== GART; PATTERN. PS00373; PDOC00319; Phosphoribosylglycinamide formyltransferase active site. Consensus GX(STM)(IVT)X(FYWVQ)(VMAT)X(DEVM)X(LIVM)DXGXX(LIT)XXXXXX(LIVM) Probabilite motif exact = 0.1169E-07 Nombre prevu au hasard = 0.0000 135 145 155 GVTIMQMDVGLDTGDMLYKLSCPI *-**-**-*-**-*--*------* ======================================================================== Nombre de motifs recherches 913 Nombre de motifs caracterises 1 Type de donnee : Personnelle (P) - NBRF (N) (Retour au menu = Return) Note : La probabilite d'occurence du motif exact est calculee sur la base d'une composition moyenne de proteines en aminoacides. Elle depend bien sur de la complexite des motifs (les sites de glycosylation, par exemple, sont tres probables). Il est possible lors de la recherche sur la base entiere de filtrer les reponses avec un seuil maximum (0.01 peut etre une bonne valeur)