PROGRAMME SIGNPX Ce programme permet de rechercher pour un ensemble de sequences proteiques une sequence consensus decrite par une syntaxe simple. Cette sequence consensus est traduite en une ou plusieurs matrices en fonction de la presence d'insertions possibles. Le programme permet par extension la recherche de plusieurs motifs definis dans un fichier personnel. Le programme permet de faire la recherche sur : un motif entre au clavier par rapport a un ensemble de sequences definies = soit par un catalogue de mnemoniques (option C) catalogue de sequences personnelles ou de NBRF (extraites par ACNUC) = soit par un fichier sequentiel (option S) dans cette hypothese le fichier sequentiel doit delimiter les sequences par une ligne commencant par '>' (sans autre ligne). un certain nombre de fichiers (format fasta) sont deja proposes : NBRF format fasta 1 SWISS-PROT format fasta 2 TREMBL format fasta 3 NRL 3D format fasta 4 DOMO format fasta 5 fichier personnel 0 Exemples : --------- = Catalogue des sequences de synthetases (catsynt) dans le meme sous-repertoire. Description des motifs consensus : ================================= L'analyseur syntaxique decompose le pattern en autant de matrices numeriques que de blocs sans intervalle variable. . Les regles suivantes doivent etre respectees : = lettres A-Z correspondant aux acides amines = ambiguite inclusive (ILVM) = ambiguite exclusive {FWY} ( aucun aromatique a cette position) = caractere positionnel indifferent X ou '-' = presence ou absence d'un quelconque caractere '.' la succession de 2 '.' ('..') est equivalent a (0-2) = insertions min-max (2-4) = option motif cadré ŕ gauche (utilisation du caractere < a gauche du motif) = option motif cadré ŕ droite (utilisation du caractere > a droite du motif) Chaque matrice est remplie de 0 ou de 1 selon la presence ou l'absence de lettres a chaque position. Le score correspond au nombre de lettres presentes, cumulees sur toutes les matrices. . Utilisation : ============= TYPE DE DONNEE Recherche a partir d'un catalogue de sequences (C) Recherche sur un fichier sequentiel de sequences (S) Entrez le motif K(ILVM)(ST)(KR)S EDITION DE(S) LA MATRICE(S) O/N O SIGNAL 1 A 0 0 0 0 0 C 0 0 0 0 0 .... K 1 0 0 1 0 L 0 1 0 0 0 M 0 1 0 0 0 N 0 0 0 0 0 P 0 0 0 0 0 Q 0 0 0 0 0 R 0 0 0 1 0 S 0 0 1 0 1 T 0 0 1 0 0 .... X 0 0 0 0 0 - 0 0 0 0 0 Recherche du motif exact ? (O/N) N SIGNAL 1 Score minimum theorique 0 Score maximum theorique 5 Score minimum pour la matrice 3 IMPRESSION CONDENSEE (2) TOTALE (1) ================================ K(ILVM)(ST)(KR)S 203 AWTRS *** 230 DISRD *** 332 KMSKS ***** .. voir le HELP du programme SIGNPT pour complement