******************************************************************************* MENU FASTA DESCRIPTION Choix 1: Utilisation guidee dans FASTA-TFASTA/FASTX-TFASTX/FASTY-TFASTY FASTF-TFASTF. Il permet de selectionner le programme , la sequence, la banque de reference et les parametres, et d'avoir une option de calcul en batch avec resultat sur fichier. Choix 2: Menu guide FFASTA a partir d'un fichier sequentiel au format FASTA Choix 3: Menu guide MFASTA a partir d'un fichier catalogue (sequences personnelles) Choix 4: Comparaison sequence proteique ou nucleique / banque de meme nature FASTA. Choix 5: Comparaison d'une sequence proteique / 6 phases des sequences d'une banque nucleique TFASTA. (Chaque phase est traitee separement) Choix 6: Comparaison d'une sequence nucleique traduite en 6 phases / banque proteique frameshift entre les codons FASTX. Choix 7: Comparaison d'une sequence nucleique traduite en 6 phases / banque proteique frameshift a l'interieur des codons FASTY. Choix 8: Comparaison d'une sequence proteique / 6 phases des sequences d'une banque nucleique frameshift entre les codons (Les 3 phases de chaque sens sont traitees en une seule sequence avec visualisation des sauts de phase)TFASTX. Choix 9: Comparaison d'une sequence proteique / 6 phases des sequences d'une banque nucleique frameshift a l'interieur des codons (Les 3 phases de chaque sens sont traitees en une seule sequence avec visualisation des sauts de phase) TFASTY. Choix 10: Comparaison d'un melande de peptides / banque proteique FASTF Choix 11: Comparaison d'un melande de peptides / 6 phases des sequences d'une banque nucleique TFASTF. BANQUES DE DONNEES Les banques actuellement structurees sous FASTA (et BLAST) a des fins de recherches de similitudes sont : Banques proteiques : NRprot Union de SP All, SPTR All, Genpept All, pir, nrl3d, pdb NRprotup Union des updates de SP, SPTR , Genpept OWL Ensemble non redondant PIR - SwissProt - NRL3D - PDB NBRF-PIR Banque de sequences de proteines Swiss-Prot Rel Banque de seq. prot. derivee de EMBL (Release) Swiss-Prot New Mise a jour hebdomadaire de SwissProt (New) SPTREMBL Embl release Proteine SPTREMBL New Embl New release Proteine SPGL Swiss-Prot + SPTREMBL GENPEPT Genbank release Proteine GENPEPT New Genbank New Proteine NRL3d sequences de la Protein Data Bank PDB Protein Data Bank (Daily updated) SBASE Banque de Motifs proteiques (S. Pongor) ProDom Domaines proteiques derives de SwissProt (D. Kahn) DOMO Domaines non redondants derives de SwissProt + PIR GCRDb Banque sur les recepteurs couples aux proteines G Banques nucleiques : GenEmbl Union entre Release GenBank et EMBL sauf Est GenEmbl New Cumul des Mises a jour entre GenBank et EMBL GenEmbl Est Union des Est entre Release GenBank et EMBL GenBank All Banque de sequences nucleiques Release + Cumulee GenBank New Mise a jour cumulee: release => quotidien GenBank Updates quotidien GenBank Primate GenBank Rodent GenBank other Mammalian GenBank other verteBrate GenBank Invertebrate GenBank Plant sequence GenBank bacTerial GenBank structural RNA GenBank Viral GenBank phaGe GenBank sYnthetic GenBank Unannotated GenBank sequence-tagged sites GenBank patent GenBank genome survey sequence GenBank HTGS - high throughput genomic sequencing GenBank expr. tag sequence (est) EMBL Banque de sequences nucleiques et Mise a jour cumulee EMBL New Mise a jour cumulee: release => quotidien EMBL Updates Mise a jour quotidienne de l'EMBL STS Whitehead Institute et Genethon dbSTS Sequnece Tagged Sites - detailed information dbEST EST :Expressed sequences, actualisee chaque semaine REPBASE Repeat Collections + Sequences Nucleiques Alu dbEST EST :Expressed sequences, actualisee chaque semaine EPD Eucaryotic Promoteurs Vector Collection de vecteurs UNIGENE Cluster d'EST Humain MMUNIGENE Cluster d'EST souris RNUNIGENE Cluster d'EST rat Banques personnelles : Les banques personnelles doivent etre obligatoirement au format sequentiel FASTA. A la question "Nom de fichier de la base personnelle", repondre par le nom du fichier. exemple: "Nom de fichier de la base personnelle:" banque_pro SEQUENCES EN ENTREE - Fichier de sequence personnelle: fichier contenant une seule sequence au format FASTA ou GCG exemple: fichier.fasta >MASEQ GLSDGEWQQVLNVWGKVEADIAGHGQEVLIRLFTGHPETLEKFDKFKHLKTEAEMKASED LKKHGTVVLTALGGILKKKGHHEAELKP - Fichier sequentiel FASTA pour la banque personnelle: fichier contenant plusieurs sequences FASTA exemple: multi.fasta >MASEQ1 GLSDGEWQQVLNVWGKVEADIAGHGQEVLIRLFTGHPETLEKFDKFKHLKTEAEMKASED LKKHGTVVLTALGGILKKKGHHEAELKP >MASEQ2 VLSPADKTNVKAAWGKVGAHAGEYGAEALERMFLSFPTTKTYFPHFDLSHGSAQVKGHGK KVADALTNAVAHVDDMPNALSALSDLHAHKLRVDPVNFK COMMANDE DIRECTE Banques proteiques T: NR Union SWISSPROT, SPTREMBL+REM, GENPEPT, PIR, NRL3D A: NR Union des updates de SWISSPROT, SPTREMBL+REM R: SP Release U: SP Update E: SPTREMBL ALL (SPtrembl release Prot + Updates) F: SPGLOBAL (Swiss-Prot All + SPTREMBL ALL) J: SPTREMBL NEW (hebdomadaire) H: GENPEPT All (Genbank release Prot + Updates) I: GENPEPT Update (Genbank Update Prot) O: OWL (non redondant) P: NBRF N: NRL3D (derivee de la PDB) B: SBASE (domaines proteiques) D: PRODOM (domaines derives de SwissProt) M: DOMO (domaines non redondants derives de SwissProt + PIR) G: GCRDb (Proteines G coupled recepteurs) C: PDB (Protein Data Bank) Banques nucleiques F: GE GenEmbl(GenBank+EMBL-Est) H: GE GenEmbl updates (cumul GenBank+EMBL) J: GE GenEmbl Est (Est de GenBank+EMBL) A: GB All (release+updates) W: GB updates (cumul) Q: GB today P: GB Primate R: GB Rodent M: GB other Mammalian B: GB other verteBrate I: GB Invertebrate L: GB pLant sequence T: GB bacTerial K: GB structural RNA V: GB Viral G: GB phaGe Y: GB sYnthetic U: GB Unannotated S: GB sts C: GB patent O: GB genome survey sequence Z: GB expr.seq. tag. 0: GB high throughput genomic sequencing 1: EB All (release+updates) 2: EB update (cumul) 3: EB today 4: EB est 5: STS (Whitehead Institute + Genethon) 6: dbSTS Seq. Tagged Sites (detailed info) 7: dbEST Expressed sequences 8: REPBASE (Repeat Collections + Alu) E: EPD Promotors D: Vecteurs X: vecteurs inComplet N: UNIGENE (Cluster) 9: YEAST Complete Genome Syntaxe: fasta nom_seq "%libelle" > fichier_resultat & nom_seq : nom de la sequence au format text ou fasta libelle : lettre (ou chiffre designant la banque) voir liste ci-dessus > et & : resultat redirige sur un fichier execution en arriere plan EXEMPLES fasta nom_seq "%U" >resultat& Recherche dans (U) SP Update fasta nom_seq "%PW" >resultat& Recherche dans (P) GB Primate +(W) GB updates FFASTA : Utilisation guidee des 4 programmes FASTA permettant une recherche automatique de plusieurs sequences (25 max) presentes dans un fichier sequentiel au format FASTA sequentiel en entree. MFASTA : Utilisation guidee des 4 programmes FASTA permettant une recherche automatique de plusieurs sequences definies par un fichier catalogue contenant les noms de fichiers de sequences personnelles (25 max) en entree. FASTX et TFASTX: L'alignement est plus rapide car il permet des sauts de phase seulement entre les codons. FASTY et TFASTY: L'alignement est plus lent mais plus sensible car il permet des sauts de phase a l'interieur des codons. FASTF et TFASTF: La sequence en entree pour ces deux programmes est un fichier contenant plusieurs sequences peptidiques dont la syntaxe est: >entete Sequence1, Sequence2, ..., SequenceN REMARQUES Les programmes FASTA et TFASTA sont aussi implantes sous GCG. Ils travaillent alors avec des sequences sous le format GCG. VOIR AUSSI man fasta man fastf *******************************************************************************