TRTXT Le programme READSEQ ("readseq") qui est une procedure assez universelle pour transformer les fichiers de sequences en differents types , ne marche pas correctement avec les fichiers ayant des lignes de commentaire debutant par ";". La procedure trtxt permet la suppression des lignes de commentaires dans les fichiers de sequences au format "micro" du type : ; hssca1 CTACTACAGTGGCGGACGTACAGGACCTGTTTCACTGCAGGGGGATCCAAAACAAGCCCC GTGGAGCAACAGCCAGAGCAACAGCAGCTGCAAGACATTGTTTCTCTCCCTCTGCCCCCC CTTCCCCACGCAACCCCAGATCCATTTACACTTTACAGTTTTACCTCACAAAAACTACTA Utilisation : ----------- 1) Activer l'environnement SQX (ensemble de programmes) % sqx (Return) 2) executer la procedure trtxt % trtxt maseq (Return) les lignes debutant par ";" seront supprimees. Cela conduit a un fichier de sequence "texte" ou "Plain text" selon la nomeclature de READSEQ. READSEQ peut alors etre utilisee pour transformer ce fichier en un quelconque autre type. Remarque1: --------- il est possible d'executer la procedure sur plusieurs fichiers definis par une troncature trtxt messeq* modifiera messeq1, messeq2 ... Si vous avez un ensemble de sequences terminant par .dat : trxt *.dat Remarque2 : ---------- Utilisation de READSEQ readSeq (1Feb93), multi-format molbio sequence reader. usage: readseq [-options] in.seq > out.seq options -a[ll] select All sequences -c[aselower] change to lower case -C[ASEUPPER] change to UPPER CASE -degap[=-] remove gap symbols -i[tem=2,3,4] select Item number(s) from several -l[ist] List sequences only -o[utput=]out.seq redirect Output -p[ipe] Pipe (command line, stdout) -r[everse] change to Reverse-complement -v[erbose] Verbose progress -f[ormat=]# Format number for output, or -f[ormat=]Name Format name for output: 1. IG/Stanford 10. Olsen (in-only) 2. GenBank/GB 11. Phylip3.2 3. NBRF 12. Phylip 4. EMBL 13. Plain/Raw 5. GCG 14. PIR/CODATA 6. DNAStrider 15. MSF -wid[th]=# sequence line width -tab=# left indent -col[space]=# column space within sequence line on output -gap[count] count gap chars in sequence numbers -nameleft, -nameright[=#] name on left/right side [=max width] -nametop name at top/bottom -numleft, -numright seq index on left/right side -numtop, -numbot index on top/bottom -match[=.] use match base for 2..n species -inter[line=#] blank line(s) between sequence blocks Exemple : Transformation d une sequence texte en GCG readseq -a -f5 -outfile=monfich.seq monfich REMARQUE : Ne pas utiliser cette procedure sur des extractions multiples ou les lignes debutant par des ";" forment des separateurs.