TRTXT

Le programme READSEQ ("readseq") qui est une procedure assez
universelle pour transformer les fichiers de sequences en
differents types , ne marche pas correctement avec les fichiers
ayant des lignes de commentaire debutant par ";".

La procedure trtxt permet la  suppression des lignes de
commentaires dans les fichiers de sequences au format "micro"
du type :

; hssca1
CTACTACAGTGGCGGACGTACAGGACCTGTTTCACTGCAGGGGGATCCAAAACAAGCCCC
GTGGAGCAACAGCCAGAGCAACAGCAGCTGCAAGACATTGTTTCTCTCCCTCTGCCCCCC
CTTCCCCACGCAACCCCAGATCCATTTACACTTTACAGTTTTACCTCACAAAAACTACTA

Utilisation :
-----------
1) Activer l'environnement SQX (ensemble de programmes)
%  sqx  (Return)

2) executer la procedure   trtxt
%  trtxt  maseq   (Return)

les lignes debutant par ";" seront supprimees. Cela conduit a un
fichier de sequence "texte"  ou "Plain text" selon la nomeclature de
READSEQ.
READSEQ peut alors etre utilisee pour transformer ce fichier en un
quelconque autre type.

Remarque1:
---------
il est possible d'executer la procedure sur plusieurs fichiers definis
par une troncature
trtxt  messeq*

modifiera   messeq1, messeq2 ...
Si vous avez  un ensemble de sequences terminant par .dat :
trxt *.dat

Remarque2 :
----------
Utilisation de READSEQ

readSeq (1Feb93), multi-format molbio sequence reader.
usage: readseq [-options] in.seq > out.seq
 options
    -a[ll]         select All sequences
    -c[aselower]   change to lower case
    -C[ASEUPPER]   change to UPPER CASE
    -degap[=-]     remove gap symbols
    -i[tem=2,3,4]  select Item number(s) from several
    -l[ist]        List sequences only
    -o[utput=]out.seq  redirect Output
    -p[ipe]        Pipe (command line, <stdin, >stdout)
    -r[everse]     change to Reverse-complement
    -v[erbose]     Verbose progress
    -f[ormat=]#    Format number for output,  or
    -f[ormat=]Name Format name for output:
         1. IG/Stanford           10. Olsen (in-only)
         2. GenBank/GB            11. Phylip3.2
         3. NBRF                  12. Phylip
         4. EMBL                  13. Plain/Raw
         5. GCG                   14. PIR/CODATA
         6. DNAStrider            15. MSF
   -wid[th]=#            sequence line width
    -tab=#                left indent
    -col[space]=#         column space within sequence line on output
    -gap[count]           count gap chars in sequence numbers
    -nameleft, -nameright[=#]   name on left/right side [=max width]
    -nametop              name at top/bottom
    -numleft, -numright   seq index on left/right side
    -numtop, -numbot      index on top/bottom
    -match[=.]            use match base for 2..n species
    -inter[line=#]        blank line(s) between sequence blocks


Exemple :

    Transformation d une sequence texte en GCG

     readseq  -a -f5 -outfile=monfich.seq  monfich

REMARQUE : Ne pas utiliser cette procedure sur des extractions multiples
ou les lignes debutant par des ";" forment des separateurs.