Accueil
ContactLe centre Infobiogen

Banques de données Analyse et traitement Documents Formation Deambulum

Plan Recherche Glossaire English version

 
Documents en bioinformatique
 
 
Documents en informatique
 
 
Tutoriaux
 

Menu Infobiogen en mode authentifié

Commande getz de SRS

Tutoriel GCG

Tutoriel EMBOSS
 
Tables et Standards
 


Tutorial GCG
Accueil Documents - Tutorial GCG

Imprimer
Tutorial GCG

Environnement GCG
Lancement | Aide en ligne | Principales options | Environnement graphique
Formats GCG
Accès aux données
Liste des Accès | Noms Logiques
Genbank | Embl | SwissTrembl | GenPept | Autres
Descriptifs des principales commandes GCG
Environnement GCG

Le package GCG a été développé par la société accelrys.. Il est accessible sur un compte authentifié. SEQWEB est l'interface web de GCG.
Lancement
Commande gcg : commande qui active l'environnememt GCG et interface SEQLAB en mode graphique XWindow.
Commande gcg -nw : activation de l'environnement GCG sans l'interface SEQLAB. Le prompt spécifique de gcg apparait : gcg%
On peut alors, et seulement là, lancer une commande gcg.
GCG est également activable à partir du menu INFOBIOGEN par la commande menu
Au lancement de GCG, une bannière d'accueil apparait contenant la liste des banques sous GCG. bash-2.05b$ gcg -nw
                     Welcome to the WISCONSIN PACKAGE 
                           Version 10.3-UNIX
            Copyright (c) 1982 - 2001, Accelrys Inc.
       A wholly owned subsidiary of Pharmacopeia, Inc. 
                All rights reserved.

    Published research assisted by this software should cite:
   Wisconsin Package Version 10.3, Accelrys Inc., San Diego, CA
                    Databases available: 
   GenBank (no HTG,EST,GSS) Release 150 (10/05)     (gb:*) 
   GenBank Plus (All)                               (gbp:*)
   GenBank New                                      (gb_new:*)
   GenPept (All)         Release 150    (10/05)     (gp:*)
   GenPept New                                      (gp_new:*)
   EMBL Abridged 
    (no HTG,EST,GSS)     Release 84     (09/05)     (em:*)
   EMBL Plus (All)                                  (emp:*)
   EMBL New                                         (em_new:*)
   GenEmbl/Plus (ge:*/gep:* division --> gss:* htg:* est:* hum:* 
        pl:* vi:* in:* ov:* ro:* ph:* ba:* om:* pat:* sy:* un:*)
   REFSEQ GenBank        Release 14     (12/05)     (ref_gb:*)
   REFSEQ GenBank NEW                               (ref_gbnew:*)
   REFSEQ GenPept        Release 14     (12/05)     (ref_gp:*)
   REFSEQ GenPept NEW                               (ref_gpnew:*)
   UNIPROT (TREMBL+SWISSPROT) Weekly updated        (unip:*)
   UNIPROT_TREMBL        Weekly updated             (tr:*)
   UNIPROT_SWISSPROT     Weekly updated             (sw:*)
   PIR/NBRF-Protein      Release 80     (12/04)     (p:*)
   NRL-3D                Release 28     (09/00)     (nrl3d:*)
   PDB                   Daily updated              (pdb:*)
   IMGT                  Weekly updated             (imgt:*)
   Vector                Release        (07/95)     (vector:*)
   Pfam (global local)   Release 18     (09/05)     (Pfam_ls.hmm 
                                                     Pfam_fs.hmm)
   PROSITE               Monthly updated  
   Restriction Enzymes   Monthly updated
   TRANSFAC              TFSITE  4     (12/99) 
Banques sous Lookup: 
  UNIPROT, SWISSPROT, TREMBL, PIR, NRL3D, GENPEPT+New
  GENBANK (no EST,GSS)+New, EMBL (Abridged)+New
  GBEST (gbest1+gbest2+gbest3), GBGSS, EMEST, EMGSS
GRAIL PRO: voir SeqLab/Extensions ou grail -h
   Help is available with the command % genhelp 
          or http://www.gcg.com/genhelp/
     or by sending e-mail to bioinfo@infobiogen.fr
 
 Plotting Configuration set to: 
 
       Language: tekd 
         Device: TEK4107
  Port or Queue: term
 
             GCG System Support Environment Initialized.
                  Tapez gcgmenu pour le menu
************************************
 EMBOSS: Sortir de GCG, tapez emboss
************************************
gcg% 
Pour accéder aux programmes de GCG agencés en menu :
gcg%gcgmenu
Haut de page
Aide en ligne
Pour obtenir de l'aide sur GCG:
gcg%genmanual : liste thématique des programmes; documentation possible sur chacun d'eux.
gcg%genhelp : liste de l'ensemble des programmes; documentation possible sur chacun d'eux.
gcg%genhelp SEQLAB : informations sur l'interface SEQLAB.
Le guide utilisateur est maintenant présent dans l'aide en ligne sous la rubrique User's Guide.
La rubique Databases de l'aide en ligne fournit un tableau de noms logiques des banques sous GCG.
La rubique Data File de l'aide en ligne fournit des informations relatives aux banques et autres données utilisées par les programmes de GCG
Haut de page
Syntaxe - Principales options
Les programmes GCG sont appelés en tapant leur nom après le prompt "gcg%". Tous les noms de commandes sont en minuscules.

Différentes façons pour exécuter un programme GCG:

Saisie interactive : seul le nom du programme est entré sur la ligne de commande. Un questionnaire où sont passées les paramètres est alors proposé.

Programme typique en utilisation interactive:
gcg%TypicalProgram

      TYPICALPROGRAM between what sequence 1 ?  Gamma.Seq

                     Begin (* 1 *) ?
                   End (* 11375 *) ?  1000
                  Reverse (* No *) ?  Yes

      and what sequence 2 (* Gamma.Seq *) ?

                     Begin (* 1 *) ?
                   End (* 11375 *) ?  1000
                  Reverse (* No *) ?

      What should I call the output file (* Gamma.Txt *) ?

Saisie avec paramètres obligatoires : les paramètres sont saisis impérativement après le nom de la commande car l'entrée ou les valeurs par défaut n'existe pas. ex fetch x14907 ou fetch -in=x14907 (fichier en entrée x14907)
Saisie avec paramètres optionnels : ces paramètres ne sont pas demandées lors d'une entrée interactive dans la commande.
Saisie avec paramètres optionnels -CHE : cette option permet de rentrer dans un dialogue interactif en proposant la syntaxe à respecter à l'intérieur de la commande et une liste de paramètres.
Saisie avec tous les paramètres: les deux types de paramètres sont saisis sur la ligne de commande. Le programme se déroule alors sans intervention de l'utilisateur. Avec l'option -BAT, très utile pour de longs traitements, la commande est exécutée en arrière-plan (batch).
Autres options importantes : -CHEck, -DEFault, -BATch
-DEF ajoute les paramètres obligatoires avec leurs valeurs par défaut.
-BAT éxécute le programme en Batch (queue séparée non interactive).
exemple :
gcg% findpatterns sw:*_ecoli -PAT='"G(K,R)(S,T)"' -MIS=1 -out=coli.find -DEF -BAT
Haut de page
Environnement graphique
gcg%cd
gcg%fetch .gcgmydevices
Cette opération (A faire une fois pour toute) copie un fichier d'environnement graphique dans votre répertoire principal (Home Directory). Il permet d'initialiser le menu de la commande setplot.
gcg%setplot
Cette commande définit la sortie graphique souhaitée (xwindow, postscript, tektronix ..) Par défaut, GCG initialise la sortie tektronix. Exécutez ensuite votre commande graphique (dotpot, prettybox ...).
Haut de page
Accès aux données
syntaxe général :
Nom_Banque:mnémonique
Nom_Banque:numéro_d'accession (Pas d'espace)
* : caractère joker remplaçant une chaîne de caractères.
Exemple:lister (names de GCG) les séquences de GenBank commençant par hum
names gb:hum*
Liste des Accès aux banques GCG
Autres cas : fetch @liste (voir Format FOSN)
pretty pileup.msf{*} (voir Format MSF ou RSF)
Haut de page
Accès aux données supplémentaires et données locales
Des fichiers de données ou matrices sont lus automatiquement par défaut sous GCG. Ces données sont placées dans les repertoires GenRunData, GenMoreData ou GenTraindata Vous pouvez consulter la liste des fichiers de ces répertoires par la commande :
Exemple: names genrundata:*
-DAT cette option permet d'utiliser un fichier de données
Utilisation de la matrice blosum50: -DAT=genrundata:blosum50.cmp
Utilisation de sites de reconnaissance des facteurs de transcription: -DAT=genrundata:tfsite.dat
Placer le fichier de données sur le répertoire courant pour le modifier:
fetch genrundata:tfsite.dat --> modifier ce fichier sous un éditeur (EX:pico tfsite.dat)
Utilisation en donnée locale: -DAT=tfsite.dat
Haut de page
Liste des Accès aux banques GCG

  GenBank
gb:humalbaf1 --> Sequence humalbaf1 de GenBank gb:* --> GenBank sauf GSS, STS, EST gbp:* --> GenBank intégrale sauf new (Genbank Plus) gb_tags:* --> Sequences STS et Est de GenBank gb_new:* --> Cumul des séquences quotidiennes (GenBank New) gb_pr:* --> Séquences primates de Genbank gb_sts --> Séquences STS de Genbank gb_est --> Séquences Est de Genbank gb:hum* --> Origine humaine de GenBank gb:*rna* --> Séq. contenant la chaîne rna dans le mnémonique de la banque EMBL Embl
em:* --> Embl sauf GSS, STS, ESTt, séquences de Genbank emp:* --> Embl intégrale sauf séquences de GenBank em_tags:* --> Séquences STS et Est de Embl em_new:* --> Cumul des séquences quotidiennes (Embl New) em_sts:* --> Séquences STS de Embl em_est:* --> Séquences Est de Embl em_hum:* --> Origine humaine de Embl GenEmbl
ge:* --> GenBank et Embl sauf sts, Est gep:* --> GenBank et Embl intégrale tags:* --> Séquences STS et Est de GenBank et EMBL pr:* --> Séquences primates de Genbank et Embl SWISS-PROT
sw:* --> SwissProt + Cumul sw_new:* --> SwissProt Cumul hebdomadaire (SwissNew) swp:* --> SwissProt + SPTREmbl + Cumul SW + Cumul SPTR (Plus) SPTREmbl
sptr:* --> SPTREmbl + Cumul sptr_hum:* --> SPTrembl Division Humaine sptr_new:* --> SPTrembl Cumul hebdomadaire (SPTRNew) trall:* --> REMTREmbl + SPTREmbl + Cumul SPTR REMTREmbl
remtr:* --> REMTREmbl intégrale remtr_sy:* --> REMTrembl Division Synthetique GenPept
gp:* --> GenPept intégrale + Cumul gp_new:* --> Cumul des séquences quotidiennes (GenPept New REFSEQ
ref_gb:* --> RefSeq Nucléique ref_gp:* --> RefSeq Protéique
PIR-NBRF --> p:*
NRL-3D --> nrl3d:*
IMGT --> imgt:*
VECTOR --> vector:*
PDB --> pdb:*
Haut de page
Noms logiques des banques GCG

GE:GenEmbl --> Genbank + Embl

GENBANK Nom à plat Nom logique GE Commentaire
GenBankPlus (All) gbp gep sauf Genbank New
GenBank gb, genbank ge no STS,EST,GSS
GenBank New
gbupdates
gbESTupdates
gbHTGupdates
gb_new
gb_divnew
gb_estnew
gb_htgnew
nouvelle séq. div+est+htg
nouvelle séq. AutresDIVisions
nouvelle séq. EST
nouvelle séq. HTG
primate gbpri gb_pr pr séq. de primates, humaines
rodent gbrod gb_ro ro séq. de rongeurs
other mammalian gbmam gb_om om séq. de mam. non primates, non rongeurs
other vertebrate gbvrt gb_ov ov séq. de vertébrés non mammifères
invertebrate gbinv gb_in in séq. d'invertébrés
plant gbpln gb_pl pl séq. de plantes
bacterial gbbct gb_ba ba séq. bactériennes
structureal rna gbrna gb_st st séq. de RNA
virus gbvrl gb_vi vi séq. virales
bacteriophage gbphg gb_ph ph séq. de phages
synthetic gbsyn gb_sy sy séq. synthétiques
unannotated gbuna gb_un un séq. non annotées
est sequences gbest gb_est est séq. exprimées
sequence-tagged sites gbsts gb_sts sts séq. marquées
patent sequences gbpat gb_pat pat séq. patentées
genome survey sequence gbgss gb_gss gss GSS (genome survey sequence)
high throughput genomic gbhtg gb_htg htg HTGS (high throughput genomic sequencing)
high throughput cDNA gbhtc gb_htc htc HTC (high throughput cDNA sequencing)

Haut de page
EMBL Nom à plat Nom logique GE Commentaire
EmblPlus (All) emp gep sauf Embl New
Embl em, embl ge no STS,EST,GSS
embl new
ebupdates
ebESTupdates
ebHTGupdates
em_new
em_divnew
em_estnew
em_htgnew
nouvelle séq. div+est+htg
nouvelle séq. AutresDIVisions
nouvelle séq. EST
nouvelle séq. HTG
invertebrate inv em_in in séq. d'invertébrés
bacteriophage phg em_ph ph séq. de phages
fungi fun em_fun séq. fungiques
organelle org em_or - or séq. d'organelles uniquement Embl
other mammalian mam em_om om séq. de mam. non primates, non rongeurs
other vertebrate vrt em_ov ov séq. de vertébrés non mammifères
mouse mus em_mus séq. de la souris
Human hum em_hum séq. humaine
plant pln em_pl pl séq. de plantes
prokaryote pro em_ba ba séq. procaryotes (bactériennes)
rodent rod em_ro ro séq. de rongeurs
synthetic syn em_sy sy séq. synthétiques
unannotated unc em_un un séq. non annotées
virus gvrl em_vi vi séq. virales
patent sequences pat em_pat pat séq. patentées
est sequences est em_est est séq. exprimées
sequence-tagged sites sts em_sts sts séq. marquées
genome survey sequence gss em_gss gss GSS (genome survey sequence)
high throughput genomic htg em_htg htg HTGS (high throughput genomic sequencing)
high throughput cDNA htc em_htc htc HTC (high throughput cDNA sequencing)
Haut de page
Autres Banques Commentaire Nom à plat Nom logique
SWALL NR SWISSPROT+SPTREMBL trembl+trembl_new+
sprot
swall
SWISSPROT SwissProt annotated protein

SwissProt All

SwissProt New

SwissProt Plus

sprot

sprot+new_seq

new_seq

sw+sptrembl

sp,sprot,swiss-prot

sw

sw_new, Sw_New

swp

SPTREMBL sptrembl All div+sptr_new sptr, sptrembl
sptrembl Nev trembl_new sptr_new
archea arc sptr_arc
Complete Archaeal proteomes arp sptr_arp
fungi fun sptr_fun
human sptr_hum sptr_hum
invertebrate sptr_in sptr_in
other mammal sptr_om sptr_om
MHC proteins sptr_mhc sptr_mhc
organelle sptr_or sptr_or
bacteriophage sptr_ph sptr_ph
plant sptr_pl sptr_pl
prokaryote sptr_ba sptr_ba
Complete Prokaryote Proteomes sptr_prp sptr_prp
rodent sptr_ro sptr_ro
virus sptr_vi sptr_vi
other vertebrate sptr_ov sptr_ov
Retroviruses sptr_vrv sptr_vrv
unclassified sptr_un sptr_un
REMTREMBL rem
Synthetic synth remtr_sy
Patent patent remtr_pat
CDS not coding for real proteins pseudo remtr_ps
Small fragments smalls remtr_sm
Immunoglobins+T-cell receptor immuno remtr_im
Truncated truncated remtr_tr
Haut de page
GENPEPT Nom à plat Nom logique Commentaire
Genpept gp, genpept transl. genbank
Genpept New gpupdates gp_new nouvelle séq.
primate gppri gp_pr séq. de primates, humaines
rodent gprod gp_ro séq. de rongeurs
other mammalian gpmam gp_om séq. de mam. non primates, non rongeurs
other vertebrate gpvrt gp_ov séq. de vertébrés non mammifères
invertebrate gpinv gp_in séq. d'invertébrés
plant gppln gp_pl séq. de plantes
bacterial gpbct gp_ba séq. bactériennes
structureal rna gprna gp_st séq. de RNA
virus gpvrl gp_vi séq. virales
bacteriophage gpphg gp_ph séq. de phages
synthetic gpsyn gp_sy séq. synthétiques
unannotated gpuna gp_un séq. non annotées
sequence-tagged sites gpsts gp_sts séq. marquées
patent sequences gppat gp_pat séq. patentées
high throughput genomic gphtg gp_htg HTGS (high throughput genomic sequencing)
high throughput cDNA gphtc gp_htc HTC (high throughput cDNA sequencing)
Haut de page
Autres Banques Commentaire Nom à plat Nom logique
PIR protein database
Fully Classified
Verified and Classified
Unverified
Unencoded or Untranslated
pir1 pir2 pir3 pir4
pir1
pir2
pir3
pir4
nbrf, pir,P ,p
pir1 Pir1
pir2 Pir2
pir3 Pir3
pir4 Pir4
NRL3D PIR-NRL3D sequence-structure nrl3d nrl3d, nrl_3d
PDB Protein Data Bank pdbseq pdb
IMGT ImMunoGeneTics information system imgt imgt
REFSEQ NCBI Reference Sequence project
RefSeq GenBank
RefSeq GenPept


ref_gb
ref_gp

 
FTP Documents
Bioinformatique

Biologie

Informatique

Internet

 
Documents
GCG


 
Liens
Package GCG (Accelrys)

Equivalence des programmes GCG - EMBOSS

 
L'utilisation des services Infobiogen ne peut-être exploitée à des fins industrielles et / ou commerciales
© Infobiogen