Tutorial GCG |
 |

|
|
 |
 |
|
Environnement GCG

 |
Le package GCG
a été développé par la société accelrys.. Il est accessible sur un compte authentifié. SEQWEB
est l'interface web de GCG. |
 |
|
|
 |
 |
 |
 |
Commande gcg : commande qui active l'environnememt GCG et interface SEQLAB en mode graphique XWindow.
|
 |
 |
 |
 |
Commande gcg -nw : activation de l'environnement GCG sans l'interface SEQLAB.
Le prompt spécifique de gcg apparait : gcg%
On peut alors, et seulement là, lancer une commande gcg.
|
 |
 |
 |
 |
GCG est également activable à partir du menu INFOBIOGEN par la commande menu |
 |
 |
 |
 |
Au lancement de GCG, une bannière d'accueil apparait contenant la liste des banques sous GCG.
bash-2.05b$ gcg -nw
Welcome to the WISCONSIN PACKAGE
Version 10.3-UNIX
Copyright (c) 1982 - 2001, Accelrys Inc.
A wholly owned subsidiary of Pharmacopeia, Inc.
All rights reserved.
Published research assisted by this software should cite:
Wisconsin Package Version 10.3, Accelrys Inc., San Diego, CA
Databases available:
GenBank (no HTG,EST,GSS) Release 150 (10/05) (gb:*)
GenBank Plus (All) (gbp:*)
GenBank New (gb_new:*)
GenPept (All) Release 150 (10/05) (gp:*)
GenPept New (gp_new:*)
EMBL Abridged
(no HTG,EST,GSS) Release 84 (09/05) (em:*)
EMBL Plus (All) (emp:*)
EMBL New (em_new:*)
GenEmbl/Plus (ge:*/gep:* division --> gss:* htg:* est:* hum:*
pl:* vi:* in:* ov:* ro:* ph:* ba:* om:* pat:* sy:* un:*)
REFSEQ GenBank Release 14 (12/05) (ref_gb:*)
REFSEQ GenBank NEW (ref_gbnew:*)
REFSEQ GenPept Release 14 (12/05) (ref_gp:*)
REFSEQ GenPept NEW (ref_gpnew:*)
UNIPROT (TREMBL+SWISSPROT) Weekly updated (unip:*)
UNIPROT_TREMBL Weekly updated (tr:*)
UNIPROT_SWISSPROT Weekly updated (sw:*)
PIR/NBRF-Protein Release 80 (12/04) (p:*)
NRL-3D Release 28 (09/00) (nrl3d:*)
PDB Daily updated (pdb:*)
IMGT Weekly updated (imgt:*)
Vector Release (07/95) (vector:*)
Pfam (global local) Release 18 (09/05) (Pfam_ls.hmm
Pfam_fs.hmm)
PROSITE Monthly updated
Restriction Enzymes Monthly updated
TRANSFAC TFSITE 4 (12/99)
Banques sous Lookup:
UNIPROT, SWISSPROT, TREMBL, PIR, NRL3D, GENPEPT+New
GENBANK (no EST,GSS)+New, EMBL (Abridged)+New
GBEST (gbest1+gbest2+gbest3), GBGSS, EMEST, EMGSS
GRAIL PRO: voir SeqLab/Extensions ou grail -h
Help is available with the command % genhelp
or http://www.gcg.com/genhelp/
or by sending e-mail to bioinfo@infobiogen.fr
Plotting Configuration set to:
Language: tekd
Device: TEK4107
Port or Queue: term
GCG System Support Environment Initialized.
Tapez gcgmenu pour le menu
************************************
EMBOSS: Sortir de GCG, tapez emboss
************************************
gcg%
|
 |
 |
 |
 |
Pour accéder aux programmes de GCG agencés en menu :
gcg%gcgmenu |
 |
|
 |
 |
 |
 |
|
|
 |
Pour obtenir de l'aide sur GCG: |
 |
 |
 |
gcg%genmanual : liste thématique des programmes; documentation possible sur chacun d'eux.
|
 |
 |
 |
 |
gcg%genhelp : liste de l'ensemble des programmes; documentation possible sur chacun d'eux.
|
 |
 |
 |
 |
gcg%genhelp SEQLAB : informations sur l'interface SEQLAB.
|
 |
 |
 |
 |
Le guide utilisateur est maintenant présent dans l'aide en ligne sous la rubrique User's Guide.
|
 |
 |
 |
 |
La rubique Databases de l'aide en ligne fournit un tableau de noms logiques des banques sous GCG.
|
 |
 |
 |
 |
La rubique Data File de l'aide en ligne fournit des informations relatives aux banques et autres données utilisées par les programmes de GCG
|
 |
|
 |
 |
 |
 |
|
 |
 |
 |
Syntaxe - Principales options |
|
 |
Les programmes GCG sont appelés en tapant leur nom après
le prompt "gcg%". Tous les noms de commandes sont en minuscules.
Différentes façons pour exécuter un programme GCG:
|
|
 |
 |
 |
 |
|
|
 |
 |
 |
 |
 |
 |
 |
gcg%cd |
 |
 |
 |
 |
gcg%fetch .gcgmydevices
Cette opération (A faire une fois pour toute) copie un fichier d'environnement graphique dans votre répertoire principal
(Home Directory). Il permet d'initialiser le menu de la commande setplot.
|
 |
 |
 |
 |
gcg%setplot
Cette commande définit la sortie graphique souhaitée (xwindow, postscript, tektronix ..) Par défaut, GCG initialise la sortie tektronix. Exécutez ensuite votre commande graphique (dotpot, prettybox ...).
|
 |
|
 |
 |
 |
 |
|
|
 |
 |
 |
 |
 |
 |
 |
 |
syntaxe général :
Nom_Banque:mnémonique
Nom_Banque:numéro_d'accession (Pas d'espace)
* : caractère joker remplaçant une chaîne de caractères.
|
 |
 |
 |
 |
Exemple:lister (names de GCG) les séquences de GenBank commençant par hum
names gb:hum*
|
 |
 |
 |
 |
Liste des Accès aux banques GCG
|
 |
 |
 |
 |
 |
Autres cas :
fetch @liste (voir Format FOSN)
pretty pileup.msf{*} (voir Format MSF ou RSF)
|
 |
|
 |
 |
 |
 |
 |
 |
 |
Accès aux données supplémentaires et données locales |
|
 |
 |
 |
 |
 |
 |
 |
Des fichiers de données ou matrices sont lus automatiquement par défaut sous GCG.
Ces données sont placées dans les repertoires GenRunData, GenMoreData ou GenTraindata Vous pouvez consulter la liste des fichiers de ces répertoires par la commande :
|
 |
 |
 |
 |
Exemple: names genrundata:*
|
 |
 |
 |
 |
-DAT cette option permet d'utiliser un fichier de données
Utilisation de la matrice blosum50: -DAT=genrundata:blosum50.cmp
Utilisation de sites de reconnaissance des facteurs de transcription: -DAT=genrundata:tfsite.dat
|
 |
 |
 |
 |
Placer le fichier de données sur le répertoire courant pour le modifier:
fetch genrundata:tfsite.dat --> modifier ce fichier sous un éditeur (EX:pico tfsite.dat)
Utilisation en donnée locale: -DAT=tfsite.dat
|
 |
|
 |
 |
 |
 |
|
 |
 |
 |
Liste des Accès aux banques GCG |
|
 |
GenBank gb:humalbaf1 --> Sequence humalbaf1 de GenBank
gb:* --> GenBank sauf GSS, STS, EST
gbp:* --> GenBank intégrale sauf new (Genbank Plus)
gb_tags:* --> Sequences STS et Est de GenBank
gb_new:* --> Cumul des séquences quotidiennes (GenBank New)
gb_pr:* --> Séquences primates de Genbank
gb_sts --> Séquences STS de Genbank
gb_est --> Séquences Est de Genbank
gb:hum* --> Origine humaine de GenBank
gb:*rna* --> Séq. contenant la chaîne rna dans le mnémonique
de la banque EMBL
Embl em:* --> Embl sauf GSS, STS, ESTt, séquences de Genbank
emp:* --> Embl intégrale sauf séquences de GenBank
em_tags:* --> Séquences STS et Est de Embl
em_new:* --> Cumul des séquences quotidiennes (Embl New)
em_sts:* --> Séquences STS de Embl
em_est:* --> Séquences Est de Embl
em_hum:* --> Origine humaine de Embl
GenEmbl ge:* --> GenBank et Embl sauf sts, Est
gep:* --> GenBank et Embl intégrale
tags:* --> Séquences STS et Est de GenBank et EMBL
pr:* --> Séquences primates de Genbank et Embl
SWISS-PROT sw:* --> SwissProt + Cumul
sw_new:* --> SwissProt Cumul hebdomadaire (SwissNew)
swp:* --> SwissProt + SPTREmbl + Cumul SW + Cumul SPTR (Plus)
SPTREmbl sptr:* --> SPTREmbl + Cumul
sptr_hum:* --> SPTrembl Division Humaine
sptr_new:* --> SPTrembl Cumul hebdomadaire (SPTRNew)
trall:* --> REMTREmbl + SPTREmbl + Cumul SPTR
REMTREmbl remtr:* --> REMTREmbl intégrale
remtr_sy:* --> REMTrembl Division Synthetique
GenPept gp:* --> GenPept intégrale + Cumul
gp_new:* --> Cumul des séquences quotidiennes (GenPept New
REFSEQ ref_gb:* --> RefSeq Nucléique
ref_gp:* --> RefSeq Protéique
PIR-NBRF --> p:*
NRL-3D --> nrl3d:*
IMGT --> imgt:*
VECTOR --> vector:*
PDB --> pdb:*
|
 |
 |
 |
 |
|
|
Noms logiques des banques GCG

 |
|
|
GE:GenEmbl --> Genbank + Embl
GENBANK |
Nom à plat |
Nom logique |
GE |
Commentaire |
GenBankPlus (All) |
|
gbp |
gep |
sauf Genbank New |
GenBank |
|
gb, genbank |
ge |
no STS,EST,GSS |
GenBank New |
gbupdates gbESTupdates gbHTGupdates |
gb_new gb_divnew gb_estnew gb_htgnew |
|
nouvelle séq. div+est+htg nouvelle séq. AutresDIVisions nouvelle séq. EST nouvelle séq. HTG |
primate |
gbpri |
gb_pr |
pr |
séq. de primates, humaines |
rodent |
gbrod |
gb_ro |
ro |
séq. de rongeurs |
other mammalian |
gbmam |
gb_om |
om |
séq. de mam. non primates, non rongeurs |
other vertebrate |
gbvrt |
gb_ov |
ov |
séq. de vertébrés non mammifères |
invertebrate |
gbinv |
gb_in |
in |
séq. d'invertébrés |
plant |
gbpln |
gb_pl |
pl |
séq. de plantes |
bacterial |
gbbct |
gb_ba |
ba |
séq. bactériennes |
structureal rna |
gbrna |
gb_st |
st |
séq. de RNA |
virus |
gbvrl |
gb_vi |
vi |
séq. virales |
bacteriophage |
gbphg |
gb_ph |
ph |
séq. de phages |
synthetic |
gbsyn |
gb_sy |
sy |
séq. synthétiques |
unannotated |
gbuna |
gb_un |
un |
séq. non annotées |
est sequences |
gbest |
gb_est |
est |
séq. exprimées |
sequence-tagged sites |
gbsts |
gb_sts |
sts |
séq. marquées |
patent sequences |
gbpat |
gb_pat |
pat |
séq. patentées |
genome survey sequence |
gbgss |
gb_gss |
gss |
GSS (genome survey sequence) |
high throughput genomic |
gbhtg |
gb_htg |
htg |
HTGS (high throughput genomic sequencing) |
high throughput cDNA |
gbhtc |
gb_htc |
htc |
HTC (high throughput cDNA sequencing) |
|
 |
 |
 |
 |
|
|
EMBL |
Nom à plat |
Nom logique |
GE |
Commentaire |
EmblPlus (All) |
|
emp |
gep |
sauf Embl New |
Embl |
|
em, embl |
ge |
no STS,EST,GSS |
embl new |
ebupdates ebESTupdates ebHTGupdates |
em_new em_divnew em_estnew em_htgnew |
|
nouvelle séq. div+est+htg nouvelle séq. AutresDIVisions nouvelle séq. EST nouvelle séq. HTG |
invertebrate |
inv |
em_in |
in |
séq. d'invertébrés |
bacteriophage |
phg |
em_ph |
ph |
séq. de phages |
fungi |
fun |
em_fun |
|
séq. fungiques |
organelle |
org |
em_or - or |
|
séq. d'organelles uniquement Embl |
other mammalian |
mam |
em_om |
om |
séq. de mam. non primates, non rongeurs |
other vertebrate |
vrt |
em_ov |
ov |
séq. de vertébrés non mammifères |
mouse |
mus |
em_mus |
|
séq. de la souris |
Human |
hum |
em_hum |
|
séq. humaine |
plant |
pln |
em_pl |
pl |
séq. de plantes |
prokaryote |
pro |
em_ba |
ba |
séq. procaryotes (bactériennes) |
rodent |
rod |
em_ro |
ro |
séq. de rongeurs |
synthetic |
syn |
em_sy |
sy |
séq. synthétiques |
unannotated |
unc |
em_un |
un |
séq. non annotées |
virus |
gvrl |
em_vi |
vi |
séq. virales |
patent sequences |
pat |
em_pat |
pat |
séq. patentées |
est sequences |
est |
em_est |
est |
séq. exprimées |
sequence-tagged sites |
sts |
em_sts |
sts |
séq. marquées |
genome survey sequence |
gss |
em_gss |
gss |
GSS (genome survey sequence) |
high throughput genomic |
htg |
em_htg |
htg |
HTGS (high throughput genomic sequencing) |
high throughput cDNA |
htc |
em_htc |
htc |
HTC (high throughput cDNA sequencing) |
|
 |
 |
 |
 |
|
|
Autres Banques |
Commentaire |
Nom à plat |
Nom logique |
SWALL |
NR SWISSPROT+SPTREMBL |
trembl+trembl_new+ sprot |
swall |
SWISSPROT |
SwissProt annotated protein SwissProt All SwissProt New SwissProt Plus |
sprot sprot+new_seq new_seq sw+sptrembl |
sp,sprot,swiss-prot sw sw_new, Sw_New swp |
SPTREMBL |
sptrembl All |
div+sptr_new |
sptr, sptrembl |
|
sptrembl Nev |
trembl_new |
sptr_new |
|
archea |
arc |
sptr_arc |
|
Complete Archaeal proteomes |
arp |
sptr_arp |
|
fungi |
fun |
sptr_fun |
|
human |
sptr_hum |
sptr_hum |
|
invertebrate |
sptr_in |
sptr_in |
|
other mammal |
sptr_om |
sptr_om |
|
MHC proteins |
sptr_mhc |
sptr_mhc |
|
organelle |
sptr_or |
sptr_or |
|
bacteriophage |
sptr_ph |
sptr_ph |
|
plant |
sptr_pl |
sptr_pl |
|
prokaryote |
sptr_ba |
sptr_ba |
|
Complete Prokaryote Proteomes |
sptr_prp |
sptr_prp |
|
rodent |
sptr_ro |
sptr_ro |
|
virus |
sptr_vi |
sptr_vi |
|
other vertebrate |
sptr_ov |
sptr_ov |
|
Retroviruses |
sptr_vrv |
sptr_vrv |
|
unclassified |
sptr_un |
sptr_un |
REMTREMBL |
|
|
rem |
|
Synthetic |
synth |
remtr_sy |
|
Patent |
patent |
remtr_pat |
|
CDS not coding for real proteins |
pseudo |
remtr_ps |
|
Small fragments |
smalls |
remtr_sm |
|
Immunoglobins+T-cell receptor |
immuno |
remtr_im |
|
Truncated |
truncated |
remtr_tr |
|
 |
 |
 |
 |
|
|
GENPEPT |
Nom à plat |
Nom logique |
Commentaire |
Genpept |
|
gp, genpept |
transl. genbank |
Genpept New |
gpupdates |
gp_new |
nouvelle séq. |
primate |
gppri |
gp_pr |
séq. de primates, humaines |
rodent |
gprod |
gp_ro |
séq. de rongeurs |
other mammalian |
gpmam |
gp_om |
séq. de mam. non primates, non rongeurs |
other vertebrate |
gpvrt |
gp_ov |
séq. de vertébrés non mammifères |
invertebrate |
gpinv |
gp_in |
séq. d'invertébrés |
plant |
gppln |
gp_pl |
séq. de plantes |
bacterial |
gpbct |
gp_ba |
séq. bactériennes |
structureal rna |
gprna |
gp_st |
séq. de RNA |
virus |
gpvrl |
gp_vi |
séq. virales |
bacteriophage |
gpphg |
gp_ph |
séq. de phages |
synthetic |
gpsyn |
gp_sy |
séq. synthétiques |
unannotated |
gpuna |
gp_un |
séq. non annotées |
sequence-tagged sites |
gpsts |
gp_sts |
séq. marquées |
patent sequences |
gppat |
gp_pat |
séq. patentées |
high throughput genomic |
gphtg |
gp_htg |
HTGS (high throughput genomic sequencing) |
high throughput cDNA |
gphtc |
gp_htc |
HTC (high throughput cDNA sequencing) |
|
 |
 |
 |
 |
|
|
Autres Banques |
Commentaire |
Nom à plat |
Nom logique |
PIR |
protein database Fully Classified Verified and Classified Unverified Unencoded or Untranslated |
pir1 pir2 pir3 pir4 pir1 pir2 pir3 pir4 |
nbrf, pir,P ,p pir1 Pir1 pir2 Pir2 pir3 Pir3 pir4 Pir4 |
NRL3D |
PIR-NRL3D sequence-structure |
nrl3d |
nrl3d, nrl_3d |
PDB |
Protein Data Bank |
pdbseq |
pdb |
IMGT |
ImMunoGeneTics information system |
imgt |
imgt |
REFSEQ |
NCBI Reference Sequence project RefSeq GenBank RefSeq GenPept |
|
ref_gb ref_gp |
|
 |