PROGRAMME DE RECHERCHE PAR MOTS CLES DANS DIVERSES BANQUES TEXTUELLES ORGANISEES EN DOCUMENTS Ce programme permet de rechercher des documents (fiches) par un ou plusieurs mot-cles (5 au maximum par intersection) dans un fichier textuel sequentiel compose d'une serie de documents successifs. Du fait de la recherche par balayage textuel, ce programme n'est pas extreme- ment performant. Il permet neanmoins d'acceder assez rapidement aux ensembles de documents pertinents . Il s applique actuellement a 10 bases : 1) ENZYME Release 20 02/96 3962 entrees base de la nomenclature des enzymes maintenue par A. BAIROCH (Geneve) Consultez le fichier /env/infobiogen/db/enzyme/ENZYME/enzuser.txt 2) ESCHERICHIA COLI DATABASE Release 20 06/95 4004 entrees sur la carte physique et les sequences de E. coli (maintenue par KROGER) Consultez le fichier /env/infobiogen/db/ecd/ECD/ecd.doc 3) EUCARYOTIC DATA BASE Release 47 06/96 1270 entrees Base de donnes sur l'expression ches les eucaryotes Consultez le fichier /env/infobiogen/db/epd/EPD/epd.doc 4) PROSITE Release 13.0 11/95 1168 entrees Base de motifs proteiques maintenue par A. BAIROCH Consultez les fichiers /env/infobiogen/db/prosite/PROSITE/prosite.dat, prosite.doc, .txt 5) SEQANALREF Release 67 02/96 3265 entrees Base de biblio sur l analyse des sequences (deja en ligne en 10-8) Consultez les fichiers /env/infobiogen/db/seqanalref/SEQANALREF/seqanalref.dat ... 6) TFDSITE Release 6 12/92 2019 entrees Base des facteurs de transcription Seul le fichier sites.dat a ete mis en ligne (remanie pour etre au format analogue a PROSITE , c'est a dire 4 lignes : =) SITE_ID (1:6) FAC_NAME (7:21), SEQ_NAME(22:36), SYSTEM (107:117), GENOME (118:118) =) ligne de reference TRN_UNIT (119:138) =) sequence consensus et // Ce fichier se trouve dans /env/infobiogen/pack/sqx/parm/TFDSITES (Gosh et al., NAR (1990) 18, 1749-1756) Consultez les fichiers dans le repertoire /infobiogen/db/transfac/TRANSFAC 7) LIMB Release 3.0 6/92 125 entrees Base des bases de donnees en biologie Consultez les fichiers /env/infobiogen/db/limb/LIMB/limb.doc, limb.txt, ... 8) USB Annuaire bioinformatique regroupant noms, adresses, telephones, Fax, adresse electronique, des usagers bioinformaticiens,.... 9) TECHNO Listes de bases de donnees biologiques 10)DIRSOFT Ensemble des fichier de logiciels disponibles sur le serveur de EMBL (mail a "netserv@embl-heidelberg.de" . L'impression des documents peut se limiter a certains champs (definis par leurs premieres lettres , ex. ID DE...). Il suffit d'indiquer ces differents champs (1 par ligne) et de finir la liste par 2 Return. L'impression peut etre faite dans un fichier. Donnez le nom du fichier de sortie. Par defaut (Return) l'impression est a l'ecran. Exemple d'utilisation : ---------------------- Numero Base (H pour LISTE -Rtn pour Retour au MENU) H 1 ENZYME Base sur la nomenclature des enzymes 2 ECD Base sur Escherichia coli 3 EPD Base sur les promoteurs eucaryotes 4 PROSITE Base sur les motifs proteiques 5 SEQANALREF Base de biblio sur l analyse des sequences 6 TFDSITE Base de facteurs de transcriptions et sites 7 LIMB Base des bases de donnees en biologie 8 USB Annuaire bioinformatique 9 TECHNO Catalogue bases donnees, serveurs 10 DIRSOFT Logiciels EMBL Numero Base (H pour LISTE -Rtn pour Retour au MENU) 1 Mots cles (1 par ligne, validez par une ligne vide) catalase /env/infobiogen/db/enzyme/ENZYME/enzyme.dat ID 1.11.1.6 DE CATALASE. CA 2 H(2)O(2) = O(2) + 2 H(2)O. CF HEME. DR P14412, CATA$BACST; P00432, CATA$BOVIN; P07820, CATA$CANTR; DR P13029, CATA$ECOLI; P04040, CATA$HUMAN; P07145, CATA$IPOBA; DR P12365, CATA$MAIZE; P11934, CATA$PENVI; P04762, CATA$RAT ; DR P15202, CATA$YEAST; P06115, CATT$YEAST; // 3073 DATE : 29/11/90 19H41 DUREE: 31.02S TPS CPU: 10.49S NB I/O: 46 COUT: 4.46 F 2) Numero Base (H pour LISTE -Rtn pour Retour au MENU) 2 Mots cles (1 par ligne, validez par une ligne vide) RRNd /env/infobiogen/db/ecd/ECD/ecd.dat ML 72.07 GS rrnD CC operon J01692 in Gb BP 478 RL Cell 17:225(1979) AC J01700 EM ECRGNX1 GB ECORGNDS1 TT 5820 // ML 72.08 GS rrnD CC J01692 in Gb BP 182 RL Proc. Natl. Acad. Sci. USA 75:3593(1978) AC V00332 EM ECRNA4 GB ECORGNDS1 // 3) Exemple sur EPD : Numero Base (H pour LISTE -Rtn pour Retour au MENU) 3 Mots cles (1 par ligne, validez par une ligne vide) interferon /env/infobiogen/db/epd/EPD/epd.dat FP Hs b'-interferon :-S PRI:HSIFD4 1+ 284; 07112.122 XX DO Experimental evidence: 3 DO Expression/Regulation: fibroblasts;+viral infection RF PNAS78:5305 // FP Mm b'-interferon :+S ROD:MMIFNBG 1+ 1195; 23039.122 XX DO Experimental evidence: 3 DO Expression/Regulation: fibroblasts;+viral infection RF JMB204:221 // FP Hs g'-interferon :+S PRI:HSIFNG 1+ 347; 07113. XX DO Experimental evidence: 6 DO Expression/Regulation: lymphocytes;+mitogen RF NAR10:3605 // 805 DATE : 29/11/90 19H44 DUREE: 12.80S TPS CPU: 4.83S NB I/O: 26 COUT: 2.06 F 5) Numero Base (H pour LISTE -Rtn pour Retour au MENU) 5 Mots cles (1 par ligne, validez par une ligne vide) alignment /env/infobiogen/db/limb/LIMB/limb.doc ID ALTS8903 RA Altschul S.F.; RT "Gap costs for multiple sequence alignment."; RL J. Theor. Biol. 138:297-309(1989). KW MULTIPLE ALIGNMENT. // ID ALTS8902 RA Altschul S.F., Carroll R.J., Lipman D.J.; RT "Weights for data related by a tree."; RL J. Mol. Biol. 207:647-653(1989). KW PHYLOGENY; MULTIPLE ALIGNMENT. // 6) Numero Base (H pour LISTE -Rtn pour Retour au MENU) 6 Mots cles (1 par ligne, validez par une ligne vide) GAL4 t ID GAL4 UASg IYEAST C TFD 1 Ma & Ptashne (87) Cell 48: 847 CGGAAGACTCTCCTCCG // ID GAL4? GAL4-depGAL IYEAST TFD 689 Bram, R.J. et al. (1986) EMBO J. 5, 603-608 ACTTATAT // ID GAL4 GAL4-GAL1-1.3 IYEAST TFD 690 Giniger, E. et al. (1985) Cell 40, 767-774 CGGATTAGAAGCCGCCG // 7) Numero Base (H pour LISTE -Rtn pour Retour au MENU) 7 Mots cles (1 par ligne, validez par une ligne vide) GENOM entry DRHPL number 10007 history cb 01/10/87 response received from D.Maglott fm 04/07/87 initial entry gk 02/06/90 updated from questionnaire status response res.nam Dr. Donna Maglott res.add A.T.C.C. 12301 Parklawn Dr. Rockville, MD 20852 U.S.A. res.tel (301) 231-5586 res.net dmaglott@helix.nih.gov gen.nam Dr. Donna Maglott gen.add A.T.C.C. 12301 Parklawn Dr. Rockville, MD 20852 U.S.A. ...... 8) Numero Base (H pour LISTE -Rtn pour Retour au MENU) 8 Mots cles (1 par ligne, validez par une ligne vide) NO BA (Rtn) (Rtn) /home2/pub/usb/usb.dat NO BALLERET Jean Christophe AD LIRMM AD 860 route de Saint-Priest VI 34100 MONTPELLIER TE EE Ecole Genome-Informatique // NO BARBET Jean-Claude AD Institut des Sciences Vegetales AD Av.de la Terrasse AD Batiment 24 AD CNRS VI 91198 GIF/YVETTE TE 69823886 CB BARBET DT 5-DEC-1990 // .....ex 9) TECHNO 10)DIRSOFT