Historia Bioinformatyki...




Dziedzina ta narodziła się na początku lat osiemdziesiątych, wraz z utworzeniem w USA bazy danych nazywanej GenBankiem. Amerykański Departament Energii opracował ten program, aby zbierać i przechowywać informacje o sekwencjach krótkich odcinków DNA, które naukowcy zaczęli właśnie sekwencjonować, badając różne organizmy. Na początku istnienia GenBank rzesze techników wpisywały sekwencje DNA używając klawiatur składających się z czterech klawiszy A, C, T oraz G. Z czasem opracowano protokoły przekazywania danych. Badacze mogli zadzwonić do GenBank i bezpośrednio wprowadzić do komputera dane o sekwencji kolejnych odcinków genomu. Administrację GenBank przeniesiono do Państwowego Centrum Informacji Biotechnologicznej (NCBI - National Center for Biotechnology Information) w National Institutes of Health. Po uruchomieniu serwisu WWW w Internecie naukowcy z całego świata uzyskali bezpłatny dostęp do danych zgromadzonych w GenBank. Internet fundamentalnie zmienił sposób przekazywania danych między ośrodkami naukowymi [24;80]. Kiedy w 1990 roku ruszył oficjalnie Projekt Poznania Ludzkiego Genomu, liczba informacji o zapisie genetycznym napływających do GenBanku zaczęła rosnąć w postępie wykładniczym (rys.1). Po wprowadzeniu w latach dziewięćdziesiątych metod wysoko wydajnego sekwencjonowania z wykorzystaniem robotyki, automatycznych sekwencjonerów i komputerów proces ten nabrał zawrotnego tempa. Do dnia, w którym oddano do druku lipcowy numer "Scientific American", GenBank zdążył zgromadzić dane o kolejności zapisu ponad 7 mld jednostek DNA [25].

Mniej więcej w tym samym czasie, gdy rozpoczęto realizację Projektu Poznania Ludzkiego Genomu, podobnymi badaniami zajęły się firmy prywatne i stworzyły własne obszerne bazy danych. Obecnie korporacje takie jak Incyte Genomics z Palo Alto w Kalifornii są w stanie odczytać w ciągu jednego dnia zapis genetyczny liczący około 20 mln par zasad DNA. Natomiast przedstawiciele firmy Celera Genomics oznajmili, że uzyskali wstępną wersję pełnej sekwencji genomu ludzkiego i zgromadzili na ten temat 50 TB (tetra bajtów) danych. Taka ilość informacji zajęłaby 80 tys. płyt kompaktowych [25]. Inne uzupełniające i wysokowydajne technologie, takie jak np. mikromacierze DNA (ang. microarray), są również źródłem tysięcy danych na minutę. Ponadto na Ziemi występuje ponad milion gatunków owadów, i liczba ich ciągle wzrasta. Wiele z nich jest ekonomicznie istotna. Znaczenie wielu danych biologicznych wzrasta ze względu na wysoką efektywność sprzętu laboratoryjnego i technologii analizy [24;80]. GenBank i wyżej wymienione firmy są jednak zaledwie częścią bioinformacji. Istnieją inne publiczne i prywatne bazy danych zawierające informacje o ekspresji genów (czyli o tym, kiedy i gdzie geny są włączane), tzw. polimorfizmie sekwencji nukleotydowych (czyli drobnych różnicach genetycznych między poszczególnymi osobnikami), budowie różnych białek, oraz schematach ich wzajemnych oddziaływań.



Przekazywanie informacji o zsekwencjonowanych genomach

1843 Richard Owen opisał różnicę między homologią i analogią
1858 Darwin & Wallace opublikowali referaty o teorii ewolucji
1859 Charles Darwin opublikował "The Origin of Species"
1864 Ernst Häckel - zarys współczesnych elementów zoologicznej klasyfikacji
1865 Gregory Mendel ustanowił prawa dziedziczności w pracy "Badania nad mieszańcami roślin...".
1868 Friedrich Miescher - odkrycie kwasu nukleinowego
1902 Chromosomowa teoria dziedziczności zaproponowana przez pracujących niezależnie Suttona i Boveri'ego
1930 Badania nad naturą kwasu nukleinowego
1936 Alan Turing - wynalezienie uniwersalnej maszyny obliczeniowej tzw. Turing maschine
1941 Beadle & Tatum - "Genetyczna kontrola reakcji biochemicznych" -
pierwszy naukowy dowód na hipotezę jeden-gen-jeden-enzym
1948 Chude Shannon - jeden z twórców teorii informacji
1951 Pauling & Corey proponują strukturę alfa-spirali i beta-kartki
1953 Watson & Crick model podwójnej helisy DNA
1953 Sanger F., Thompson E., Tuppy H. oznaczenie aminokwasowej sekwencji łańcuchów A i B insuliny
1970 Opublikowano szczegóły dotyczące algorytmu Needleman-Wunsch służącego do wyrównywania sekwencji
1971 Tomlinson - wynalezienie programu e-mail
1972 Paul Berg i współpracownicy stworzyli pierwszą zrekombinowaną cząsteczkę DNA
1975 Southern E. M.publikuje eksperymentalne dane dotyczące techniki Southern Blot dla specyficznych sekwencji DNA
1977 Maxam A., Gilbert W., Sanger F. - metody sekwencjonowania DNA
1978 Założono połączenie Usenet pomiędzy Duke i Uniwersytetem w Północnej Karolinie
1980 Opublikowano pierwszy gen sekwencji organizmu - FX174
1981 Wprowadzenie na rynek pierwszego komputera PC
1981 Opublikowano algorytm Smith-Waterman
1983 Mullis K. wynalezienie reakcji PCR, metody umożliwiającej klonowanie fragmentów DNA
1985 Mullis K. i współpracownicy - opisanie reakcji PCR
1986 Utworzenie bazy danych SWISS-PROT na Uniwersytecie w Genewie i EMBL (European Molecular Biology Laboratory)
1988 Założono Narodowe Centrum Informacji Biotechnologicznej (NCBI)
1988 Person i Lupman - algorytm FASTA do porównywania sekwencji
1988 Założono HUGO - Human Genom Organization - Projekt Poznania Ludzkiego Genomu
1990 Altschul, Gish, Miller, Myers, Liman - wdrożono program BLAST (Basic local alignment search tool)
1990 Opublikowano specyfikacje HTTP 1.0. Berners-Lee opublikował pierwszy dokument HTML
1991 Opisano utworzenie i użycie sekwencji ESTs
1993 Oficjalne przeniesienie bazy danych GenBank pod administrację NCBI - National Center for Biotechnology Information
1995 Zsekwencjonowano genom Heamophilius influenzea
1995 Zsekwencjonowano genom Mycoplasma genitalium
1996 Zsekwencjonowano genom drożdży piekarniczych Saccharomyces cerevisiae
1997 Zsekwencjonowano genom drożdży piekarniczych Saccharomyces cerevisiae
1997 Klonowanie pierwszego ssaka (owieczki Dolly) w Instytucie Roślin w Szkocji
1997 Opublikowano genom E.coli
1997 Opublikowano algorytm PSI - BLAST - Altschul, Madden, Zhang, Miller, Liman
1998 Opublikowano kompletny genom drożdży piekarskich Caenorhabditis elegans
1998 Kompletne genomy ukazują rozległość duplikakcji gen/białko sekwencja/struktura
1999 PSIMAP (Protein Structural Interactome Map) zawierający pierwszy, pełny system interakcji genomów -
pierwszy system filogenetycznych interakcji, pierwsza mapa utworzona przy użyciu domen białek,
pierwszy globalny system interakcji
1999 Marcotte, Pellegrini, Rice, Yeates, Eisenberg - Rozpoznanie funkcji białek oraz oddziaływania białko-białko
na podstawie sekwencji genomowych
2000 Opublikowano genom Pseudomonas aeruginosa
2000 Zsekwencjonowano genom A. thaliana
2000 Zsekwencjonowano genom D. melanogaster
2001 Opublikowano genom człowieka
2002 Opublikowano pełną sekwencję genomu myszy domowej
2004 Opublikowano szkic sekwencji genomu brązowego szczura norweskiego, Rattus norvegicus

Główna