Historia Bioinformatyki...

Dziedzina ta narodziła się na początku lat osiemdziesiątych, wraz z utworzeniem w USA bazy danych nazywanej GenBankiem. Amerykański Departament Energii opracował ten program, aby zbierać i przechowywać informacje o sekwencjach krótkich odcinków DNA, które naukowcy zaczęli właśnie sekwencjonować, badając różne organizmy. Na początku istnienia GenBank rzesze techników wpisywały sekwencje DNA używając klawiatur składających się z czterech klawiszy A, C, T oraz G. Z czasem opracowano protokoły przekazywania danych. Badacze mogli zadzwonić do GenBank i bezpośrednio wprowadzić do komputera dane o sekwencji kolejnych odcinków genomu. Administrację GenBank przeniesiono do Państwowego Centrum Informacji Biotechnologicznej (NCBI - National Center for Biotechnology Information) w National Institutes of Health. Po uruchomieniu serwisu WWW w Internecie naukowcy z całego świata uzyskali bezpłatny dostęp do danych zgromadzonych w GenBank. Internet fundamentalnie zmienił sposób przekazywania danych między ośrodkami naukowymi [24;80]. Kiedy w 1990 roku ruszył oficjalnie Projekt Poznania Ludzkiego Genomu, liczba informacji o zapisie genetycznym napływających do GenBanku zaczęła rosnąć w postępie wykładniczym (rys.1). Po wprowadzeniu w latach dziewięćdziesiątych metod wysoko wydajnego sekwencjonowania z wykorzystaniem robotyki, automatycznych sekwencjonerów i komputerów proces ten nabrał zawrotnego tempa. Do dnia, w którym oddano do druku lipcowy numer "Scientific American", GenBank zdążył zgromadzić dane o kolejności zapisu ponad 7 mld jednostek DNA [25].

Mniej więcej w tym samym czasie, gdy rozpoczęto realizację Projektu Poznania Ludzkiego Genomu, podobnymi badaniami zajęły się firmy prywatne i stworzyły własne obszerne bazy danych. Obecnie korporacje takie jak Incyte Genomics z Palo Alto w Kalifornii są w stanie odczytać w ciągu jednego dnia zapis genetyczny liczący około 20 mln par zasad DNA. Natomiast przedstawiciele firmy Celera Genomics oznajmili, że uzyskali wstępną wersję pełnej sekwencji genomu ludzkiego i zgromadzili na ten temat 50 TB (tetra bajtów) danych. Taka ilość informacji zajęłaby 80 tys. płyt kompaktowych [25]. Inne uzupełniające i wysokowydajne technologie, takie jak np. mikromacierze DNA (ang. microarray), są również źródłem tysięcy danych na minutę. Ponadto na Ziemi występuje ponad milion gatunków owadów, i liczba ich ciągle wzrasta. Wiele z nich jest ekonomicznie istotna. Znaczenie wielu danych biologicznych wzrasta ze względu na wysoką efektywność sprzętu laboratoryjnego i technologii analizy [24;80]. GenBank i wyżej wymienione firmy są jednak zaledwie częścią bioinformacji. Istnieją inne publiczne i prywatne bazy danych zawierające informacje o ekspresji genów (czyli o tym, kiedy i gdzie geny są włączane), tzw. polimorfizmie sekwencji nukleotydowych (czyli drobnych różnicach genetycznych między poszczególnymi osobnikami), budowie różnych białek, oraz schematach ich wzajemnych oddziaływań.

Przekazywanie informacji o zsekwencjonowanych genomach

1843	Richard Owen opisał różnicę między homologią i analogią
1858	Darwin & Wallace opublikowali referaty o teorii ewolucji
1859	Charles Darwin opublikował "The Origin of Species"
1864	Ernst Häckel - zarys współczesnych elementów zoologicznej klasyfikacji
1865	Gregory Mendel ustanowił prawa dziedziczności w pracy "Badania nad mieszańcami roślin...".
1868	Friedrich Miescher - odkrycie kwasu nukleinowego
1902	Chromosomowa teoria dziedziczności zaproponowana przez pracujących niezależnie Suttona i Boveri'ego
1930	Badania nad naturą kwasu nukleinowego
1936	Alan Turing - wynalezienie uniwersalnej maszyny obliczeniowej tzw. Turing maschine
1941	Beadle & Tatum - "Genetyczna kontrola reakcji biochemicznych" - pierwszy naukowy dowód na hipotezę jeden-gen-jeden-enzym
1948	Chude Shannon - jeden z twórców teorii informacji
1951	Pauling & Corey proponują strukturę alfa-spirali i beta-kartki
1953	Watson & Crick model podwójnej helisy DNA
1953	Sanger F., Thompson E., Tuppy H. oznaczenie aminokwasowej sekwencji łańcuchów A i B insuliny
1970	Opublikowano szczegóły dotyczące algorytmu Needleman-Wunsch służącego do wyrównywania sekwencji
1971	Tomlinson - wynalezienie programu e-mail
1972	Paul Berg i współpracownicy stworzyli pierwszą zrekombinowaną cząsteczkę DNA
1975	Southern E. M.publikuje eksperymentalne dane dotyczące techniki Southern Blot dla specyficznych sekwencji DNA
1977	Maxam A., Gilbert W., Sanger F. - metody sekwencjonowania DNA
1978	Założono połączenie Usenet pomiędzy Duke i Uniwersytetem w Północnej Karolinie
1980	Opublikowano pierwszy gen sekwencji organizmu - FX174
1981	Wprowadzenie na rynek pierwszego komputera PC
1981	Opublikowano algorytm Smith-Waterman
1983	Mullis K. wynalezienie reakcji PCR, metody umożliwiającej klonowanie fragmentów DNA
1985	Mullis K. i współpracownicy - opisanie reakcji PCR
1986	Utworzenie bazy danych SWISS-PROT na Uniwersytecie w Genewie i EMBL (European Molecular Biology Laboratory)
1988	Założono Narodowe Centrum Informacji Biotechnologicznej (NCBI)
1988	Person i Lupman - algorytm FASTA do porównywania sekwencji
1988	Założono HUGO - Human Genom Organization - Projekt Poznania Ludzkiego Genomu
1990	Altschul, Gish, Miller, Myers, Liman - wdrożono program BLAST (Basic local alignment search tool)
1990	Opublikowano specyfikacje HTTP 1.0. Berners-Lee opublikował pierwszy dokument HTML
1991	Opisano utworzenie i użycie sekwencji ESTs
1993	Oficjalne przeniesienie bazy danych GenBank pod administrację NCBI - National Center for Biotechnology Information
1995	Zsekwencjonowano genom Heamophilius influenzea
1995	Zsekwencjonowano genom Mycoplasma genitalium
1996	Zsekwencjonowano genom drożdży piekarniczych Saccharomyces cerevisiae
1997	Zsekwencjonowano genom drożdży piekarniczych Saccharomyces cerevisiae
1997	Klonowanie pierwszego ssaka (owieczki Dolly) w Instytucie Roślin w Szkocji
1997	Opublikowano genom E.coli
1997	Opublikowano algorytm PSI - BLAST - Altschul, Madden, Zhang, Miller, Liman
1998	Opublikowano kompletny genom drożdży piekarskich Caenorhabditis elegans
1998	Kompletne genomy ukazują rozległość duplikakcji gen/białko sekwencja/struktura
1999	PSIMAP (Protein Structural Interactome Map) zawierający pierwszy, pełny system interakcji genomów - pierwszy system filogenetycznych interakcji, pierwsza mapa utworzona przy użyciu domen białek, pierwszy globalny system interakcji
1999	Marcotte, Pellegrini, Rice, Yeates, Eisenberg - Rozpoznanie funkcji białek oraz oddziaływania białko-białko na podstawie sekwencji genomowych
2000	Opublikowano genom Pseudomonas aeruginosa
2000	Zsekwencjonowano genom A. thaliana
2000	Zsekwencjonowano genom D. melanogaster
2001	Opublikowano genom człowieka
2002	Opublikowano pełną sekwencję genomu myszy domowej
2004	Opublikowano szkic sekwencji genomu brązowego szczura norweskiego, Rattus norvegicus

Główna