<< Strona główna

Rzut oka na NCBI

 


Nasza misja

(Zobacz jak NCBI wspiera działania Narodowego Instytutu Zdrowia (NIH) w kierunku "odkrywania nowej wiedzy" )

Ogólne wprowadzenie

Zrozumienie natury i opisanie jej eleganckim, zrozumiałym językiem jest zadaniem nowoczesnej biologii molekularnej.
Z alfabetu złożonego jedynie z czterech liter reprezentujących chemiczne podjednostki DNA pojawia się składnia życia której największym kompleksowym wyrażeniem jest człowiek.
Rozwinięcie i użycie tego "alfabetu" kształtuje nowe "słowa i zwroty" które stanowią główne zainteresowanie  dziedziny biologii molekularnej.
Wahanie się objętości molekularnych danych i ich zagadkowe subtelne wzorce doprowadziły do komputeryzacji baz danych i narzędzi badawczych.
Wyzwaniem jest znalezienie nowych rozwiązań pozwalających na poradzenie sobie z objętością (wielkością) i złożonością danych, ułatwieniem dostępu badaczom do analiz i narzędzi komputerowych po to by bardziej zrozumieć nasze genetyczne dziedzictwo i jego role w zdrowiu i chorobie.

Tworzenie NCBI

Senator Claude Pepper docenił znaczenie komputerowych metod obrabiania informacji dla prowadzenia badań biomedycznych i popierał prawodawstwo ustanawiające Narodowe Centrum Biotechnologicznej Informacji (NCBI) (4 Listopad 1988), jako oddział Narodowej Biblioteki Medycyny (NLM) przy Narodowym Instytucie Zdrowia (NIH).
NML został wybrany ze względu na swoje doświadczenie w tworzeniu i utrzymywaniu biomedycznych baz danych, również, dlatego, że jako część NIH mógł zakładać badawcze programy obliczeniowe w biologii molekularnej. Zbiorowe badania składników NIH stanowią największe zaplecze naukowe do badań biomedycznych na świecie.

Podstawowe badania

Misją NCBI, jako źródła informacji z dziedziny biologii molekularnej, jest rozwijanie nowych technologii informatycznych pomocnych w zrozumieniu podstaw molekularnych i genetycznych procesów, które kontrolują zdrowie i choroby. Bardziej dokładnie, NCBI został obciążony stworzeniem zautomatyzowanego sytemu przechowywania i analizowania wiedzy na temat biologii molekularnej, biochemii i genetyki; ułatwianie używania takich baz danych i oprogramowania przez badaczy i społeczność lekarską; coordinating efforts to gather biotechnology information both nationally and internationally; tworzenie badań nad zaawansowanymi metodami komputerowego przetwarzania informacji do analizowania struktury i funkcji biologicznie ważnych molekuł.
NCBI wykonuje swoje zróżnicowane obowiązki poprzez:

- prowadzenie badań w zakresie podstawowych problemów biomedycznych na poziomie molekularnym za pomocą matematycznych metod obliczeniowych;
- utrzymuje współprace z ośrodkami akademickimi, instytutami naukowymi i przemysłowymi oraz innymi agencjami rządowymi;
- wspiera szkolenia dla stypendystów i doktorantów;
- w ramach programu naukowego angażuje specjalistów z całego świata;
- buduje, rozwija, upowszechnia i koordynuje dostęp do wielu baz danych i oprogramowania na potrzeby społeczności naukowej i medycznej;
- rozwija i promuje standardy baz danych biologicznych.

Na górę


Programy i działania

Działalność podstawowa

W skład grupy badaczy NCBI wchodzą doświadczeni informatycy, biolodzy molekularni, matematycy, biochemicy, lekarze, i inni naukowcy koncentrujący się na metodach obliczeniowych stosowanych w biologii molekularnej. Ci „śledczy” nie tylko rozwijają nauki podstawowe, ale również rozwijają nowe metody badawcze. Wspólnie analizują problemy biomedyczne na poziomie molekularnym przy pomocy matematycznych metod obliczeniowych. Problemy te obejmują genotyp, analizę sekwencji, przewidywania struktury. Przykładowo kilka aktualnych projektów badawczych obejmuje: wykrywanie i analizę genotypu, ułożenie wzorców powtarzających się sekwencji, identyfikacja białek i ich elementów konstrukcyjnych, tworzenie mapy ludzkiego genomu, matematyczne modelowanie kinetyki zakażeń wirusem HIV, analysis of effects of sequencing errors for database searching, tworzenie nowych algorytmów przeszukiwania baz danych, tworzenie nowych algorytmów wyszukiwania podobnych sekwencji. Dodatkowo badacze NCBI utrzymują współpracę z kilkoma instytucjami NIH, a także z licznymi rządowymi i akademickimi laboratoriami badawczymi.

Bazy danych i oprogramowanie

NCBI przejął odpowiedzialność za administrowanie GenBank – bazę danych sekwencji ludzkiego DNA w październiku 1992. Wysoce wykwalifikowani naukowcy w NCBI budują bazę danych z sekwencji dodawanych przez indywidualne laboratoria jak i pozyskanych przez wymianę danych pomiędzy międzynarodowymi bazami danych sekwencji nukleotydów - European Molecular Biology Laboratory (EMBL) i DNA Database of Japan (DDBJ). Uzgodnienia z Urzędem Patentowym pozwalają na publikowanie jedynie opatentowanych sekwencji.

Oprócz projektu GenBank, NCBI wspiera i rozpowszechnia szereg baz danych – naukowych i medycznych. Obejmują one Online Mendelian Inheritance in Man (OMIM), Molecular Modeling Database (MMDB) of 3D protein structures, Unique Human Gene Sequence Collection (UniGene), Gene Map of the Human Genome, Taxonomy Browser oraz Cancer Genome Anatomy Project (CGAP) we współpracy z National Cancer Institute.

Entrez jest narzędziem które umożliwia przeszukiwanie baz NCBI, zapewnia on użytkownikom dostęp do sekwencji, mapowania, taksonomii i danych strukturalnych. Entrez również zapewnia graficzne wizualizacje mapy sekwencji czy chromosomów. Unikalną cechą Entrez jest możliwość pobrania powiązanych sekwencji czy struktur. Czasopisma dostępne są poprzez PubMed, interfejs wyszukiwarki zapewnia dostęp do ponad 11 mln czasopism cytowanych w MEDLINE i zawiera linki do pełnych tekstów artykułów.

BLAST to program opracowany dla NCBI, służy on do wyszukiwania podobnych sekwencji, jest instrumentem do identyfikacji genów i cech genetycznych. BLAST może wyszukać sekwencje DNA w całej bazie NCBI w czasie krótszym niż 15 sekund. Dodatkowe narzędzia dostarczone przez NCBI zawierają: Open Reading Frame Finder (ORF Finder), Electronic PCR, Sequin and BankIt. Całe oprogramowanie NCBI jest dostępne on – line lub do ściągnięcia z serwera FTP. NCBI ma również serwery e-mail, by zapewnić alternatywny dostęp do baz danych tekstowych wyszukiwania podobnych sekwencji.

Zasięg i edukacja

NCBI sprzyja komunikacji naukowej w dziedzinie komputerów, w zastosowaniu do biologii molekularnej i genetyki, poprzez sponsorowanie spotkań, warsztatów i serii wykładów. Program "Scientific Visitors Program" zaostał utworzony w celu nadzorowania współpracy z dodatkowymi naukowcami. Pozycje habilitacyjne są dostępne jako część programu NIH Intramural Research Program.

Na górę


Struktura organizacji

Computational Biology Branch (CBB)

Prowadzi badania podstawowe i stosowane w obliczeniach matematycznych i problemach teoretycznych dotyczących biologii molekularnej i genetyki; w tym analiza genomu, kolejność porównywania, metodologia wyszukiwania sekwencji, makrocząsteczkowych struktur, dynamiki i interakcji oraz przewidywanie struktury i funkcji.
Ustanawia wspólne projekty badawcze dla biologów molekularnych, chemików, matematyków i informatyków w laboratoriach NIH i w innych agencjach rządowych czy akademickich.
Konsultuje i doradza rządowym agencjom i laboratoriom badawczym w zakresie stosowania komputerowych narzędzi analitycznych do badań biologii molekularnej.
Oddziałuje z grupami biologii molekularnej w celu usprawnienia wet-bench, badań laboratoryjnych poprzez używanie podejścia obliczeniowego i teoretycznego.
Interacts with molecular biology groups to enhance wet-bench, laboratory-based research through the application of computational and theoretical approaches

Information Engineering Branch (IEB)

Prowadzi badania dotyczące reprezentacji i analizy danych, w tym rozwój systemów komputerowych do przechowywania, zarządzania i wyszukiwania wiadomości dotyczących biologii molekularnej, genetyki i biochemii.
Buduje wzory i schematy baz danych, ustala normy dla reprezentowania różnych form informacji z biologii molekularnej, w tym kwasy nukleinowe, białka, informacja o strukturze. Te bazy danych służą jako zasoby międzynarodowe.
Projektuje i rozprowadza różnorodne systemy oprogramowania od prototypu do fazy operacyjnej, które zapewniają dostęp do programów obliczeniowych naukowcom lokalnym jak i zdalnym.
Koordynuje publiczny dostęp do sekwencji genetycznych, struktur i informacji bibliograficznych poprzez budowanie zintegrowanych baz danych, i jeśli to możliwe ustanawia powiązania z zewnętrznymi bazami danych.
Ustanawia wspólne informatyczne projekty badawcze z laboratoriami NIH jak również z grupami akademickimi.
Konsultuje i doradza innym agencjom rządowym i laboratoriom badawczym w sprawie zaawansowanych metod projektowania oprogramowania i baz danych.
Rozwija i promuje standardy dotyczące baz danych, wymiany danych i nomenklatury biologicznej.

Information Resources Branch (IRB)

Planuje, kieruje i zarządza technicznymi operacjami w NCBI, w tym systemami komputerowymi używanymi do badań i rozwoju, jak również systemami komputerowymi dostępu do publicznych baz danych.
Zapewnia pomoc techniczną dla pracowników NCBI i wsparcie dla zewnętrznych użytkowników sieciowych.
Nadzoruje operacje sieciowe NCBI oraz współpracuje z agendami rządowymi na szczeblu krajowym i międzynarodowymi  w sprawie dostępu do usług.
Organizuje pokazy i warsztaty edukacyjne sprzyjające wykorzystaniu informatycznemu serwisowi NCBI dla społeczności biomedycznych.
Planuje, rozwija i zarządza umowami i porozumieniami o współpracy w zakresie zakupu sprzętu i usług wspierających informacyjną funkcję NBCI.
Służy jako łącznik pomiędzy użytkownikami a agencjami zaangażowanymi w projekty genomu.
Wymyśla nowe badania i kierunki rozwoju, zapewnia doradztwo techniczne i określa potrzeby użytkowników. Prowadzi badania w celu określenia zastosowania oprogramowania NCBI przez użytkowników.
Współpracuje z innymi agencjami rządowymi zajmującymi się zasobami informacji dot. biologii  w celu ułatwienia rozwoju udostępniania danych na NCBI.
Izba Naukowych doradców spotyka się dwa razy w roku w celu przeglądu badań prowadzonych przez Centrum.

Na górę


Przegląd badań

Programy badawcze w oddziale biologii obliczeniowej prowadzone są przez doświadczonych śledczych, tenure track Investigators, Staff Scientists, Postdoctoral Fellows i studentów. Program skupia się na teoretycznych i analitycznych metodach stosowanych w szerokim spektrum problemów biologii molekularnej. Wiedza specjalistyczna grupy jest skoncentrowana na analizie sekwencji, poznanie struktury i funkcji białek, identyfikacji genów, ale zainteresowania naukowe obejmują szeroki zakres tematów dotyczących metod obliczeniowych w biologii i nauk informatycznych. Badania te obejmują ale nie są jedynie ograniczone do: algorytmów przeszukiwania baz danych, niskiej złożoności sekwencji, sygnałów sekwencji, matematycznych modeli ewolucji, metod statystycznych w wirusologii, dynamiczne zachowanie reakcji chemicznych, statystycznych algorytmów wyszukiwania tekstu, przewidywania struktury i funkcji białek, genomika porównawcza, drzewa taksonomiczne i genetyka populacji.

Wiele z podstawowych projektów badawczych prowadzonych przez śledczych CBB ma służyć wzmocnieniu publicznemu dostępowi do  baz danych i  narzędzi aplikacji. Wspólne wysiłki badawcze wśród badaczy NCBI jak również osób zaangażowanych w zewnętrzne badania, doprowadziły do rozwoju innowacyjnych algorytmów (BLAST, PSI-BLAST, SEG, ZDECYDOWANA i COGs) i nowych metod badawczych, które zmieniły dziedzinie biologii obliczeniowej. Algorytmy i aplikacje aktualnie w fazie rozwoju mają potencjał naukowego odkrycia.

Członkowie CBB znacząco przyczyniają się  do prawdziwości i rzetelności NCBI zasobów online, jakości i dokładności danych zdeponowanych w bazach danych, jak również prawdziwość informacji stosowanych do komentowania danych. Członkowie także zapewniają kierownictwo i  kierują planowaniem i organizowaniem konsorcjów naukowych w celu określenia najbardziej efektywnego wykorzystania środków publicznych na dużą skalę lub wysokiej przepustowości biologii eksperymentalnej. Naukowcy współpracują w celu określenia znanych luk w badaniach i nad identyfikacją mostów dla tych luk.

Na górę


Historia odkrycia

Od sekwencji do przetrwania: w poszukiwaniu zrozumienia chorób.

Biologia dziś jest transformowana przez wielki napływ danych z laboratoriów na całym świecie. Jej wyzwaniem jest przekształcić te dane w wiedzę, która doprowadzi do lepszego zrozumienia podstawowych procesów biologicznych zdrowia i choroby. Badacze NCBI dążą do tej wiedzy poprzez opracowywanie nowych metod integracji komputerowej analizy danych i złożonych zestawów danych. Raz rozwinięte oprogramowania mogą być wykorzystane przez środowisko naukowe do odpowiedzi na konkretne naukowe pytania.

Podejście NCBI do rozpowszechniania swoich środków na badania naukowe i medyczne pozwoliło naukowcom na całym świecie uformować zintegrowany system pozornie różnych danych oraz kształtować bardziej miarodajne opinie w oparciu o te informacje, opinie z kolei generują nową wiedzę. Ten wieloletni proces najlepiej obrazują poniższe przykłady.

Od danych i informacji do faktów: GenBank i ludzki genom.

Genbank jest bazą NIH utrzymywana i dystrybuowaną przez NCBI, baza ta zawiera wszystkie znane i opublikowane sekwencje DNA. Dane sekwencje są dodawane do GenBank przez indywidualnych naukowców z całego świata jak i przez tych którzy biorą udział w Human Genom Project. Ilość sekwencji DNA zgromadzonych w GenBank, ze wszystkich organizmów, ostatnio osiągnęła kolosalną wysokość i nadal rośnie w szybkim tempie. GenBank jest międzynarodowym projektem współpracy European Bioinformatics Institute w Wielkiej Brytanii oraz  the National Institute of Genetics w Japonii.

Badacze NCBI wykorzystują dane przechowywane w NCBI  aby wygenerować zespół ludzkiego genomu. Zgromadzenie i uporządkowanie poszczególnych sekwencji jest krytycznym etapem projektu. Zespoły zajmujące się wprowadzaniem nowych danych wypełniają istniejące luki oraz poprawiają dokładność.

Badacze NCBI są także zaangażowani w proces nanoszenia lub etykietowania biologicznie ważnych obszarów ludzkiego genomu. Proces ten obejmuje umieszczanie znanych genów ludzkiego genomu w ich właściwe miejsce, jak również prognozy dotyczące wcześniej niezidentyfikowanych genów ludzkiego genomu. For the first task, mRNAs from the NCBI RefSeq collection are placed on the genome primarily by alignment. RefSeq mRNAs are reference sequence standards for the human genome. To generate a sequence standard, NCBI investigators first collaborate with external organizations to gather various types of information. They next assimilate these data using both computational tools and scientific judgment to determine what sequence is an appropriate representation for a gene.

OMIM jest opartym na sieci Web katalogiem zawierającym tysiące informacji dotyczących genów i zaburzeń genetycznych i służy jako fenotypowy towarzysz Human Genom Project. W OMIM cytogenetyczne mapy prezentują lokalizację dla genów oraz dostarczają alfabetyczną listę wszystkich chorób opisanych w OMIM.

Aby potwierdzić wyniki wygenerowanych przez komputerowe analizy porównawcze, konieczne jest rozważenie wyników wet-bench biology (?) opisanych w literaturze naukowej. Dlatego też integracja danych naukowych z literatura jest koniecznym krokiem na drodze do stworzenia jednolitego źródła informacji w naukach przyrodniczych.  To this end, individuals are provided with a direct link from OMIM to PubMed, NCBI's literature retrieval system.

PubMed zapewnia internetowy dostęp do ponad 11 milionów abstraktów i indeksowanych artykułów naukowych w naukach biomedycznych. Obejmuje ona także linki do pełnych tekstów czasopism. Obecnie miesięcznie prowadzonych jest około 20 milionów wyszukiwań, a 140 000 różnych użytkowników wyszukuje informacje za pośrednictwem PubMed.

PubMed Central – cyfrowe archiwum literatury naukowej – został zainicjowany w styczniu 2001 i oferuje nowy model elektronicznej komunikacji naukowej i pobierania danych. Wartość PubMed Central to to iż przechowuje dane z różnych źródeł we wspólnym formacie w jednym miejscu. PMC obecnie zapewnia swobodny i nieograniczony dostęp do pełnego tekstu 104 czasopism.

Od faktu do wiedzy.

Każda baza danych opisana powyżej, jest sama w sobie pouczająca i pożyteczna. Tymczasem to tylko części składowe związane w postacie jednego, zintegrowanego źródła, aby informacje przechowywane w każdej bazie mogły być analizowane w ramach większej całości. Np. zbierając różne formy informacji o danym białku naukowiec może wyjaśnić wcześniej nieznaną jego funkcję. Nagle wszystko może być na naukowca jasne, i może on wyjaśnić ścieżkę jakiejś choroby. Długoterminowe cele obejmują rozwój nowej strategii dla diagnozowania chorób i ich leczenia.

Odkrycie genów choroby.

Choć to duże uproszczenie ale zintegrowane zasoby NCBI i human Genom Project doprowadziły do wielkiego naukowego odkrycia genów odpowiedzialnych za dziedziczną odmianę raka jelita grubego (HNPCC).

HNPCC jest uważana za 1/6 wszystkich przypadków raka jelita grubego. Choć większość form raka wydaję się nie być dziedziczona to istnieją pewne formy gdzie ryzyko odziedziczenia ma związek ze zmianą pojedynczego genu. Mimo iż naukowcy posiadali wiedzę, że za HNPCC odpowiedzialny jest zmieniony gen, bardzo trudno było zidentyfikować jego miejsce w genomie. Przy użyciu różnych narzędzi powstających przy Human Genom Project międzynarodowy zespół badaczy wyśledził ten gen w obrębie chromosomu 2. Kilka miesięcy później dwa zespoły badaczy zeroed in on the culprit. 3 miesiące po tym naukowcy zidentyfikowali drugi gen odpowiedzialny za ten rodzaj raka na chromosomie 3.

Obecnie wiadomo, że mutacje w obrębie tych genów są odpowiedzialne za powstanie raka okrężnicy w większości przypadków choroby. Naukowcy opracowali testy na wykrywanie tego genu u ludzi. Wykrycie tego genu u członków rodziny osób chorych pozwala na wcześniejsze zapobieganie rozwoju choroby. Co najważniejsze pacjenci we wczesnym stadium raka i mający gen odpowiedzialny za tę chorobę byli poddawani wcześniejszemu diagnozowaniu i leczeniu. Wcześnie zdiagnozowany HNPCC jest niemal w 100 % uleczalny.

Na górę


Informacje kontaktowe

Aby uzyskać więcej informacji o każdej z naszych baz danych, usługach i programach NCBI skontaktuj się z nami pod adresem:

Adres pocztowy:

National Center for Biotechnology Information National Center for Biotechnology Information
National Library of Medicine National Library of Medicine
Building 38A Boyne 38A
Bethesda, MD 20894 Bethesda, MD 20894

Telefon:
Voice: (301) 496-2475
Fax: (301) 480-9241
Adresy internetowe:

Informacje ogólne: info@ncbi.nlm.nih.gov
- Pytania na temat NCBI oraz programów i usług
- Wsparcie techniczne
- Wpis do listy mailingowej NCBI – Aktualności

Zgłoszenia do GenBank:
- dodanie sekwencji do GenBank gb-sub@ncbi.nlm.nih.gov
- uwagi lub pytania dotyczące sekwencji gb-admin@ncbi.nlm.nih.gov

Aktualizacje GenBank gb-admin@ncbi.nlm.nih.gov

- zmiana istniejących rekordów
- małe zmiany w rewidowanych rekordach
- kompletne nowe rekordy

Entrez: info@ncbi.nlm.nih.gov

- W przypadku pytań technicznych dotyczących Entrez

BLAST: blast-help@ncbi.nlm.nih.gov

-Pytania techniczne dotyczące interpretacji porównywanych sekwencji w  BLAST i wyników

Pozostałe wsparcie techniczne: info@ncbi.nlm.nih.gov

NCBI Feedback: info@ncbi.nlm.nih.gov

Na górę