Jest ogromny problem z rdzeniem projektu ludzkiego genomu

Edycja genomu: co się da zrobić w 2020 roku? | Krótka historia inżynierii genetycznej

Edycja genomu: co się da zrobić w 2020 roku? | Krótka historia inżynierii genetycznej

Spisu treści:

Anonim

Projekt Human Genome, który rozpoczął się w latach 90., był Homo sapiens „Udana próba wytyczenia całości DNA naszego gatunku. Wytworzyła ludzki genom referencyjny, drobno wypolerowaną kolekcję ludzkiego DNA, która jest kluczowa dla badań genetycznych i usług badań genetycznych na całym świecie. Integralny, jak to miało miejsce w środowisku naukowym, dwóch naukowców z Johns Hopkins University odkryło, że genomowi odniesienia brakuje części lub dwóch - no cóż, dokładnie 296 485 284 par zasad DNA.

Genom odniesienia jest niezbędną mapą ludzkiego materiału genetycznego, który jest używany jako podstawa do porównania. Kiedy sekwencjonujemy własne DNA w celu wglądu w zdrowie, historię rodziny i przyszłe ryzyko choroby, dzielimy sekwencję na wiele małych kawałków i porównujemy jej odcinki z genomem odniesienia, szukając obszarów, w których się różnimy. Podstawowy problem z tym, naukowcy piszą w niedawnym artykule w Nature Genetics, że genom odniesienia opiera się w dużej mierze na jednej osobie. Biorąc pod uwagę niezliczone różnice genetyczne wśród 7,7 miliarda ludzi żyjących obecnie, to oczywiście nie jest idealne.

Profesor informatyki i biostatystyki Steven Salzberg, Ph.D. i Rachel Sherman, Ph.D. kandydat, spraw, aby ten pojedynczy genom odniesienia nie uchwycił różnorodności genetyki człowieka. Niektóre populacje, dodają, różnią się zbyt wiele z tego genomu odniesienia. W swoim przypadku odnoszą się do genomów 910 osób z dwudziestu różnych krajów, z których wszystkie pochodzą z Afryki.

W DNA tych osób zespół odkrył 300 milionów wspólnych fragmentów DNA, które nie istnieją w naszym genomie „referencyjnym”. Jeśli pominiemy tak wiele materiałów, mówi Salzberg, nieuchronnie przegapimy kluczowe informacje na temat zdrowia i historii konkretnych populacji. Oni też są ludźmi, więc nie powinni być reprezentowani w „ludzkim” genomie odniesienia?

„Regiony te są zasadniczo niewidoczne dla społeczności genetycznej, dopóki nie mamy genomu referencyjnego obejmującego te regiony” - mówi Salzberg Odwrotność.

Problem z genomem odniesienia.

Przez lata nieustannie pracowaliśmy nad genomem referencyjnym. Ale ostatnia analiza wskazuje, że prawie siedemdziesiąt procent jego materiału zebrano od jednego Afroamerykanina, który nazywa się tylko RPCI-11, wyjaśnia Salzburg.

Oznacza to, że kiedy naukowcy przeprowadzają analizę genetyczną w celu zidentyfikowania różnic między różnymi populacjami z całego świata, przez większość czasu porównują te genomy z materiałem genetycznym, w większości, z jednej osoby. To prowadzi nas często do ignorowania materiału, który może być zbyt różny od tego odniesienia, mówi Sherman. Nazywa je „brakującymi częściami”.

„Gdy ustawisz kolejność, pojawią się fragmenty, które w ogóle się nie układają, ponieważ są zbyt różne, by dopasować cokolwiek do genomu odniesienia” - mówi Sherman. „Następnie ignorujesz wszystkie rzeczy, które nie są tak istotne lub naprawdę nie warte spojrzenia, kiedy mogą to być te elementy, które są najbardziej interesujące, ponieważ są najbardziej różne od genomu odniesienia”.

W badaniu Sherman i Salzberg wzięli duże ilości tego „innego” materiału (około 1000 par zasad) i próbowali ustalić, czy reprezentują one jedynie przypadkowe ciągi błędów sekwencjonowania - czy też rzeczywiście posiadają przydatne informacje o niezbadanym ludzkim DNA.

Zespół doszedł do wniosku, że to „nowe” DNA jest wystarczająco wysokiej jakości, aby zagwarantować drugie przejście, mimo że nie wiedzą jeszcze, jakie znaczenie ma dla ludzkiego ciała.

Jakie są konsekwencje?

Jak dotąd Sherman mówi, że tak naprawdę nie wiemy, czego nam brakuje, ignorując DNA, którego nie ma w genomie odniesienia. Ale kto wie, co możemy tam znaleźć, jeśli spojrzymy?

Salzberg sugeruje, że wyobrażamy sobie fikcyjną populację, która ma dodatkowy chromosom - 24 zamiast zwykłych 23 w każdej komórce. Nic w tym dodatkowym chromosomie z tej populacji nie byłoby zgodne z genomem odniesienia. Może, mówi, gdzieś na tym ukrytym chromosomie, jest powód, dla którego fikcyjna populacja ma tendencję do rozwoju pewnej choroby - i dlaczego reszta świata tego nie robi. Ale ponieważ nie mamy odpowiedniego odniesienia, aby je porównać, nigdy nie dowiedzielibyśmy się, że tam jest.

Oryginalna reklama, która przyniosła darczyńców dla Human Genome Project (Buffalo News, 23.03.1997), h / t Pieter de Jong, który umieścił ogłoszenie pic.twitter.com/gNB7mMv3Yu

- Jay Shendure (@JShendure) 28 października 2017

„Jeśli raz na jakiś czas występowały mutacje w tym chromosomie, które powodowały problemy, nigdy nie byłbyś w stanie ich badać”, mówi Salzberg. „Nigdy nie byłbyś w stanie ich obserwować, gdybyś polegał wyłącznie na tym genomie odniesienia”.

Powiedzmy sobie jasno: badania te nie dostarczają dowodów na pewne nieodkryte chromosomy. Ale to sugeruje, że prawdopodobnie brakuje nam dużo, gdy używamy pojedynczego genomu referencyjnego od jakiejś osoby o nazwie RPCI-11 jako podstawy dla wszystkich naszych analiz DNA naszego całego gatunku.

Jak to naprawić?

Zamiast dążyć do jednego uniwersalnego genomu odniesienia, zespół twierdzi, że powinniśmy mieć wiązka genomów referencyjnych - być może jeden dla każdej populacji będącej przedmiotem zainteresowania.

„To, czego jesteśmy tutaj zwolennikami, to fakt, że naprawdę musimy budować genomy referencyjne dla każdej populacji”, mówi Sherman. „Jeśli w referencjach w tej populacji brakuje tyle DNA, model musi się zmienić”.

Niektóre kraje same podjęły próbę stworzenia własnych genomów referencyjnych. Dania, na przykład, kompiluje materiał genetyczny od 150 Duńczyków w celu stworzenia prawdziwego „duńskiego” genomu odniesienia. Papier 2016 w Natura opisuje próbę skompilowania odniesienia dla osób koreańskich, chociaż ten artykuł opisuje tylko badania przeprowadzone na jednej osobie. Ale inne projekty, takie jak projekt 1000 genomów, również starają się uruchomić ten proces, ale jest dużo pracy, aby stworzyć materiał referencyjny tak dopracowany jak obecna wersja, znany jako GRCh38.

„Musisz zrobić coś więcej niż tylko przejść i sekwencjonować inną osobę z innej populacji, aby stworzyć genom referencyjny” - dodaje. „Musisz zrobić trochę więcej”.

Nie chodzi o to, że naukowcy nie wiedzą, że potrzebujemy więcej genomów referencyjnych. Salzberg ma nadzieję, że do tej pory będzie ich więcej i że przynajmniej zostaną powszechnie przyjęte jako standardowe genomy referencyjne. Dokument ubolewa, że ​​żadna z tych prób nie osiągnęła takiego samego statusu i siły jak GRCh38 - choć taki jest cel duńskiego projektu.

Idąc naprzód, Sherman i Salzberg podejmują się rozpoczęcia tego projektu, budując kilka dodatkowych genomów referencyjnych, które mają nadzieję wydać w ciągu jednego do dwóch lat. Chcą rozpocząć tworzenie biblioteki genomów referencyjnych, aby pomóc ludziom uzyskać jak największy wgląd w ich materiał genetyczny, bez względu na to, jak jest „inny”.

„Musimy mieć setki genomów referencyjnych” - dodaje. „To się stanie pewnego dnia”.