Populacyjno-statystyczna metoda badania genetyki: istota i znaczenie

22.04.2019

W ostatnich latach zaproponowano bardzo szeroki zakres metod statystycznych na różnych poziomach złożoności w analizie danych genotypowych i identyfikacji zmian genetycznych, które mogą być odpowiedzialne za zwiększanie podatności na choroby. Jaka jest populno-statystyczna metoda badania genetyki? Jaka jest jego istota i znaczenie w badaniu dziedziczności?

populacyjna metoda statystyczna w badaniu roli dziedziczności

Computational Biology Type

Genetyka statystyczna jest dziedziną naukową związaną z opracowywaniem metod statystycznych dla populacji w oparciu o dane genetyczne. Termin ten jest najczęściej używany w kontekście. ludzka genetyka. Badania w tym obszarze zwykle obejmują opracowanie teorii lub metodologii wspierającej badania w jednym z trzech wzajemnie powiązanych obszarów:

  • genetyka populacyjna - badanie procesów ewolucyjnych, które wpływają na zmienność genetyczną między organizmami.
  • epidemiologia genetyczna - badanie wpływu genów na chorobę.
  • genetyka ilościowa - badanie wpływu genów na "normalne" fenotypy.

Genetyka statystyczna ma tendencję do ścisłej współpracy z genetykami, biologami molekularnymi, klinicystami i bioinformatykami. Genetyka statystyczna jest rodzajem biologii obliczeniowej.

populacyjna metoda statystyczna do badania genetyki człowieka

Przedmiot badań

Genetyka populacji bada strukturę genetyczną populacji i ich puli genów. Obejmuje również kwestie związane z interakcją czynników determinujących zarówno stałość, jak i zmianę struktury genomu. Czym jest populacja? Jest to zbiór osobników tego samego gatunku, które swobodnie przecinają się i zajmują określony obszar terytorialny, a także mają wspólną pulę genową (pulę genową), przechodzącą z pokolenia na pokolenie.

Populacyjno-statystyczna metoda genetyki jest wykorzystywana w badaniach chorób dziedzicznych, przemian normalnych i patologicznych genów, genotypów i fenotypów w populacjach różnych miejscowości, krajów i miast. Jaka jest jego wyjątkowość? Istota metody statystyczno-populacyjnej polega na badaniu wzorców rozprzestrzeniania się chorób dziedzicznych w populacjach różniących się strukturą. Badamy możliwość przewidywania ich powtórzeń w przyszłych pokoleniach.

metoda statystyczna oparta na populacji i jej znaczenie

Ludność - metoda statystyczna i jej wartość

Statystyczna analiza genetyczna cech ilościowych w dużych rodowodach jest ogromnym zadaniem obliczeniowym ze względu na konieczność uwzględnienia niezależności wśród krewnych. Wraz z rosnącą świadomością, że warianty rzadkich sekwencji mogą być ważne w ilościowych różnicach międzyludzkich, badania nad odziedziczalnością i skojarzeniami związanymi z dużymi rodowodami będą się zwiększać z powodu większego prawdopodobieństwa zaobserwowania wielu kopii rzadkich wariantów wśród spokrewnionych osób.

Dlatego ważne jest posiadanie procedur statystycznych testów genetycznych, które wykorzystują wszystkie dostępne informacje do wyodrębnienia dowodów dotyczących powiązań genetycznych. Optymalne powiązanie fenotypów wiąże się z dokładnym obliczeniem statystyk współczynnika prawdy, które wymagają ponownej inwersji potencjalnie dużych macierzy. W kontekście łączenia całej sekwencji genomu takie obliczenie może być nieprawidłowe.

populacyjna metoda statystyczna do badania genetyki człowieka

Statystyczne metody analizy genetycznej

W związku z postępem w technologii laboratoryjnej, metoda statystyczno-populacyjna i epidemiologiczne podejście genetyczne do złożonych chorób szybko się zmieniają, aby poradzić sobie z ogromem danych genetycznych. Wraz ze zmianami technologii laboratoryjnych stało się możliwe generowanie bardziej kompletnych danych genetycznych dotyczących generowania genomu z danymi o całej sekwencji genomu.

Wystąpiły problemy z wielokrotnym testowaniem i pojawieniem się rzadkich wariantów genetycznych, które ograniczały się do tradycyjnych metod statystycznych, co doprowadziło do opracowania metod dla rzadkiego wariantu analizy. Obecne badania koncentrują się nie tylko na analizie poszczególnych wariantów genetycznych, ale również na analizie kilku wariantów genetycznych, szczególnie przy użyciu metod sieciowych.

istota metody statystycznej opartej na populacji

Szybki rozwój genetyki

Badania w dziedzinie genetyki rozwinęły się szybko, począwszy od badań poszczególnych dziedzin, a kończąc na badaniach genomu na dużą skalę. I choć badania nad powiązaniami genetycznymi prowadzone są od wielu lat, nawet w przypadku najprostszych analiz nie ma zgody co do najbardziej odpowiednich procedur statystycznych.

Genetyka statystyczna jest obszarem zbieżności genetyki i analizy ilościowej. W ciągu ostatnich kilku lat doszło do dramatycznej zmiany paradygmatu, z przeważnie teoretycznego przedmiotu, w którym dane empiryczne są ograniczone do ścisłej dyscypliny, gdzie istnienie dużych repozytoriów danych genetycznych pozwala badaczom generować i badać nowe hipotezy naukowe.

Opłacalna technologia

Wraz z pojawieniem się stosunkowo taniej technologii o wysokiej wydajności genotypowania, możliwe jest teraz zbadanie etiologii złożonych chorób, procesów biologicznych, poprzez które DNA jest dziedziczone, oraz ewolucyjnych historii ludzkich populacji. Z medycznego punktu widzenia, postęp w stosowaniu metody statystyczno-populacyjnej w badaniu roli dziedziczności dotyczy opracowania i analizy badań farmakogenetycznych, czyli badań, w których zmienność genetyczna koreluje z odpowiedzią na leki.

Może to ostatecznie doprowadzić do opracowania podejścia "medycyny spersonalizowanej" w opiece zdrowotnej. Oczywiście dla każdego z tych obszarów badań wymagane są specjalistyczne metody wnioskowania i obliczania. Ten przegląd metod statystycznych populacji w genetyce ogranicza się do mapowania skojarzeń: potężna metodologia, która ma pomóc w zrozumieniu genetycznych podstaw ludzkich chorób i innych fenotypów będących przedmiotem zainteresowania.

Zamiast próbować uwypuklić metody porównywania asocjacji, narażenie ogranicza się do uwzględnienia jedynie metod analizy danych do badań w przypadku choroby lub sytuacji, w których dostępne są tylko osoby chore. Celem tego artykułu jest zaproszenie czytelnika do nietechnicznego objazdu kilku wybranych metod genetyki populacyjnej i statystycznej, stosowanych obecnie do mapowania genów.

metoda statystyczna populacji

Akt Hardy-Weinberga

Głównym przykładem metody statystycznej populacji jest prawo Hardy'ego-Weinberga. Opiera się na wzorcu, który został odkryty w 1908 roku przez matematykę z Anglii J. Hardy'ego i doktora V. Weinberga z Niemiec w celu stworzenia idealnej populacji. Prawo zostało więc nazwane po dwóch imionach. Aby populacja była idealna, konieczne są następujące warunki:

  1. Organizmy muszą być swobodnie krzyżowane.
  2. Nie ma selekcji i zjawisk mutacyjnych.
  3. Procesy migracyjne, zarówno zewnętrzne, jak i wewnętrzne, są ograniczone.
  4. Dominujące homozygoty, heterozygoty i recesywne homozygoty są dziedziczone w niezmienionej postaci.

Doskonała równowaga może być zakłócona przez wiele czynników, w tym blisko spokrewnione małżeństwa, mutacje, selekcje, migracje i wiele innych. Ustawa Hardy'ego-Weinberga jest uważana za podstawę do rozważenia genetycznych przemian zachodzących w naturalnych i sztucznie tworzonych populacjach roślin, zwierząt i ludzi.

Zasady stowarzyszenia

Wyróżniającą cechą projektu kontroli przypadku jest to, że badani włączeni do próby są losowo wybierani z danej populacji zgodnie ze statusem choroby retrospektywnie. Kompozycje genetyczne osobników należących do dwóch grup, przypadków i kontroli porównuje się w nadziei, że ich różnice w pewnych wąskich regionach genomu mogą służyć jako przyczynowe wyjaśnienie statusu choroby. Wśród różnych typów markerów genetycznych polimorfizmy pojedynczego nukleotydu (SNP) odgrywają główną rolę w mapowaniu złożonych chorób. W przypadku całego ludzkiego genomu istnieje co najmniej 10 milionów SNP o częstotliwości> 1%, co stanowi około 90% genetycznej zmienności danej osoby.

Podstawową koncepcją w mapowaniu asocjacji jest brak równowagi między markerem genetycznym a locus, który wpływa na badaną cechę. Przechwytuje odchylenie od probabilistycznej niezależności pomiędzy allelami lub markerami genetycznymi. Na przykład, nierównowaga sprzężeń między dwoma allelami, takimi jak A i B, można określić ilościowo przez pomiar różnicy między p AB , prawdopodobieństwem obserwacji haplotypu AB (tj . Liniowego rozmieszczenia dwóch alleli na tym samym chromosomie dziedziczonym jako pojedyncza jednostka) i p A p B , gdzie pA i pB to prawdopodobieństwa obserwacji odpowiednio alleli A i B. Jednak w większości przypadków haplotypy nie są bezpośrednio dostępne, a ich częstotliwości powinny być raczej określone na podstawie danych genotypu.

Metody wyjściowe, oparte na wariantach algorytmu minimalizacji oczekiwań, iteracyjną techniką uzyskiwania oszacowań maksymalnych prawdopodobieństw w modelach brakujących danych, są popularnym wyborem dla uzyskania częstotliwości haplotypów próbki. Określono dokładność algorytmu do minimalizowania oczekiwań dotyczących szacowania częstotliwości haplotypu dla różnych schematów symulacyjnych, zarówno funkcji częstotliwości alleli, jak i wielu innych czynników. Ostatnie wydarzenia wykorzystują obserwację, w której, w krótkich regionach, haplotypy w populacji mają tendencję do grupowania się w grupy, a to grupowanie ma tendencję do różnicowania się wzdłuż chromosomu.

Uzyskane wzory zmienności genetycznej można dobrze opisać za pomocą ukrytych modeli Markowa, a oszacowania parametrów dokonano przy użyciu algorytmu do wyprowadzenia fazy haplotypu, jak również brakujących danych genotypu. Alternatywnie, miara złożonej nierównowagi genotypowej może być obliczona bezpośrednio z danych genotypowych billocus, zakładając losowe krycie, odpowiada wyżej wymienionemu meridianowi allelicznemu. Wiele innych wspólnych współczynników i ich właściwości badano zarówno analitycznie, jak i poprzez modelowanie.

Metoda bliźniacza w badaniu genomu

Zakres populacji statystycznej i metoda bliźniacza obejmują badanie wzorów dziedziczenia postaci w parach bliźniąt. Proponowany przez naukowca Haltona w 1875 roku, metoda ta została pierwotnie wykorzystana do oceny roli dziedziczności i środowiska w rozwoju ludzkich właściwości psychicznych. Obecnie jest szeroko stosowany w badaniach dziedziczności i zmienności objawów normalnych i patologicznych. Może być stosowany do identyfikacji dziedzicznej natury danej cechy, określenia penetracji allelu i oceny czynników zewnętrznych wpływających na organizm.

przykłady metody statystycznej opartej na populacji

Istota metody bliźniaczej:

  • W różnych grupach bliźniąt ta sama cecha jest porównywana, pod uwagę brane są również podobieństwo lub odmienność ich genotypów.
  • U bliźniaków jednojajowych występuje pełna tożsamość genetyczna. Ich porównanie w warunkach różnego rozwoju postembersyjnego umożliwia wykrycie znaków powstałych w wyniku oddziaływania środowiska zewnętrznego.

Badanie genomu w statystyce populacyjnej metoda badania genetyki człowieka pozwala na bardziej wszechstronne poszukiwanie genetycznych czynników ryzyka. W niedalekiej przyszłości badania te będą mniej kosztowne, a przez to bardziej dostępne. Z punktu widzenia statystycznego i obliczeniowego, badania genomu jako całości oferują nietrywialne problemy związane między innymi z bardzo dużą liczbą markerów, które powinny być włączone do analizy, w porównaniu z zazwyczaj mniejszymi wielkościami próbek.

zakresy populacji statystycznej i metody bliźniaczej

Opracowanie nowych metod analitycznych

Kwestią, która powoduje wiele dyskusji i napędza rozwój nowych metod analitycznych, jest to, czy złożone choroby są spowodowane jedną wspólną opcją lub wieloma opcjami, które mają niewielkie skutki. Powszechna hipoteza o powszechnej chorobie wskazuje, że genetyczne ryzyko powszechnych chorób często będzie powodowane przez allele powodujące chorobę, które występują przy stosunkowo wysokich częstotliwościach. Jak dotąd dowody na jego korzyść były ograniczone.

Uzasadnione jest założenie, że powszechne choroby powinny być kontrolowane przez bardziej złożone mechanizmy genetyczne charakteryzujące się połączonym działaniem kilku genów, przy czym każdy gen ma jedynie niewielki wpływ marginalny, prawdopodobnie dlatego, że dobór naturalny usuwa geny o większych skutkach. W takim przypadku grupy markerów powinny być testowane razem w celu skojarzenia, co można zrobić na dwa główne sposoby: grupując markery razem w genotypy z kilkoma loci, tak aby podstawowa jednostka analizy statystycznej była nadal pojedyncza lub poprzez haplotypy, skutecznie podwajając wielkość próby.

Ogólne metody haplotypów

Zamiast badać każdy marker osobno, możliwe jest wspólne testowanie określonych kombinacji wariantów allelicznych w serii ściśle połączonych markerów na tym samym chromosomie, to jest haplotypów. Uwzględniając informacje z kilku sąsiednich markerów, haplotypy zachowują ogólną strukturę i bardziej bezpośrednio odzwierciedlają prawdziwe polimorfizmy.

Najprostszym sposobem sprawdzenia, czy istnieje związek między haplotypem a stanem choroby, jest traktowanie każdego haplotypu jako osobnej kategorii, prawdopodobnie przez połączenie wszystkich rzadkich haplotypów z dodatkową klasą. Proces ten zwykle przeprowadza się w dwóch etapach: najpierw szacuje się częstotliwości haplotypów, następnie oblicza się standardowy test dla powiązania, na przykład wskaźnik wiarygodności statystycznej. Aby poradzić sobie z rozdętymi statystykami testu z powodu oceny haplotypu, rozkład testu pod zerem można uzyskać przez losowe przetasowanie stanu chorobowego, a następnie ponowną ocenę częstotliwości haplotypów.

Chociaż to podejście umożliwia ocenę ogólnego związku między haplotypami i chorobą, nie wyciąga wniosków na temat skutków określonych haplotypów lub cech haplotypów. Aby rozwiązać te problemy, wiele testów specyficznych efektów haplotypu jest opartych na oszacowanym prawdopodobieństwie choroby, gdzie stan choroby jest uważany za wynik, a haplotypy wprowadzają model regresji jako współzmiennymi. Pacjenci z niejednoznacznymi haplotypami są umieszczani przez obliczanie oczekiwanej wartości współzmiennych z powodu genotypów osobnika, wykorzystując spodziewane częstotliwości haplotypów.

populacyjna metoda statystyczna genetyki

Populacja-metoda statystyczna do badania genetyki człowieka

W populacjach ludzkich utworzonych przez względnie niedawne mieszanie się pewnych grup przodków, takich jak Afroamerykanie, zdolność transmisji rozciąga się na większe odległości niż w innych, mniej heterogenicznych populacjach. W przypadku chorób, które różnią się częstością występowania pomiędzy dwiema lub więcej populacjami przodków, ta szeroka przepustowość może być wykorzystana do poszukiwania genetycznych wariantów odpowiedzialnych za różnice etniczne w ryzyku choroby.

Głównym punktem jest to, że w mieszanych populacjach markery z miejscem odpowiedzialnym za różnice etniczne w ryzyku choroby będą miały większy niż oczekiwano odsetek przodków z populacji wysokiego ryzyka. Mapowanie genów można przeprowadzić, wyszukując wąskie regiony genomowe, które wykazują nadmierną proporcję rodowodów z jednej z populacji składowych przodków w metodologii nazywanej mapowaniem zanieczyszczeń.

Przynależność do populacji w każdym locus dla wszystkich podmiotów powinna być statystycznie oceniona za pomocą typowych markerów. Ogólnie przyjęty probabilistyczny model opisujący zmienność stochastyczną rodowodu sugeruje, że chromosomy mogą być reprezentowane przez ogólne bloki generujące, punkty przerwania między sąsiednimi blokami, występujące jako proces Poissona i przejścia między sąsiednimi blokami przodków kontrolowanymi przez łańcuch Markowa. Według tego modelu skonstruowano kilka metod wyprowadzania w celu oceny pochodzenia chorych chromosomów i wykrycia reprezentowanych populacji przodków.

Badania modelowe i obliczenia analityczne pokazują, że porównanie zanieczyszczeń ma kilka zalet w porównaniu z ustalonymi podejściami do mapowania populacyjnego, na przykład do wyszukiwania całego genomu potrzeba znacznie mniej znaczników i jest on mniej podatny na wpływ heterogeniczności alleli.