Популацијско-статистичка метода проучавања генетике: суштина и значај

22. 4. 2019.

Последњих година, на разним нивоима сложености, представљене су веома различите статистичке методологије за анализу података о генотипу и идентификовање генетичких варијација које могу бити одговорне за повећање осетљивости на болести. Шта је популационо-статистичка метода за проучавање генетике? Која је њена суштина и значај у проучавању наследности?

статистички метод заснован на популацији у проучавању улоге наследности

Цомпутатионал Биологи Типе

Статистичка генетика је научна област која се односи на развој популационо-статистичких метода за добијање генетичких података. Овај термин се најчешће користи у контексту. људска генетика. Истраживања у овој области обично укључују развој теорије или методологије за подршку истраживању у једној од три међусобно повезане области:

  • популациона генетика - проучавање еволутивних процеса који утичу на генетску варијабилност између организама.
  • генетичка епидемиологија - проучавање утицаја гена на болест.
  • квантитативна генетика - проучавање утицаја гена на "нормалне" фенотипе.

Статистичка генетика тежи блиској сарадњи са генетичарима, молекуларним биолозима, клиничарима и биоинформатицима. Статистичка генетика је врста рачунарске биологије.

статистичка метода за проучавање људске генетике заснована на популацији

Предмет студије

Популацијска генетика проучава генетичку структуру популација и њихов генетски фонд. Он такође покрива питања која се односе на интеракцију фактора који одређују постојаност и промену структуре генома. Шта је популација? Ово је збирка појединаца исте врсте који се слободно укрштају и заузимају одређену територијалну област, а имају и заједнички генски базен (генетски фонд) који прелази из генерације у генерацију.

Популацијско-статистичка метода генетике користи се у проучавању насљедних болести, измјени нормалних и патолошких гена, генотипова и фенотипа у популацијама различитих локалитета, земаља и градова. Која је његова јединственост? Суштина популационо-статистичке методе је у томе што је она усмјерена на проучавање образаца ширења насљедних болести у популацијама које се разликују по својој структури. Проучавамо могућност предвиђања њиховог понављања у будућим генерацијама.

статистичка метода заснована на популацији и њено значење

Популацијско-статистичка метода и њена вриједност

Статистичка генетичка анализа квантитативних особина у великим педигреима је огроман рачунски задатак због потребе да се узме у обзир независност међу рођацима. Са све већом свесношћу да варијанте ретких секвенци могу бити важне у квантитативним људским варијацијама, студије херитабилности и асоцијације које укључују велике педигрее ће се повећати у учесталости због веће вероватноће да се виде више копија ретких варијанти међу сродним појединцима.

Стога је важно имати статистичке поступке генетског тестирања који користе све расположиве информације за прикупљање доказа у вези са генетским асоцијацијама. Оптимално тестирање асоцијације на фенотип је повезано са тачним израчунавањем статистике односа истине, које захтевају реверзију потенцијално великих матрица. У контексту комбиновања целокупне секвенце генома, таква калкулација може бити нетачна.

статистичка метода за проучавање људске генетике заснована на популацији

Статистичке методе генетичке анализе

У вези са напретком у лабораторијским технологијама, популационо-статистичка метода и генетски епидемиолошки приступи комплексним болестима брзо се мењају како би се носили са огромним генетским подацима. Како се лабораторијске технологије мењају, постало је могуће генерисати потпуније генетске податке о геномској генерацији са целокупним подацима секвенце генома.

Било је проблема са вишеструким тестирањем и појавом ретких генетских варијанти које су биле ограничене на традиционалне статистичке методе, што је довело до развоја метода за ретку варијанту анализе. Садашња истраживања фокусирају се не само на анализу појединих генетских варијанти, већ и на анализу неколико генетских варијанти, посебно коришћењем мрежних метода.

суштина статистичке методе засноване на популацији

Брз развој генетике

Истраживања у области генетике су се убрзано развијала, почевши од студија појединих области до завршетка истраживања генома великих размера. И премда је проучавање генетичких удружења спроведено већ дуги низ година, чак и за најједноставније анализе постоји мали консензус о најприкладнијим статистичким процедурама.

Статистичка генетика је подручје конвергенције генетике и квантитативне анализе. Током протеклих неколико година, доживјела је драматичну промјену парадигме, од претежно теоретског предмета у којем постоји мало могућности за емпиријске податке до строго дисциплиниране, гдје постојање великих спремишта генетских података омогућује истраживачима да генерирају и истражују нове знанствене хипотезе.

Профитабилна технологија

С обзиром на релативно економичну технологију са високим протоком генотипизације, сада је могуће истражити етиологију сложених болести, биолошких процеса кроз које се ДНК насљеђује и еволуцијске повијести људске популације. Са медицинске тачке гледишта, напредак коришћења популационо-статистичког метода у проучавању улоге наслеђа је у развоју и анализи фармакогенетичких студија, односно студија у којима је генетска варијабилност у корелацији са одговором на лекове.

То у коначници може довести до развоја приступа „персонализиране медицине“ у здравству. Наравно, за сваку од ових области истраживања, потребне су специјализоване методе закључивања и рачунања. Овај преглед популационо-статистичких метода у генетици је ограничен на мапирање асоцијација: моћна методологија за коју се сматра да помаже у разумијевању генетских основа људских болести и других фенотипова од интереса.

Уместо покушаја да се истакну методе поређења са асоцијацијама, изложеност се сужава тако да укључује само приступе за анализу података за истраживање у случају болести или за ситуације у којима су доступни само болесни људи. Сврха овог чланка је да позове читаоца на не-технички обилазак низа одабраних популационо-статистичких генетичких метода које се тренутно користе за мапирање гена.

статистичка метода популације

Харди-Веинберг Ацт

Главни примјер популацијско-статистичке методе је Харди-Веинберг-ов закон. Заснива се на обрасцу који су 1908. године открили математичар из Енглеске Ј. Харди и доктор В. Веинберг из Њемачке да би развили савршену популацију. Закон је стога добио име по два имена. Да би становништво било идеално, неопходни су следећи услови:

  1. Организми се морају слободно прећи.
  2. Нема феномена селекције и мутације.
  3. Миграциони процеси, како спољашњи тако и унутрашњи, су ограничени.
  4. Доминантни хомозиготи, хетерозиготи и рецесивни хомозиготи се наслеђују непромењени.

Савршен баланс може бити узнемирен бројним факторима, укључујући уско повезане бракове, мутације, селекцију, миграције и друго. Харди-Веинберг Ацт се сматра основом за разматрање генетских трансформација које се јављају у природним и вештачки створеним популацијама биљака, животиња и људи.

Принципи удруживања

Посебна карактеристика дизајна случаја-контроле је да су субјекти укључени у узорак насумично одабрани из дате популације према статусу болести ретроспективно. Генетске композиције појединаца који припадају двема групама, случајевима и контролама, упоређују се у нади да њихове разлике у неким уским регионима генома могу послужити као узрочно објашњење статуса болести. Међу различитим типовима генетичких маркера, полиморфизми појединачних нуклеотида (СНП) играју централну улогу у мапирању комплексних болести. За читав људски геном, постоји најмање 10 милиона СНП-ова са фреквенцијом> 1%, за коју се сматра да чини око 90% генетичке варијације особе.

Основни концепт у мапирању асоцијације је веза неравнотежа између генетског маркера и локуса који утиче на испитивану особину. Он обухвата одступање од пробабилистичке независности међу алелима или генетским маркерима. На пример, неравнотежа у вези између два алела, као што су А и Б, може се квантификовати мерењем разлике између п АБ , вероватноће посматрања АБ хаплотипа (тј . Линеарног распореда два алела на истом хромозому наслеђеног као један ентитет) и п А п Б , где су п А и п Б вероватноће посматрања А и Б алела . Међутим, у већини случајева, хаплотипови нису директно доступни, а њихова учесталост би требало да буде врло вероватно одређена из података о генотипу.

Методе излаза, засноване на варијантама алгоритма минимизације очекивања, итеративне технике за добијање максималних процена вероватноће у моделима података који недостају, популаран су избор за добијање фреквенција узорка хаплотипа. Документована је тачност алгоритма за минимизирање очекивања за процену хаплотипских фреквенција за различите симулационе шеме, како за фреквенцију алела тако и за многе друге факторе. Скорашњи развој користи опсервацију у којој, у кратким регионима, хаплотипови у популацији имају тенденцију да се групишу у групе, и ова кластеризација тежи да варира дуж хромозома.

Добијени обрасци генетске варијације могу се добро описати скривеним Марковљевим моделима, а процјене параметара направљене су помоћу алгоритма за извођење хаплотипске фазе, као и недостајућих података о генотипу. Алтернативно, мера композитне генотипске неравнотеже може се израчунати директно из генотипских података билука, уз претпоставку случајног парења, што одговара горе поменутом алелном меридијану. Бројни други заједнички коефицијенти и њихова својства су проучавани и аналитички и кроз моделирање.

Метода близанаца у проучавању генома

Обим популационо-статистичког и твин метод укључују проучавање образаца наслеђивања карактера у паровима близанаца. Предложен од стране научника Халтона 1875. године, овај метод је у почетку кориштен за процјену улоге насљедности и околине у развоју људских менталних својстава. Сада се нашироко користи у проучавању наслеђа и варијабилности нормалних и патолошких знакова. Може се користити за идентификацију насљедне природе одређене особине, одређивање пенетрације алела и процјену вањских фактора који утјечу на тијело.

примери статистичке методе засноване на популацији

Суштина двоструке методе:

  • Код различитих група близанаца се упоређује иста особина, узима се у обзир сличност или разлика њихових генотипова.
  • Код монозиготних близанаца постоји потпуни генетски идентитет. Њихово поређење у условима различитог постембрионског развоја омогућава откривање знакова који су настали услед спољне средине.

Проучавање генома у популационо-статистичком метод истраживања људске генетике омогућава свеобухватнију претрагу генетских фактора ризика. У блиској будућности, ове студије ће бити јефтиније и стога приступачније. Са статистичке и рачунарске тачке гледишта, студије генома као целине нуде не-тривијалне проблеме повезане, између осталог, са веома великим бројем маркера који треба да буду укључени у анализу, у поређењу са обично мањим величинама узорака.

опсега статистичке популације и двоструке методе

Развој нових аналитичких метода

Питање које изазива много дискусија и подстиче развој нових аналитичких метода је да ли су комплексне болести узроковане једном заједничком опцијом или многим опцијама које имају мале ефекте. Уобичајена хипотеза о заједничкој болести указује да ће генетски ризик од заједничких болести често бити узрокован алелима који узрокују болест, а који се налазе на релативно високим фреквенцијама. До сада су докази у његову корист били ограничени.

Разумљиво је претпоставити да се обичне болести контролишу сложенијим генетским механизмима које карактерише комбиновано деловање неколико гена, при чему сваки ген има само мали маргинални ефекат, вероватно зато што природна селекција уклања гене са већим ефектима. У овом случају, групе маркера треба тестирати заједно ради асоцијације, што се може урадити на два главна начина: групирање маркера заједно у генотипове са неколико локуса тако да је основна јединица статистичке анализе још увек индивидуална или кроз хаплотипове, чиме се ефективно удвостручује величина узорка.

Опште методе за хаплотипове

Уместо да се сваки маркер анализира одвојено, могуће је заједнички тестирати специфичне комбинације алелних варијанти у низу тесно повезаних маркера на истом хромозому, тј. Хаплотиповима. Укључујући информације из неколико сусједних маркера, хаплотипови задржавају укупну структуру и више директно одражавају истинске полиморфизме.

Најлакши начин да се провери да ли постоји веза између хаплотипа и статуса болести је да се сваки хаплотип третира као посебна категорија, могуће комбиновањем свих ретких хаплотипова у додатну класу. Овај процес се обично изводи у две фазе: прво, процењују се хаплотипске фреквенције, затим се израчунава стандардни тест за асоцијацију, на пример, однос вероватноће статистике. Да би се изашло на крај са надутом статистиком теста услед процене хаплотипа, дистрибуција теста испод нуле може се добити случајним мешањем стања болести и поновном проценом фреквенција хаплотипова.

Иако овај приступ омогућава да се процени укупна повезаност између хаплотипова и болести, не доносе се закључци о ефектима специфичних хаплотипова или хаплотипских особина. Да би се решили ови проблеми, бројни тестови специфичних ефеката хаплотипа заснивају се на процењеној вероватноћи болести, где се статус болести посматра као резултат, а хаплотипови уводе регресиони модел као коваријате. Субјекти са двосмисленим хаплотиповима су смештени израчунавањем очекиване вредности коваријабила због генотипова испитаника, користећи очекиване фреквенције хаплотипова.

статистичка метода генетике заснована на популацији

Популацијско-статистичка метода за проучавање људске генетике

У људским популацијама насталим релативно недавним мијешањем одређених група предака, као што су Афроамериканци, пријеносни капацитет се протеже на већим удаљеностима него у другим, мање хетерогеним популацијама. За болести које се разликују у преваленцији између двије или више популација предака, овај далекосежни пропусни опсег може се користити за тражење генетских варијанти одговорних за етничке разлике у ризику од болести.

Главна ствар је да ће у мјешовитим популацијама маркери са локусом одговорним за етничке разлике у ризику од болести имати већи од очекиваног удјела предака од високо ризичне популације. Мапирање гена може се извршити претраживањем уских геномских региона који показују прекомерне пропорције педигрееа из једне од конститутивних популација предака у методологији која се назива мапирање нечистоћа.

Чланство популације у сваком локусу за све субјекте треба статистички вредновати типичним маркерима. Општеприхваћени пробабилистички модел за описивање стохастичких варијација у педигреу сугерише да хромозоми могу бити представљени општим генерационим блоковима, са тачкама прекида између суседних блокова, који се јављају као Поиссонов процес, и прелази између суседних предака блокова контролисаних Марковљевим ланцем. Према овом моделу, конструисано је неколико метода извођења како би се проценило порекло оболелих хромозома и откриле заступљене популације предака.

Студије моделирања и аналитичке калкулације показују да поређење нечистоћа има неколико предности у поређењу са успостављеним приступима мапирању на основу популације, на пример, много мање маркера су потребни за тражење читавог генома и мање је подложно утицају алелне хетерогености.