Èññëåäîâàíèå âàðèàöèé ÷èñëà êîïèé (CNV) â ãåíîìå ó æåíùèí íà îñíîâàíèè äàííûõ ñåêâåíèðîâàíèÿ âíåêëåòî÷íîé ÄÍÊ ïëàçìû êðîâè

Ïîâòîðû â ãåíîìå êàê èñòî÷íèêè CNV. Ìåõàíèçìû ôîðìèðîâàíèÿ è êëàññèôèêàöèÿ CNV. Ïðîãðàììû, îñíîâàííûå íà "ãëóáèíå ðèäîâ", äëÿ îïðåäåëåíèÿ CNV ïðè ìàëîì ïîêðûòèè. Ãåíåðàöèÿ ñëó÷àéíûõ ëîêóñîâ äëÿ ïåðìóòàöèîííîãî àíàëèçà. Êàòàëîã âñåõ äåòåêòèðîâàííûõ CNV.

Ðóáðèêà Ìàòåìàòèêà
Âèä äèññåðòàöèÿ
ßçûê ðóññêèé
Äàòà äîáàâëåíèÿ 02.09.2018
Ðàçìåð ôàéëà 1,8 M

Îòïðàâèòü ñâîþ õîðîøóþ ðàáîòó â áàçó çíàíèé ïðîñòî. Èñïîëüçóéòå ôîðìó, ðàñïîëîæåííóþ íèæå

Ñòóäåíòû, àñïèðàíòû, ìîëîäûå ó÷åíûå, èñïîëüçóþùèå áàçó çíàíèé â ñâîåé ó÷åáå è ðàáîòå, áóäóò âàì î÷åíü áëàãîäàðíû.

Tåñòèðîâàíèå ðàáîòû èíñòðóìåíòà ïðîâîäèëîñü äëÿ 2-õ êîíòðîëüíûõ ãåíîìîâ. Âõîäíûå äàííûå: bam-ôàéë ñ èíäåêñîì, êîíòðîëüíûé bam-ôàéë ñ èíäåêñîì. Èíñòðóìåíò âûäàåò ÑNV ñ íîìåðîì õðîìîñîìû, êîîðäèíàòàìè, log2-îòíîøåíèåì, íîðìèðîâàííûì êîëè÷åñòâîì ðèäîâ äëÿ òåñòîâîãî è êîíòðîëüíîãî îáðàçöà.

QDNA-seq

R-ïàêåò, äîñòóïíûé â Bioconductor. Ðàáîòà ñ ýòèì ïðîãðàììíûì ïàêåòîì ïðåäñòàâëÿëà ñîáîé âûïîëíåíèå êîìàíä ñîãëàñíî îáùåé ñõåìå:

- çàãðóçêà àííîòàöèè äëÿ áèíîâ óêàçàííîãî ðàçìåðà: àííîòàöèÿ ñîäåðæèò èíôîðìàöèþ î ïðîöåíòå îïðåäåëåííûõ íóêëåîòèäîâ (íå N), GC-ñîñòàâå, ñðåäíåé êàðòèðóåìîñòè 50-ìåðîâ ñ 2 âîçìîæíûìè íåñîâïàäåíèÿìè, ïðîöåíò ïåðåñå÷åíèÿ ñ «÷åðíûì ñïèñêîì» èç ïðîåêòà ENCODE è äð.

- çàãðóçêà bam-ôàéëà è ïîäñ÷åò ÷èñëà ðèäîâ: êîëè÷åñòâî ðèäîâ ïîñëå ôèëüòðàöèè ïî óìîë÷àíèþ ìîæíî âèçóàëèçèðîâàòü.

êàðòèíî÷êà

- ôèëüòðàöèÿ êîëè÷åñòâà ðèäîâ ïî ïåðåñå÷åíèþ ñ «÷åðíûì ñïèñêîì», êàðòèðóåìîñòè, ó÷åò âûáðîñîâ è ïîëîâûõ õðîìîñîì

- îöåíêà êîððåêöèè ïî GC-ñîñòàâó è êàðòèðóåìîñòè è åå ïðèìåíåíèå äëÿ ïîäñ÷åòà ÷èñëà êîïèé (íà âûõîäå ïîëó÷àåì îáúåêò QDNAseqCopyNumbers)

- íîðìàëèçàöèÿ áèíîâ, ñãëàæèâàíèå è óäàëåíèå âûáðîñîâ

- ñåãìåíòàöèÿ ïðîôèëÿ ñ ïîìîùüþ ïðîãðàììû DNAcopy è ïîñëåäóþùàÿ íîðìàëèçàöèÿ

- îïðåäåëåíèå CNV

Ïî óìîë÷àíèþ îïðåäåëåíèå CNV íà çàâåðøàþùåì ýòàïå ïðîèñõîäèò ñ ïîìîùüþ âñòðîåííîãî R-ïàêåò CGHcall, îäíàêî â íåêîòîðûõ ñëó÷àÿõ, íàïðèìåð, êîãäà î÷åâèäíî çàøóìëåíèå äàííûõ îò ïîëîâûõ õðîìîñîì, àâòîðû ðåêîìåíäóþò èñïîëüçîâàòü ìåòîä cutoff, êîòîðûé ïðîñòî çàäàåò ãðàíèöû log2-îòíîøåíèÿ äëÿ îïðåäåëåíèÿ äóïëèêàöèé, äåëåöèé è àìïëèôèêàöèé.  äàííîé ðàáîòå ïðèìåíÿëñÿ èìåííî ýòîò ìåòîä.

Ïðîãðàììà ïîçâîëÿåò ëåãêî âèçóàëèçèðîâàòü ìåäèàíó ÷èñëà ðèäîâ (êàê ôóíêöèþ GC- ñîñòàâà è êàðòèðóåìîñòè), ãðàôèê çàøóìëåííîñòè êàê ôóíêöèþ îò ãëóáèíû ïîêðûòèÿ è ïðîôèëü ÷èñëà ïîñëå êîððåêöèè.

Ïðåäâàðèòåëüíîå òåñòèðîâàíèå QDNAseq ïîêàçàëî ëó÷øèå ðåçóëüòàòû (òàáëèöû 1, 2) ïî ñðàâíåíèþ ñ äðóãèìè èíñòðóìåíòàìè. Äëÿ äàëüíåéøåãî ïðèìåíåíèÿ ýòîé ïðîãðàììû áûë íàïèñàí R-ñêðèïò, êîòîðûé îïðåäåëÿåò ÑNV, óñòîé÷èâûå ê èçìåíåíèþ âåëè÷èíû îêíà.

 äàííîé ðàáîòå ïðîâîäèëñÿ ïîèñê CNV äëÿ òðåõ ðàçðåøåíèé: 15, 30, 50 êá. CNV ñ÷èòàëàñü èñòèííîé, åñëè îíà áûëà çàôèêñèðîâàíà äëÿ âñåõ òðåõ ðàçðåøåíèé, ïðè ýòîì äîñòàòî÷íî áûëî, ÷òîáû ïåðåñå÷åíèå ãðàíèö CNV äëÿ òðåõ ðàçðåøåíèå áûëî áîëüøå íóëÿ. Ïî óìîë÷àíèþ êîëè÷åñòâî áèíîâ, ïîäòâåðæäàþùèõ âàðèàöèþ (êîë-âî áèíîâ â ñåãìåíòå), áûëî íå ìåíåå 3-õ. Ò.î. èññëåäîâàíèå ïðîâîäèëîñü äëÿ CNV ñ ðàçìåðîì áîëåå 60 êá. Ãðàíèöû îïðåäåëÿëèñü ïî 15êá-ðàçðåøåíèþ. Àíàëèç ïðîâîäèëñÿ äëÿ àóòîñîì, ò. å. â êîððåêöèè íå ó÷èòûâàëèñü äàííûå äëÿ Õ-õðîìîñîìû. Òàêæå äëÿ 100 îáðàçöîâ äîïîëíèòåëüíî áûë ïðîâåäåí ðàñ÷åò ñ Õ-õðîìîñîìîé.

QDNAseq ïðåäëàãàåò ðàçëè÷íûå âàðèàíòû ïðåäñòàâëåíèÿ ðåçóëüòàòîâ (ôîðìàòû bed, seg, vcf, igv). Íàèáîëåå óäîáíûì ïîêàçàëñÿ ôîðìàò seg c èíôîðìàöèåé î õðîìîñîìå, ïîëîæåíèè íà÷àëà è êîíöà CNV, çíà÷åíèåì log2-ratio, êîëè÷åñòâîì áèíîâ â ñåãìåíòå. CNV c log2-îòíîøåíèåì áîëåå 0.49 ñ÷èòàëèñü äóïëèêàöèåé, ìåíåå -0,98 - äåëåöèåé.

2.3 Ñðàâíåíèå ðåçóëüòàòîâ ðàáîòû DWAQseq, cn.MOPS è QDNAseq íà áîëüøîì êîëè÷åñòâå îáðàçöîâ

 êà÷åñòâå îñíîâíîé ïðîãðàììû, èñïîëüçóåìîé äëÿ ïîèñêà CNV â ïîïóëÿöèè, áûëà âûáðàíà ïðîãðàììà QDNAseq. DWAC-seq è ñn.MOPS òàêæå ïîêàçàëè íàëè÷èå èçâåñòíîé äóïëèêàöèè ïðè íå áîëüøîì îáùåì êîëè÷åñòâå äåòåêòèðîâàííûõ CNV (òàáëèöà 2). Ðàñ÷åòû ñ ïîìîùüþ ýòèõ ïðîãðàìì áûëè òàêæå ïðîâåäåíû íà 235 îáðàçöàõ, â êîòîðûõ QDNAseq îïðåäåëèë 123 CNV íà òðåõ ðàçðåøåíèÿõ. Äëÿ DWAC-seq â êà÷åñòâå êîíòðîëüíîãî áûë èñïîëüçîâàí ãåíîì ñ ïîêðûòèåì 1.2õ. Äëÿ cn.MOPS âñå îáðàçöû áûëè ðàçáèòû ñëó÷àéíûì îáðàçîì íà 5 ãðóïï ñ êîëè÷åñòâîì 46-48 øò. Ñîîòâåòñòâåííî ïîèñê CNV ïðîâîäèëñÿ â 5 ãðóïïàõ ñ ðàçðåøåíèåì 300 êá.

2.4 Ãåíåðàöèÿ ñëó÷àéíûõ ëîêóñîâ äëÿ ïåðìóòàöèîííîãî àíàëèçà

Äëÿ ñðàâíåíèÿ ïîëó÷åííûõ CNV c áàçîé äàííûõ DGV áûëà èñïîëüçîâàíà ðàíåå íàïèñàííàÿ ïðîãðàììà (Python), ãåíåðèðóþùàÿ ñëó÷àéíûå ëîêóñû çàäàííîãî ðàçìåðà. Íà âõîä ïîäàåòñÿ íàáîð ÷èñåë, ñîîòâåòñòâóþùèõ äëèíàì CNV, íà âûõîäå ïîëó÷àåì íàáîð êîîðäèíàò ëîêóñîâ, ðàçáðîñàííûõ ñëó÷àéíûì îáðàçîì ïî ãåíîìó, â bed-ôîðìàòå. Ñëó÷àéíûå ëîêóñû ìîäåëèðóþòñÿ áåç ïåðåñå÷åíèÿ. Ó÷èòûâàÿ òî, ÷òî QDNAseq íå îïðåäåëÿåò CNV â ó÷àñòêàõ ãåíîìà, âõîäÿùèõ â «÷åðíûé ñïèñîê», ñëó÷àéíûå ëîêóñû ìîäåëèðîâàëèñü òàêæå áåç ïåðåñå÷åíèÿ ñ íèì.

Îïðåäåëåíèå ïåðåñå÷åíèÿ ñëó÷àéíûõ ôðàãìåíòîâ ãåíîìà ñ êîîðäèíàòàìè CNV èç áàçû DGV ïðîâîäèëîñü ñ ïîìîùüþ ïàêåòà bedtools (ïîäïðîãðàììà intersect), êîòîðàÿ èñïîëüçóåòñÿ äëÿ èññëåäîâàíèÿ ïðîñòðàíñòâåííîé êîððåëÿöèè ãåíîìíûõ äàííûõ â âèäå çàäàííûõ èíòåðâàëîâ. Äàëåå áûëî ïîñ÷èòàíî ñóììàðíîå ïåðåñå÷åíèå. Ãèñòîãðàììà ðàñïðåäåëåíèÿ ñóììàðíîé äëèíû ïåðåñå÷åíèÿ êîîðäèíàò CNV èç DGV gold standart ñî ñëó÷àéíûìè ôðàãìåíòàìè áûëà ïîñòðîåíà íà îñíîâå 1000 ñèìóëÿöèé (ðèñ. 17, 18). Àíàëèç ïðîâîäèëñÿ îòäåëüíî äëÿ äåëåöèé è äóïëèêàöèé.

2.5 Àííîòàöèÿ ïîëó÷åííûõ ðåçóëüòàòîâ

Àííîòàöèÿ ñåãìåíòîâ ïðîâîäèëàñü íà îñíîâå èíôîðìàöèè èç áàçû äàííûõ DGV. Òàêæå äëÿ ïîñëåäóþùåãî ñðàâíåíèÿ áûëè ðàññìîòðåíû ðåçóëüòàòû ïîèñêà CNV â ðàìêàõ 3 ôàçû ïðîåêòà 1000Genomes, èç ñïèñêà CNV áûëè îòôèëüòðîâàíû òðàíñïîçîíû - Alu-ïîâòîðû, LINE è SINE ýëåìåíòû, CNV íà ìèòîõîíäðèàëüíîé ÄÍÊ, èíâåðñèè è òðàíñëîêàöèè, òàê êàê QDNAseq íà èìåþùèõñÿ äàííûõ ÍÈÏÑ íå ïîçâîëÿë îïðåäåëÿòü ïîäîáíûå ñòðóêòóðíûå ýëåìåíòû ãåíîìà.

Äëÿ àíàëèçà ïîâòîðîâ â ó÷àñòêàõ, ôëàíêèðóþùèõ äåëåöèþ íà õðîìîñîìå 8 â ïîçèöèÿõ 39240000-39400000, èñïîëüçîâàëñÿ RepeatMaster. Ïîñêîëüêó ðàçðåøàþùàÿ ñïîñîáíîñòü QDNAseq íà èìåþùåìñÿ ïîêðûòèè ñîñòàâèëà 15 êá, ïîèñê ïîâòîðîâ ïðîâîäèëñÿ êàê äëÿ ãðàíèö, ïîêàçàííûõ QDNAseq, òàê è äëÿ ãðàíèö, óêàçàííûõ â DGV gold standart. Ñîîòâåòñòâóþùèå ðåãèîíû ïîèñêà ïîâòîðîâ: 39220000-39240000 è 39390000-39405000 ïî QDNAseq è 39190000-39215000 è 39380000-39400000 ïî DGV gold standart. Äëÿ ëîêàëüíîãî âûðàâíèâàíèÿ ñ öåëüþ íàõîæäåíèÿ ó÷àñòêîâ ñ íàèáîëüøåé ãîìîëîãèåé ïðèìåíÿëàñü ïðîãðàììà EMBOSS water.

Ãëàâà 3. Ðåçóëüòàòû

3.1 Òåñòèðîâàíèå ðàçëè÷íûõ èíñòðóìåíòîâ äëÿ îïðåäåëåíèÿ CNV íà ìàëîì ïîêðûòèè

Ïðåäâàðèòåëüíîå òåñòèðîâàíèå èíñòðóìåíòîâ íà òðåõ ðàçðåøåíèÿõ (30, 100 è 1000 êá) ïðîâîäèëîñü íà ãåíîìàõ ñ èçâåñòíîé äåëåöèåé (48 Má) è äóïëèêàöèåé (45 Ìá). Êîëè÷åñòâî ÷òåíèé ñîîòâåòñòâåííî 1,5 è 1,3 ìëí. Ñn.MOPS è DWAQ-seq õóæå âñåãî ñïðàâèëèñü ñ çàäà÷åé, DWAQ-seq îïðåäåëèë CNV â ñîñòàâå íåñêîëüêèõ ñåãìåíòîâ, ò.å. ñëàáûì ìåñòîì ÿâëÿåòñÿ àëãîðèòì ñåãìåíòàöèè, èñïîëüçîâàííûé íà çàâåðøàþùåì ýòàïå. Êîëè÷åñòâî CNV â ñðåäíåì íà îäíîãî ÷åëîâåêà îòëè÷àåòñÿ â ðàçíûõ èññëåäîâàíèÿõ è çàâèñèò îò ðàçðåøàþùåé ñïîñîáíîñòè ìåòîäà äåòåêöèè, îäíàêî ïðè õîðîøåì ðàçðåøåíèè îíî ñîñòàâëÿåò íå áîëåå 20 [50], â äðóãîì èññëåäîâàíèè ïîêàçàíà 1-2 CNV ïðè ñðåäíåé ïðîòÿæåííîñòè 200 êá [9]. Ïîýòîìó ìíîæåñòâî äåòåêòèðîâàííûõ CNV ìîæíî ðàññìàòðèâàòü êàê ïðèçíàê ëîæíîïîëîæèòåëüíûõ ðåçóëüòàòîâ. Äëÿ îáîèõ èíñòðóìåíòîâ õàðàêòåðíî áîëüøîå êîëè÷åñòâî äåòåêòèðîâàííûõ CNV. Âîçìîæíî, ïëîõèå ðåçóëüòàòû ðàáîòû cn.MOPS (òàáëèöà 1) ñâÿçàíû ñ òåñòèðîâàíèì íà ãåíîìàõ ñ ðàçíûì ïîêðûòèåì (12 ñ 5-6 ìëí ðèäîâ è 2 ñ 1,3 è 1,5 ìëí ðèäîâ). Äëÿ DWAQ-seq òàêæå ïîêðûòèå (˜0,08x) íèæå, ÷åì íåîáõîäèìûé ìèíèìóì, çàÿâëåííûé ðàçðàáîò÷èêàìè (0,23x).

CNVnator è XCAVATOR äåòåêòèðîâàëè ìíîæåñòâî CNV, â òîì ÷èñëå èçâåñòíûå. Íà ìàëîì ðàçðåøåíèè (1Má ) XCAVATOR îïðåäåëèë òîëüêî îäíó êðóïíóþ ÑNV â îäíîì îáðàçöå, íî íå ñðàáîòàë íà äðóãîì.  öåëîì, âîçìîæíî, ïðè óìåíüøåíèè âåëè÷èíû áèíà äî 500-700 XCAVATOR ìîæåò äåòåêòèðîâàòü êðóïíûå CNV ñ ìèíèìàëüíûì êîëè÷åñòâîì ëîæíîïîëîæèòåëüíûõ. Äëÿ ïðîâåðêè íåîáõîäèìî äîïîëíèòåëüíîå òåñòèðîâàíèå. QDNAseq ïîêàçàë íàèìåíüøåå êîëè÷åñòâî CNV, îäíàêî íå âåðíî îïðåäåëèë ãðàíèöû â îäíîì îáðàçöå. C äðóãîé ñòîðîíû, ïðè íàèìåíüøåì îáùåì êîëè÷åñòâå äåòåêòèðîâàííûõ CNV îí îïðåäåëèë òàêæå âûñîêî÷àñòîòíóþ äåëåöèþ äëÿ ðàçìåðà áèíà 30 êá.

Òàáëèöà 1

èíñòðóìåíò

âåëè÷èíà áèíà, êá

NA05067

NA14164

êîë-âî cnv

Äóïëèêàöèÿ íà õðîì. 9, 45 Ìá

Äåëåöèÿ íà õðîì. 8, 200 êá

êîë-âî cnv

Äåëåöèÿ íà õðîì. 13, 48 Má

QDNAseq

30

3

71 Ìá

äà

3

äà

100

1

141 Ìá

-

1

äà

1000

1

äà

-

1

äà

XCAVATOR

30

56

äà

äà

55

äà

100

56

äà

äà

36

äà

1000

íå ñðàáîòàë

1

äà

CNVnator

30

56

äà, â ñîñòàâå íåñêîëüêèõ ñåãìåíòîâ

äà

46

äà

100

32

äà

-

27

äà

1000

18

äà

-

19

äà

Cn.mops

30

169

íåò

äà

88

íåò

100

61

íåò

-

53

íåò

1000

1

3 Ìá

-

0

DWAQ-seq

ïîêðûòèå 1.2x

39

÷àñòè÷íî

-

32

íåò

ïîêðûòèå 2.4x

100

÷àñòè÷íî, â ñîñòàâå íåñêîëüêèõ ñåãìåíòîâ

-

91

äà, â ñîñòàâå íåñêîëüêèõ ñåãìåíòîâ

Îáðàçöû äëÿ äàëüíåéøåãî èññëåäîâàíèÿ ñîäåðæàò îêîëî 6 ìëí ðèäîâ. Ïîýòîìó âàæíî áûëî ïðîòåñòèðîâàòü èíñòðóìåíòû èìåííî íà òàêîì ïîêðûòèè.  îòñóòñòâèå ãåíîìîâ ñ èçâåñòíîé CNV è êîëè÷åñòâîì ðèäîâ 6 ìëí, äëÿ òåñòèðîâàíèÿ áûë âûáðàí ãåíîì ñ ëîêàëüíûì ïîâûøåíèåì â ïîêðûòèè, óñëîâíî ðàññìàòðèâàåìîì â êà÷åñòâå äóïëèêàöèè.

Òàáëèöà 2

Èíñòðóìåíò

Êîë-âî CNV

Äåòåêöèÿ ïðåäïîëàãàåìîé äóïëèêàöèè íà õðîì. 4

Âðåìÿ ðàáîòû, ìèí

QDNAseq

1

Äà

3

XCAVATOR

54

Äà

20

CNVnator

42

Äà

47

Cn.MOPS

7

Äà

15

DWAQ-seq

4

äà

31

Âñå èíñòðóìåíòû äåòåêòèðîâàëè ïðåäïîëàãàåìóþ äóïëèêàöèþ (òàáëèöà 2). Äëÿ CNVnator è XCAVATOR óâåëè÷åíèå ïîêðûòèÿ ïî÷òè â 4 ðàçà íå çíà÷èòåëüíî ïîâëèÿëî íà îáùåå êîëè÷åñòâî CNV, ïîýòîìó îíè íå ïðèìåíÿëèñü â äàëüíåéøåì àíàëèçå. Êðîìå òîãî, äàííûå èíñòðóìåíòû èìåþò íåóäîáíûé èíòåðôåéñ, òðåáóþò îòäåëüíûõ âû÷èñëåíèé äëÿ êàæäîé õðîìîñîìû (CNVnator) èëè ïîäãîòîâêè ñïåöèàëüíûõ òåêñòîâûõ ôàéëîâ íà íåñêîëüêèõ ýòàïàõ ðàáîòû è ïðåäâàðèòåëüíîãî ïåðåâîäà bam-ôàéëîâ â ôîðìàò BigWig (XCAVATOR). Ðàçðàáîò÷èêè ïðîãðàììû DWAC-seq òàêæå òåñòèðîâàëè CNVnator íà ãåíîìå ñ êðàéíå íèçêèì ïîêðûòèåì è òàêæå îòìå÷àþò íåêîððåêòíûå ðåçóëüòàòû ðàáîòû. [34] Äëÿ DWAQ-seq è cn.MOPS îáùåå êîëè÷åñòâî CNV çàìåòíî ñîêðàòèëîñü (òàáëèöà 2). Íàèìåíüøåå êîëè÷åñòâî CNV ïðè äåòåêöèè ïðåäïîëàãàåìîé äóïëèêàöèè ïîêàçàë QDNAseq. Áûñòðåå âñåãî ñ çàäà÷åé ñïðàâèëñÿ cn.MOPS (çà 15 ìèíóò îáðàáîòàíî 12 ãåíîìîâ) è QDNAseq.

Òàêæå QDNAseq áûë çàïóùåí íà ýòîì æå îáðàçöå ñ ìåíüøåé âåëè÷èíîé áèíà, äëÿ òîãî ÷òîáû ïðîâåðèòü ðàçðåøàþùóþ ñïîñîáíîñòü. Íà âåëè÷èíå áèíà 15, 30 è 50 êá áûëî ïîëó÷åíî 7, 4, 3 CNV. 3 CNV áûëè äåòåêòèðîâàíû âî âñåõ ñëó÷àÿõ, îäíà èç êîòîðûõ ïðèõîäèëàñü íà ïðåäïîëàãàåìóþ äóïëèêàöèþ, à âòîðàÿ íà âûñîêî÷àñòîòíóþ äåëåöèþ. Äîïîëíèòåëüíûå èññëåäîâàíèÿ íà äðóãèõ îáðàçöàõ ïîêàçûâàþò, ÷òî â ðåäêèõ ñëó÷àÿõ CNV, äåòåêòèðîâàííàÿ íà 50êá, íå ïîêàçàíà íà 15. Ïîýòîìó ïîñëåäóþùèé àíàëèç îáðàçöîâ ïðîâîäèëñÿ íà òðåõ ðàçðåøåíèÿõ.

Äëÿ ïðîãðàììû cn.MOPS âåëè÷èíà áèíà, íàïðîòèâ, áûëà óâåëè÷åíà, äëÿ òîãî ÷òîáû ïðîñëåäèòü èçìåíåíèå êîëè÷åñòâà äåòåêòèðîâàííûõ CNV. Ïðè âåëè÷èíå áèíà 200, 300, 400 êá êîëè÷åñòâî äåòåêòèðîâàííûõ ÑNV, â òîì ÷èñëå ïðåäïîëàãàåìàÿ äóïëèêàöèÿ, ñîñòàâèëî 2, 2, 1. Ò.å. ïðè ïðàâèëüíîì âûáîðå ðàçðåøåíèÿ cn.MOPS òàêæå äàåò ïðèåìëåìûå ðåçóëüòàòû.

QDNAseq è cn.MOPS ÿâëÿþòñÿ R-ïàêåòàìè, ëåãêî óñòàíàâëèâàþòñÿ è èìåþò óäîáíûé èíòåðôåéñ.

Ïðîãðàììà GROM-RD, çàÿâëåííàÿ ðàçðàáîò÷èêàìè êàê õîðîøî ðàáîòàþùàÿ íà ìàëîì ïîêðûòèè, íî íå ïðîòåñòèðîâàííàÿ íà ýêñòðåìàëüíî íèçêîì, îêàçàëàñü íå ïîäõîäÿùåé äëÿ ðåøåíèÿ äàííîé çàäà÷è. Ïîñëå âûâîäà íà ýêðàí èíôîðìàöèè î ïîêðûòèè ïðîãðàììà ïåðåñòàåò ðàáîòàòü.

 öåëîì QDNAseq äàåò âîçìîæíîñòü îïðåäåëÿòü CNV c íàèìåíüøèì êîëè÷åñòâîì ëîæíîïîëîæèòåëüíûõ è íàèëó÷øèì ðàçðåøåíèåì. Ýòà ïðîãðàììà áûëà âûáðàíà â êà÷åñòâå áàçîâîé äëÿ èññëåäîâàíèÿ CNV â ðîññèéñêîé ïîïóëÿöèè. Òàêæå ÷àñòü îáðàçöîâ (235) áûëà îáðàáîòàíà àëãîðèòìàìè cn.MOPS è DWAQ-seq.

Ðèñ. 11 Ïðîôèëü log2-ratio, ïîëó÷åííûé ïðîãðàììîé QDNAseq äëÿ îáðàçöà ñ äåëåöèåé íà õðîìîñîìå 13.

3.2 Àíàëèç CNV â ðîññèéñêîé ïîïóëÿöèè ó æåíùèí íà îñíîâå äàííûõ íåèíâàçèâíîé ïðåíàòàëüíîé äèàãíîñòèêè

Ïîñëå ïðåäâàðèòåëüíîãî òåñòèðîâàíèÿ QDNAseq ïðèìåíÿëñÿ äëÿ àíàëèçà 611 ãåíîìîâ æåíùèí. CNV ñ÷èòàëàñü èñòèííî-ïîëîæèòåëüíîé, åñëè îíà îïðåäåëÿëàñü íà òðåõ ðàçðåøåíèÿõ: 15, 30 è 50 êá. Îñíîâíûå ðàñ÷åòû áûëè ïðîâåäåíû áåç ó÷åòà X-õðîìîñîìû. Âñåãî áûëî âûÿâëåíî 243 CNV ó 214 ÷åëîâåê. Ñðåäè íèõ 19 óíèêàëüíàÿ äåëåöèÿ è 68 äóïëèêàöèè. Êðóïíûå äåëåöèè â îáùåì ñëó÷àå ÷àùå áûâàþò áîëåå ïàòîãåííûìè ïî ñðàâíåíèþ ñ äóïëèêàöèÿìè, ÷òî îáóñëàâëèâàåò èõ ìåíüøåå êîëè÷åñòâî â ãåíîìå è ïîäòâåðæäàåòñÿ ðåçóëüòàòàìè äðóãèõ èññëåäîâàíèé. [44, 45] Ñ äðóãîé ñòîðîíû, îáùåå êîëè÷åñòâî äåëåöèé ñîñòàâèëî 163, äóïëèêàöèé 89. Ïðè ýòîì ñóùåñòâåííàÿ ÷àñòü ñðåäè âñåõ äåëåöèé ïðèõîäèòñÿ íà îäíó ðàñïðîñòðàíåííóþ äåëåöèþ íà õðîìîñîìå 8.  òðåòüåé ôàçå ïðîåêòà 1000Genomes ÷àñòîòà äàííîé äåëåöèè äîñòèãàåò 44%. Áûëî ïîñòðîåíî ðàñïðåäåëåíèå äëèí CNV (ðèñ. 12). Ñðåäíåå çíà÷åíèå äëèíû CNV äëÿ äóïëèêàöèé áîëüøå, ÷åì äëÿ äåëåöèé (458±15 êá è 286±15 êá cîîòâåòñòâåííî), ÷òî òàêæå ìîæåò áûòü ñâÿçàíî ñ áîëüøåé ïàòîãåííîñòüþ ïîñëåäíèõ. Äëèíà íàèáîëüøåé è íàèìåíüøåé äóïëèêàöèè: 2025000 êá è 75000 êá.  óêàçàííîì äèàïàçîíå ðàñïðåäåëåíèå ïî ðàçìåðàì: 8,8% - ìåíåå 200êá, 61,7% - îò 200 äî 500 êá, 23,5% - îò 500 äî 1000 êá, 5,8% - áîëåå 1Ìá. Äëèíà íàèáîëüøåé è íàèìåíüøåé äåëåöèè: 1184999 êá è 135000 êá.  óêàçàííîì äèàïàçîíå ðàñïðåäåëåíèå ïî ðàçìåðàì: 47,3% - ìåíåå 200êá, 47,3% - îò 200 äî 500 êá, 0% - îò 500 äî 1000 êá, 5,2% - áîëåå 1Ìá. Áîëüøàÿ ÷àñòü CNV ïðåäñòàâëåíà ñèíãëòîíàìè: 85% èç âñåõ ÑNV (ïðåäïîëàãàåòñÿ, ÷òî êàæäàÿ ÑNV ó÷èòûâàåòñÿ 1 ðàç). Íà èìåþùèõñÿ äàííûõ ó 2 ÷åëîâåê äåòåêòèðîâàíî 3 ÑNV, ó 12 - 2 CNV, ó îñòàëüíûõ ïî îäíîé. Ñðåäíåå êîëè÷åñòâî CNV íà ÷åëîâåêà ñîñòàâèëî 0.4 ïðè ìåäèàíå ïðîòÿæåííîñòè îêîëî 380 êá.

Ðèñ12. Ðàñïðåäåëåíèå äëèí óíèêàëüíûõ äåëåöèé/äóïëèêàöèé (ââåðõó). Ðàñïðåäåëåíèå óíèêàëüíûõ äåëåöèé è äóïëèêàöèé ïî õðîìîñîìàì (âíèçó).

Ðàñïðåäåëåíèå äëèí äåëåöèé è äóïëèêàöèé äëÿ óíèêàëüíûõ ÑNV îòðàæàåò èõ ðàçíîîáðàçèå, òîãäà êàê àíàëîãè÷íîå ðàñïðåäåëåíèå äëÿ âñåõ ÑNV ó÷èòûâàåò òàêæå ÷àñòîòó âñòðå÷àåìîñòè âàðèàöèé íåêîòîðîãî ðàçìåðà. Ðàñïðåäåëåíèå äëèí äëÿ äåëåöèé õàðàêòåðèçóåòñÿ âûáðîñîì (1,2 Ìá), ìàêñèìóì ïðèõîäèòñÿ íà 150 êá, ÷òî îáúÿñíÿåòñÿ àëãîðèòìîì âûáîðà CNV ïðè äåòåêöèè íà òðåõ ðàçðåøåíèÿõ ñ îïðåäåëåíèåì ãðàíèö ïî ðàçðåøåíèþ 15 êá.  òàêîì ñëó÷àå òåîðåòè÷åñêè ìàëûå CNV ðàçìåðîì îêîëî 75 êá ìîãóò áûòü äåòåêòèðîâàíû, îäíàêî ïîäîáíûå ñèòóàöèè äîëæíû âñòðå÷àòüñÿ ðåäêî, ò.ê. òàêàÿ âàðèàöèÿ õàðàêòåðèçóåòñÿ ïåðåñå÷åíèåì ðåçóëüòàòîâ QDNAseq íà äâóõ ðàçðåøåíèÿõ íå áîëåå, ÷åì íà 50%.  òî æå âðåìÿ òåñòèðîâàíèå ïîêàçàëî, ÷òî ðåçóëüòàòû QDNAseq áîëåå óñòîé÷èâû ê èçìåíåíèþ ðàçðåøåíèÿ ïî ñðàâíåíèþ ñ äðóãèìè èíñòðóìåíòàìè. Ôîðìà ðàñïðåäåëåíèÿ äëÿ äåëåöèé íå ïîääàåòñÿ èíòåðïðåòàöèè, ò ê îæèäàåìî áûëî áû óâèäåòü ìàêñèìóì îêîëî 150 êá, òîãäà êàê â äàííîì ñëó÷àå îí ïðèõîäèòñÿ íà 250-300 êá. Ðàñïðåäåëåíèå ïî õðîìîñîìàì äëÿ äåëåöèé ïîêàçûâàåò íàèáîëüøåå ÷èñëî CNV íà 2é õðîìîñîìå, ïðè ýòîì äåëåöèè áûëè äåòåêòèðîâàíû íå íà âñåõ õðîìîñîìàõ. Âîçìîæíî, ôîðìà ðàñïðåäåëåíèé äëÿ äåëåöèé ñâÿçàíà ñ ìàëûì êîëè÷åñòâîì ñîáûòèé (18).

Àíàëîãè÷íûå ãðàôèêè áûëè ïîñòðîåíû äëÿ âñåõ äåëåöèé è äóïëèêàöèé.

Ðèñ. 13 Ðàñïðåäåëåíèå äëèí CNV äëÿ âñåõ äåëåöèé è äóïëèêàöèé (ââåðõó), ðàñïðåäåëåíèå âñåõ äåëåöèé/äóïëèêàöèé ïî õðîìîñîìàì (âíèçó)

Íà ãðàôèêå ðàñïðåäåëåíèÿ äåëåöèé ïî õðîìîñîìàì îò÷åòëèâî âèäíî íàèáîëåå ÷àñòóþ CNV â ýòîì èññëåäîâàíèè: chr8:39250000-39400000.

Òàêæå áûëè ïîñòðîåíû ãðàôèêè äëÿ êðóïíûõ äåëåöèé è äóïëèêàöèé ïî ðåçóëüòàòàì 3åé ôàçû èññëåäîâàíèÿ 1000Genomes (ðèñ. 14).

Ðèñ.14 Ðàñïðåäåëåíèå äëèí CNV äëÿ äåëåöèé è äóïëèêàöèé (ââåðõó), ðàñïðåäåëåíèå âñåõ äåëåöèé/äóïëèêàöèé ïî õðîìîñîìàì (âíèçó) äëÿ äàííûõ èç ïðîåêòà 1000Genomes.

Íàèìåíüøåå êîëè÷åñòâî CNV íà 21 õðîìîñîìå, ÷òî ñêîðåå âñåãî ñâÿçàíî ñ åå ðàçìåðîì. Ðàñïðåäåëåíèÿ äëèí, ïîëó÷åííûå â äðóãèõ èññëåäîâàíèÿõ, â öåëîì ñõîæè ñ ðåçóëüòàòàìè äàííîé ðàáîòû. Ðàçìåð âûáîðêè îòëè÷àåòñÿ ïî èññëåäîâàíèÿì, îäíàêî êîëè÷åñòâî êðóïíûõ CNV, íà÷èíàÿ ñ 300 êá, ñîïîñòàâèìî äëÿ âñåõ èññëåäîâàíèé (ðèñ. 15).

Ðèñ. 15 Ðàñïðåäåëåíèÿ äëèí CNV. Âåðõ - äàííîå èññëåäîâàíèå (611 èíäèâèäîâ), ñåðåäèíà - àíàëèç CNV â åâðîïåéñêîé ïîïóëÿöèè (1964 èíäèâèäîâ), íèç ñëåâà -â ëèòîâñêîé ïîïóëÿöèè (286 èíäèâèäîâ), íèç ñïðàâà - â ôèíñêîé ïîïóëÿöèè (286 èíäèâèäîâ)

Ñðàâíèâàòü ðåçóëüòàòû, ïîëó÷åííûå â äàííîé ðàáîòå, ñ CNV èç áàçû äàííûõ ïî ðàñïðåäåëåíèÿì íå âïîëíå êîððåêòíî: âî-ïåðâûõ ñèëüíî îòëè÷àåòñÿ ðàçìåð âûáîðêè (â 1000Genomes - 2504 èíäèâèäà), âî-âòîðûõ, â ñëó÷àå ñ êðàéíå íèçêèì ïîêðûòèåì è ïðèìåíåííûì ïðàâèëîì òðåõ ðàçðåøåíèé, âåðîÿòíåå âñåãî ñïåöèôè÷íîñòü ïðåîáëàäàåò íà ÷óâñòâèòåëüíîñòüþ. Òàêîé ïîäõîä âàæåí ïðè ñîçäàíèè áàçû äàííûõ, òàê êàê íåâåðíî äåòåêòèðîâàííàÿ CNV ìîæåò îêàçàòüñÿ â äåéñòâèòåëüíîñòè ïàòîãåííîé. Ïîýòîìó äëÿ ñðàâíåíèÿ ñ áàçîé äàííûõ DGV gold standart áûë ïðîâåäåí ïåðìóòàöèîííûé àíàëèç. Ñóììàðíîå ïåðåñå÷åíèå ïîëó÷åííûõ óíèêàëüíûõ ëîêóñîâ ñ áàçîé äàííûõ DGV gold standart äëÿ äåëåöèé ñîñòàâèëî 3989 êá, äëÿ äóïëèêàöè - 10646 êá. Ðàñïðåäåëåíèÿ ñóììàðíîé äëèíû ïåðåñå÷åíèÿ DGV gold standart ñî ñëó÷àéíûìè ëîêóñàìè ñîîòâåòñòâóþùåé äëèíû ïðåäñòàâëåíû íà ðèñóíêàõ 16 è 17.

Ðèñ.16. Ãèñòîãðàììà ðàñïðåäåëåíèÿ ñóììàðíîãî ïåðåñå÷åíèÿ ñëó÷àéíûõ ëîêóñîâ ñ áàçîé äàííûõ DGV äëÿ äåëåöèé, êðàñíàÿ ëèíèÿ - ñóììàðíîå ïåðåñå÷åíèå ïîëó÷åííûõ ó÷àñòêîâ äåëåöèé ñ DGV gold standart.

Ðèñ.17 Ãèñòîãðàììà ðàñïðåäåëåíèÿ ñóììàðíîãî ïåðåñå÷åíèÿ ñëó÷àéíûõ ëîêóñîâ ñ áàçîé äàííûõ DGV äëÿ äóïëèêàöèé, êðàñíàÿ ëèíèÿ - ñóììàðíîå ïåðåñå÷åíèå ïîëó÷åííûõ äóïëèöèðîâàííûõ ó÷àñòêîâ ñ DGV gold standart.

Ãèñòîãðàììû ïîêàçûâàþò, ÷òî ñóììàðíûå âåëè÷èíû ïåðåñå÷åíèÿ ïîëó÷åííûõ ëîêóñîâ ñ áàçîé äàííûõ DGV ñóùåñòâåííî îòëè÷àþòñÿ îò ñëó÷àéíûõ.

Òàêèì îáðàçîì, ïðèìåíåíèå QDNAseq îïðàâäàíî íà ãåíîìå ñ êðàéíå íèçêèì ïîêðûòèåì è â îáùåì äàåò ðåçóëüòàò, çíà÷èòåëüíî îòëè÷àþùèéñÿ îò ñëó÷àéíîãî. Ò. å. â öåëîì ìîæíî îæèäàòü, ÷òî áîëüøàÿ ÷àñòü äåòåêòèðîâàííûõ ÑNV ÿâëÿåòñÿ èñòèííî ïîëîæèòåëüíûìè.

3.3 Àíàëèç ðåçóëüòàòîâ QDNAseq ñ ó÷åòîì X - õðîìîñîìû

Ïðîãðàììà QDNAseq ïîçâîëÿåò âêëþ÷àòü â ðàññìîòðåíèå X-õðîìîñîìó ïî óñìîòðåíèþ ïîëüçîâàòåëÿ. Àíàëèç CNV íà Õ-õðîìîñîìå ÿâëÿåòñÿ ñëîæíîé çàäà÷åé, ðåäêî âêëþ÷àåòñÿ â ïîïóëÿöèîííûå èññëåäîâàíèÿ.  ñëó÷àå QDNAseq ðàçðàáîò÷èêè ïèøóò î òîì, ÷òî ó÷åò X-õðîìîñîìû ìîæåò ïîâëèÿòü íà ðåçóëüòàòû loess-ðåãðåññèè, è èñêàçèòü ðåçóëüòàòû äåòåêöèè íà äðóãèõ õðîìîñîìàõ. Ñ äðóãîé ñòîðîíû, àíàëèç CNV íà Õ-õðîìîñîìå âàæåí äëÿ èíòåðïðåòàöèè êëèíè÷åñêèõ ðåçóëüòàòîâ, òàê êàê ïî ðåçóëüòàòàì ìèêðîìàòèðè÷íîãî àíàëèçà CNV ñ íåîïðåäåëåííîé êëèíè÷åñêîé çíà÷èìîñòüþ òàì âñòðå÷àþòñÿ äîâîëüíî ÷àñòî. Ïîýòîìó QDNAseq áûë ïðîòåñòèðîâàí íà íåñêîëüêèõ îáðàçöàõ ñ ðàçðåøåíèåì 15 êá ñ ó÷åòîì X-õðîìîñîìû è áåç.

Òàáëèöà 3

Êîëè÷åñòâî ïðîàíàëèçèðîâàííûõ îáðàçöîâ

121

Îáùåå êîëè÷åñòâî CNV

1295

Ñðåäíåå êîëè÷åñòâî äóïëèêàöèé íà X õðîìîñîìå íà îäèí îáðàçåö

3 (îò 1 äî 5)

Ñðåäíåå êîëè÷åñòâî äåëåöèé íà Õ õðîìîñîìå íà îäèí îáðàçåö

7,5 (îò 1 äî 24)

Êîëè÷åñòâî äóïëèêàöèé íà àóòîñîìàõ ñ ó÷åòîì X-õðîìîñîìû

50

Êîëè÷åñòâî äóïëèêàöèé íà àóòîñîìàõ áåç ó÷åòà X-õðîìîñîìû

68

Êîëè÷åñòâî äåëåöèé íà àóòîñîìàõ ñ ó÷åòîì X-õðîìîñîìû

134

Êîëè÷åñòâî äåëåöèé íà àóòîñîìàõ áåç ó÷åòà X-õðîìîñîìû

205

Ó÷åò Õ - õðîìîñîìû íåãàòèâíî ñêàçûâàåòñÿ íà ðåçóëüòàòàõ. Ïðîãðàììà QDNAseq ïîêàçûâàåò áîëüøîå êîëè÷åñòâî CNV íà Õ-õðîìîñîìå, ðåçóëüòàòû íå ñîâïàäàþò ñ áàçàìè äàííûõ. Ñ äðóãîé ñòîðîíû, íàáëþäàåòñÿ óìåíüøåíèå êîëè÷åñòâà äåòåêòèðîâàííûõ CNV íà àóòîñîìàõ, ÷òî ìîæåò áûòü ïîëåçíî â äàëüíåéøåì àíàëèçå. Îäíàêî ê ÷èñëó íåäåòåêòèðîâàííûõ CNV îòíîñèòñÿ òàêæå âûñîêî÷àñòîòíàÿ äåëåöèÿ, ò. å. ýòè CNV ìîãóò îêàçàòüñÿ ëîæíî-îòðèöàòåëüíûìè. Òàêæå ÷àñòü âàðèàöèé, îïðåäåëåííûõ ïðè âêëþ÷åíèè Õ-õðîìîñîìû, íå ïîêàçàíû ïðè çàïóñêå QDNAseq íà àóòîñîìàõ. Íè îíà èç íèõ íå âîøëà â êàòàëîã, ñîçäàííûé íà â õîäå äàííîãî èññëåäîâàíèÿ. Íàïðèìåð, ïðåîáëàäàþùàÿ äåëåöèÿ íà 19 õðîìîñîìå áûëà äåòåêòèðîâàíà êàê ëîæíî-ïîëîæèòåëüíàÿ â ñâÿçè ñ ãðàíè÷íûì ðàñïîëîæåíèåì ïî îòíîøåíèþ ê ó÷àñòêó ãåíîìà èç «÷åðíîãî ñïèñêà». Òàêèì îáðàçîì, âêëþ÷åíèå Õ-õðîìîñîìû íå æåëàòåëüíî ïðè íàñòðîéêå ïàðàìåòðîâ QDNAseq, ò.ê. îíî íå äàåò êîððåêòíûõ ðåçóëüòàòîâ äëÿ X õðîìîñîìû è èñêàæàåò ðåçóëüòàòû äëÿ äðóãèõ õðîìîñîì, ÷òî, âåðîÿòíî ñâÿçàíî, ñ GC - êîððåêöèåé è ñ èñêàæåíèåì ñèãíàëà èç-çà èçìåíåíèÿ â êîëè÷åñòâå ðèäîâ íà X-õðîìîñîìå ïðè áåðåìåííîñòè ïëîäîì ìóæñêîãî ïîëà.

3.4 Ïîèñê CNV ñ ïîìîùüþ ïðîãðàìì DWAC-seq è cn.MOPS

Òàê êàê íà âòîðîì ýòàïå ïðåäâàðèòåëüíîãî òåñòèðîâàíèÿ DWAQseq è cn.MOPS òàêæå îïðåäåëèëè ïðåäïîëàãàåìóþ CNV c íåáîëüøèì îáùèì êîëè÷åñòâîì äåòåêòèðîâàííûõ CNV (òàáëèöà 2), ýòè ïðîãðàììû áûëè èñïîëüçîâàíû äëÿ àíàëèçà CNV â 235 îáðàçöàõ. Òàêæå äëÿ ýòèõ îáðàçöîâ èìåëèñü äàííûå QDNAseq äëÿ òðåõ ðàçðåøåíèé (íàéäåíî 123 CNV). Ïîñêîëüêó «ïðàâèëî òðåõ ðàçðåøåíèé» ïðèâîäèò ê ñîêðàùåíèþ êîëè÷åñòâà íàéäåííûõ CNV, âîçìîæíî, ÷àñòü èç íèõ îêàçûâàåòñÿ ëîæíîîòðèöàòåëüíûìè. Ïðè êîððåêòíûõ ðåçóëüòàòàõ ñðàâíåíèÿ ðàáîòû QDNAseq, DWAQseq è cn.MOPS ïðåäïîëàãàëîñü â äàëüíåéøåì ðàñøèðèòü êàòàëîã CNV âêëþ÷åíèåì âàðèàöèé, äåòåêòèðîâàííûõ QDNAseq íà îäíîì ðàçðåøåíèè è åùå îäíèì èíñòðóìåíòîì.

Äëÿ cn.mops áûëî âûáðàíî ðàçðåøåíèå 300 êá, è ñ åãî ïîìîùüþ ìîæíî áûëî îïðåäåëèòü òîëüêî êðóïíûå CNV ðàçìåðîì áîëåå 900 êá. QDNAseq ïîêàçàë 5 òàêèõ CNV äëÿ èññëåäóåìûõ îáðàçöîâ. Âñåãî ñn.mops äåòåêòèðîâàë 178 êðóïíûõ CNV, ïðè ýòîì 5 èç 5 âîçìîæíûõ CNV ñîâïàëè ñ QDNAseq.

DWAQ-seq íå ïðåäïîëàãàåò çàäàíèÿ ïàðàìåòðà âåëè÷èíû áèíà, ìèíèìàëüíûé ðàçìåð CNV ñîñòàâèë 1 êá, ÷òî óæå ãîâîðèò î âîçìîæíîñòè ëîæíîïîëîæèòåëüíûõ ðåçóëüòàòîâ, ò.ê. îæèäàåìîå êîëè÷åñòâî ðèäîâ, ïðèõîäÿùèõñÿ íà ôðàãìåíò òàêîé âåëè÷èíû, ñîñòàâëÿåò 2 øò ïðè îáùåì êîëè÷åñòâå ðèäîâ îêîëî 6ìëí.  235 îáðàçöàõ ñ ïîìîùüþ äàííîãî èíñòðóìåíòà áûëî ïîëó÷åíî 264 CNV, èç êîòîðûõ 4 êðóïíûõ ñîâïàëè ñ QDNAseq.

Îòëè÷èòåëüíîé îñîáåííîñòüþ ïðîãðàììû QDNAseq ÿâëÿåòñÿ ó÷åò «÷åðíîãî ñïèñêà» ENCODE.  ýòîò ñïèñîê âõîäÿò ó÷àñòêè ãåíîìà, õàðàêòåðèçóþùèåñÿ ñëîæíîñòÿìè ïðè êàðòèðîâàíèè. Îáû÷íî êàðòèðîâàíèå ðèäîâ íà ýòè ó÷àñòêè äàåò àíîìàëüíî áîëüøîå êîëè÷åñòâî ðèäîâ, â îñíîâíîì èç-çà ïîâòîðÿþùèõñÿ ïîñëåäîâàòåëüíîñòåé.

Òàêæå ðàçðàáîò÷èêè QDNAseq äîïîëíèëè ýòîò ñïèñîê íåñêîëüêèìè ó÷àñòêàìè, ïîëó÷åííûìè ïðè àíàëèçå äàííûõ èç 1000Genomes. Ïðîãðàììû DWAQseq è cn.MOPS íå ó÷èòûâàþò «÷åðíûé ñïèñîê». Èìåííî ýòèì îáúÿñíÿåòñÿ áîëüøîå êîëè÷åñòâî äåòåêòèðîâàííûõ äóïëèêàöèé.

DWAQseq

cn.MOPS

Êîëè÷åñòâî CNV, ïåðåñåêàþùèõñÿ ñ «÷åðíûì ñïèñêîì»

259

171

Òàêèì îáðàçîì, áîëüøèíñòâî CNV, äåòåêòèðîâàííûõ DWAQseq è cn.MOPS, ïåðåñåêàþòñÿ ñ «÷åðíûì ñïèñêîì» ENCODE è îòðàæàþò ïðîáëåìó êàðòèðîâàíèÿ ðèäîâ ïðè àíàëèçå CNV c ïîìîùüþ NGS, à íå èñòèííóþ âàðèàáåëüíîñòü ÷èñëà êîïèé.  ñëó÷àå DWAQseq ãèáðèäíûé ãåíîì ïîëó÷àåòñÿ â ýòèõ ó÷àñòêàõ åùå áîëåå èñêàæåííûì. Ðåçóëüòàòû ðàáîòû èíñòðóìåíòîâ îêàçàëèñü íåóäîâëåòâîðèòåëüíûìè ïðè àíàëèçå áîëüøîãî ÷èñëà îáðàçöîâ. Íåñêîëüêî êðóïíûõ CNV ñîâïàëè ñ ðåçóëüòàòàìè QDNAseq íà òðåõ ðàçðåøåíèÿõ. Òàêæå ñ ïîìîùüþ DWAQ-seq è cn.MOPS áûëî íàéäåíî 1 è 2 êðóïíûå CNV ñîîòâåòñòâåííî, íå ïåðåñåêàþùèåñÿ ñ «÷åðíûì ñïèñêîì» è QDNAseq.  äàííîì èññëåäîâàíèè îíè íå áûëè âêëþ÷åíû â ôèíàëüíûé êàòàëîã. Èñêëþ÷åíèå ïðîáëåìíûõ ó÷àñòêîâ èç ðàññìîòðåíèÿ ìîãëî áû óëó÷øèòü ðàáîòó ïðîãðàìì, è â äàëüíåéøåì èõ ìîæíî áûëî áû ïðèìåíÿòü äëÿ äåòåêöèè êðóïíûõ (áîëåå 700 êá) CNV.

3.5 Êàòàëîã âñåõ äåòåêòèðîâàííûõ CNV

Ïî ðåçóëüòàòàì àíàëèçà îáðàçöîâ ñ ïîìîùüþ QDNAseq áûë ñîñòàâëåí êàòàëîã CNV, ïðåäïîëîæèòåëüíî, íåéòðàëüíûõ â ðîññèéñêîé ïîïóëÿöèè ó æåíùèí. CNV, äåòåêòèðîâàííûå QDNAseq íà òðåõ ðàçðåøåíèÿõ, íî ïåðåñåêàþùèå öåëèêîì êàê ìèíèìóì 1 ó÷àñòîê èç «÷åðíîãî ñïèñêà», òàêæå áûëè îòôèëüòðîâàíû. Ïîëó÷åííûå CNV áûëè ïðîàíàëèçèðîâàíû ñ òî÷êè çðåíèÿ ïåðåñå÷åíèÿ ñ áàçîé äàííûõ DGV. 10 äóïëèêàöèé è 13 äåëåöèé ñîâïàäàåò ñ DGV gold standart, 9 äåëåöèé è 23 äóïëèêàöèè ïîëíîñòüþ èëè ÷àñòè÷íî ïåðåñåêàåòñÿ ñ íåñêîëüêèìè èññëåäîâàíèÿìè â DGV, 13 CNV îòñóòñòâóåò â áàçå äàííûõ DGV, íî ïðè ýòîì âõîäÿò â áàçó äàííûõ ISCA êàê äîáðîêà÷åñòâåííûå, åùå 7 CNV âõîäÿò â ISCA c íå ÿñíîé êëèíè÷åñêîé çíà÷èìîñòüþ. Òàêæå äåòåêòèðîâàíî 20 íå âûÿâëåííûõ ðàíåå CNV (íå ïåðåñåêàþòñÿ íè ñ îäíèì èññëåäîâàíèåì èç DGV è íå óêàçàíà â ISCA). Ïðè ýòîì 3 äóïëèêàöèè, ÷àñòè÷íî ïåðåñåêàþùèåñÿ ñ èññëåäîâàíèÿìè èç DGV, óêàçàíû â áàçå äàííûõ DECIPHER êàê ïàòîãåííûå (óìåðåííàÿ óìñòâåííàÿ îòñòàëîñòü, ñóäîðîãè). Îäíà èç äåëåöèé íå îáíàðóæåíà â áàçàõ äàííûõ, îäíàêî ìóòàöèÿ â ãåíå, îòíîñÿùåìñÿ ê ýòîìó ëîêóñó, àññîöèèðîâàíà ñ àìèîòðîôè÷åñêèì ëàòåðàëüíûì ñêîëåðîçîì (ïîêàçàíî äëÿ ãåòåðîçèãîòû) è øèçîôðåíèåé. Ïðåäïîëîæèòåëüíî, ýòè CNV ÿâëÿþòñÿ ëîæíîïîëîæèòåëüíûìè. Îíè èñêëþ÷åíû èç êàòàëîãà.

16% â ñóììå ïðèõîäèòñÿ íà áåëîê-êîäèðóþùèå ãåíû äëÿ äåëåöèé è 25% - äëÿ äóïëèêàöèé. Ðàçíèöà â ïðîöåíòíîì ñîäåðæàíèè áåëîê-êîäèðóþùèõ ãåíîâ òàêæå îòðàæàåò òîò ôàêò, ÷òî äåëåöèè îáû÷íî áûâàþò áîëåå âðåäíûìè ïî ñðàâíåíèþ ñ äóïëèêàöèÿìè. Îñòàëüíûå ãåíû ïðåäñòàâëåíû ïñåâäîãåíàìè, ìàëûìè ÿäåðíûìè ÐÍÊ, ìèêðîÐÍÊ, äëèííûìè âñòàâêàìè íåêîäèðóþùèõ ÐÍÊ è äð. Íà âñå ãåíû â ñîâîêóïíîñòè ïðèõîäèòñÿ 24% äëÿ äåëåöèé è 29% äëÿ äóïëèêàöèé.

Òàáëèöà 4. Äóïëèêàöèè.

õðîìoñîìà

êîîðäèíàòû

íàëè÷èå â áàçå dgv

(ïðè ñîâïàäåíèè ñ dgv gold standart óêàçàíà ÷àñòîòà)

êîëè÷åñòâî ÷åëîâåê ñ äàííîé CNV

íàëè÷èå è ñòàòóñ â áàçå äàííûõ isca

ëèáî DECIPHER

1

46215001-46470000

1

äîáðîêà÷åñòâåííàÿ

1

164865001-165285000

dwaq

1

1

175410001-175770000

dwaq

1

äîáðîêà÷åñòâåííàÿ

1

229920001-230160000

1

1

246165001-247410000

1

íåîïðåäåëåííîé êëèíè÷åñêîé çíà÷èìîñòè

2

31605001-31860000

0.02%

1

2

86280001-86505000

0.08%

1

2

99840001-99915000

0.16%

1

2

173535001-173895000

÷àñòè÷íîå ïåðåñå÷åíèå ñ 2-ìÿ èññëåäîâàíèÿìè

1

2

215145001-216375000

1

íåîïðåäåëåííîé êëèíè÷åñêîé çíà÷èìîñòè

2

237180001-237705000

ïåðåñå÷åíèå ñ 1 èññëåäîâàíèåì è ÷àñòè÷íî ñ 2-ìÿ

2

äîáðîêà÷åñòâåííàÿ

3

6735001-7020000

0.02%

1

3

65880001-66165000

÷àñòè÷íîå ïåðåñå÷åíèå ñ dgv gold standart è ïîëíîå ñ 1 èññëåäîâàíèåì

1

3

100335001-100425000

1,43%

1

3

111810001-112275000

1

3

165510001-165900000

÷àñòè÷íîå ïåðåñå÷åíèå ñ 2-ìÿ èññëåäîâàíèÿìè

1

äîáðîêà÷åñòâåííàÿ

3

90001-345000

0.02%

1

3

182295001-182550000

1

4

10125001-10755000

÷àñòè÷íîå ïåðåñå÷åíèå ñ dgv gold standart, 0,01%

1

4

17295001-17520000

ïåðåñå÷åíèå ñ 1 èññëåäîâàíèåì

1

4

83460001-83640000

÷àñòè÷íîå ïåðåñå÷åíèå ñ 1 èññëåäîâàíèåì

1

4*

96150001-98175000

1

4

164820001-165465000

1

íåîïðåäåëåííîé êëèíè÷åñêîé çíà÷èìîñòè

4

183660001-184170000

÷àñòè÷íîå ïåðåñå÷åíèå ñ 1 èññëåäîâàíèåì

dwaq 1

1

äîáðîêà÷åñòâåííàÿ

4

189480001-190065000

÷àñòè÷íîå ïåðåñå÷åíèå ñ dgv gold standart è ïîëíîå ñ 1 èññëåäîâàíèåì

1

äîáðîêà÷åñòâåííàÿ

5

27195001-27720000

ïåðåñå÷åíèå ñ 2 èññëåäîâàíèåì

1

äîáðîêà÷åñòâåííàÿ

5

51105001-51270000

1

5

130080001-130485000

ïåðåñå÷åíèå ñ 2 èññëåäîâàíèåì

1

6

1740001-2130000

1

6*

77175001-77670000

1

6

86805001-87405000

1

6

141345001-141945000

0.04%

2

6

168330001-168615000

2.61%

5

7

9735001-10050000

÷àñòè÷íîå ïåðåñå÷åíèå ñ dgv gold standart, 0.28%

1

7

87705001-87990000

1

7

144690001-145095000

1

7

100965001-101145000

0.67%

2

8

13320001-13635000

÷àñòè÷íîå ïåðåñå÷åíèå ñ dgv gold standart, 0.04 %

2

8

2355001- 2580000

0.14%

2

äîáðîêà÷åñòâåííàÿ

9

4125001-4530000

÷àñòè÷íîå ïåðåñå÷åíèå ñ 2 èññëåäîâàíèÿìè

1

9*

10905001-12915000

1

äîáðîêà÷åñòâåííàÿ

9

37725001-38160000

1

ïðèïàäêè

10

20310001-21045000

1

10

21180001 21750000

1

íåîïðåäåëåííîé êëèíè÷åñêîé çíà÷èìîñòè

11

33525001-33750000

1

11

101430001-101865000

ïåðåñå÷åíèå ñ 1 èññëåäîâàíèåì

1

íåîïðåäåëåííîé êëèíè÷åñêîé çíà÷èìîñòè

12

33780001-34305000

0.18%

1

12

109545001-109665000

ïåðåñå÷åíèå ñ 4 èññëåäîâàíèåì

1

äîáðîêà÷åñòâåííàÿ

12

114225001-114570000

3

12

127590001-128055000

ïåðåñå÷åíèå ñ 4 èññëåäîâàíèåì

1

12

129315001-129540000

÷àñòè÷íîå ïåðåñå÷åíèå ñ 3 èññëåäîâàíèÿìè

1

12

129825001-130485000

÷àñòè÷íîå ïåðåñå÷åíèå ñ 1 èññëåäîâàíèåì

1

óìåðåííàÿ óìñòâåííàÿ îòñòàëîñòü

13

75390001-75615000

ïåðåñå÷åíèå ñ 1 èññëåäîâàíèåì è ÷àñòè÷íî ñ 1

1

13

83925001-84330000

1

13

84885001-85320000

÷àñòè÷íîå ïåðåñå÷åíèå ñ 1 èññëåäîâàíèåì

1

14

43830001-44250000

0,34%

3

14*

104145001-104910000

1

15

47400001-47895000

1

15

54840001-55425000

1

15

85830001- 86010000

0.20%

1

16

59820001-60345000

1

16

77280001-77595000

÷àñòè÷íîå ïåðåñå÷åíèå ñ 3 èññëåäîâàíèÿìè

1

16

20130001- 20415000

1

16

21945001- 22380000

0.03%

1

17

77145001-77385000

ïåðåñå÷åíèå ñ 2 èññëåäîâàíèÿìè

1

18

52320001-52620000

1

20

12915001-13710000

÷àñòè÷íîå ïåðåñå÷åíèå ñ 3 èññëåäîâàíèÿìè

1

êîãíèòèâíûå íàðóøåíèÿ

22

22305001-22575000

0,45%

2

Çåëåíûì öâåòîì âûäåëåíû ïàòîãåííûå äóïëèêàöèè èç áàçû äàííûõ DECIPHER. Çíàêîì «*» îòìå÷åíû CNV, ïîäòâåðæäåííûå òàêæå DWAQ-seq ëèáî cn.mops ïîñëå ôèëüòðàöèè ðåçóëüòàòîâ ðàáîòû ýòèõ àëãîðèòìîâ íà ïðåäìåò ïåðåñå÷åíèÿ ñ «÷åðíûì ñïèñêîì» ENCODE.

Òàáëèöà 5. Äåëåöèè.

Õðîìî ñîìà

êîîðäèíàòû

íàëè÷èå â áàçå dgv

(ïðè ñîâïàäåíèè ñ dgv gold standart óêàçàíà ÷àñòîòà)

êîëè÷åñòâî ÷åëîâåê ñ äàííîé CNV

íàëè÷èå è ñòàòóñ â áàçå äàííûõ isca

ëèáî OMIM

ãåíû (áåëîê-êîäèðóþùèå - ñèíèé)

1

102660001-102855000

0.32%

1

ENSG00000233359

2

168420001-168645000

÷àñòè÷íîå ïåðåñå÷åíèå ñ dgv gold standart (0.05%) è ïîëíîå ñ 1 èññëåäîâàíèåì

1

ENSG00000214211,ENSG00000238357

2

193395001-193560000

÷àñòè÷íîå ïåðåñå÷åíèå ñ dgv gold standart (0.05%) è ïîëíîå ñ 1 èññëåäîâàíèåì

1

ENSG00000229395,ENSG00000232227

2

212580001-212745000

1

Ìóòàöèè â ãåíå ERBB4 ñâÿçàíû ñ àìèîòðîôè÷åñêèì ëàòåðàëüíûì ñêîëåðîçîì è øèçîôðåíèåé

ENSG00000178568,ENSG00000232631,ENSG00000236007

2

242850001-243015000

0,67%

16

ENSG00000226423,ENSG00000232002,ENSG00000233806,ENSG00000237940

3

1695001-1980000

ïåðåñå÷åíèå ñ 2 èññëåäîâàíèÿìè, ÷àñòè÷íî ñ DGV gold standart

1

äîáðîêà÷åñòâåííàÿ

3

164145001-164385000

ïåðåñå÷åíèå ñ 2 èññëåäîâàíèÿìè

1

äîáðîêà÷åñòâåííàÿ

4

187245001-188430000

Äóïëèêàöèÿ â DGV

1

Íåÿñíîé êëèíè÷åñêîé çíà÷èìîñòè

4

28485001-28620000

Ïåðåñå÷åíèå ñ îäíèì èññëåäîâàíèåì

1

7

53760001-54165000

1

7

111045001-111195000

0.07%

1

8

39225001-39405000

18,16%

116

(18,9%)

8

137670001-137865000

3,56%

11

(1,8%)

9

12015001-12420000

ïåðåñåêàåòñÿ ñ 4 èññëåäîâàíèÿìè

3

äîáðîêà÷åñòâåííàÿ

9

28590001-28770000

0,04%

1

11

91170001-91425000

Ïåðåñåêàåòñÿ ÷àñòè÷íî ñ 1 èññëåäîâàíèåì

1

äîáðîêà÷åñòâåííàÿ

12

21015001-21420000

0,06%

1

ENSG00000084453,ENSG00000111700,ENSG00000134538,ENSG00000205754,ENSG00000257046,ENSG00000257062

20

14850001-15105000

0,07%

1

20

14655001-14865000

0,07%

1

äîáðîêà÷åñòâåííàÿ

ENSG00000172264, ENSG00000213950

22

25725001-25965000

2,4%

1

ENSG00000100058,ENSG00000100068,ENSG00000100077,ENSG00000230637,ENSG00000231466,ENSG00000234884,ENSG00000265978,ENSG00000271138,ENSG00000272798,ENSG00000272942,ENSG00000272977

Êðàñíûì öâåòîì âûäåëåíà äåëåöèÿ ëîêóñà, ãåòåðîçèãîòíàÿ ìóòàöèÿ â êîòîðîì àññîöèèðîâàíà ñ àìèîòðîôè÷åñêèì ëàòåðàëüíûì ñêîëåðîçîì, à òàêæå ìóòàöèè â ëîêóñå ñâÿçàíû ñ øèçîôðåíèåé ñîãëàñíî áàçå äàííûõ OMIM.

Ðàíåå íå îïèñàííûå CNV

Ïî ðåçóëüòàòàì àíàëèçà âñåõ CNV áûëî âûäåëåíî 19 äóïëèêàöèé è 2 äåëåöèè, íå âñòðå÷àþùèåñÿ â áàçàõ äàííûõ DGV, DECIPHER è ISCA. Ýòè âàðèàöèè êîïèé ìîæíî ðàññìàòðèâàòü êàê õàðàêòåðíûå äëÿ ðîññèéñêîé ïîïóëÿöèè â íîðìå.

Òàáëèöà 6. Íå îïèñàííûå ðàíåå CNV.  ñòîëáöå àííîòàöèè («ãåíû/ íå êîäèðóþùèå ïîñëåäîâàòåëüíîñòè») óêàçàíû òîëüêî òå ãåíû, êîòîðûå ïîëíîñòüþ âõîäÿò â äóïëèöèðîâàííûé ó÷àñòîê

Êîîðäèíàòû

Òèï

Ãåíû/ íå êîäèðóþùèå ïîñëåäîâàòåëüíîñòè

chr1:164865001-165285000

äóïëèêàöèÿ

ïðîöåññèðîâàííûé ïñåâäîãåí, ìàëàÿ ÿäåðíàÿ ðíê, ìàëàÿ ÿäðûøêîâàÿ ðíê

chr1: 229920001-230160000

äóïëèêàöèÿ

äëèííàÿ ìåæãåííàÿ íåêîäèðóþùàÿ ðíê

chr3: 111810001-112275000

äóïëèêàöèÿ

GCSAM, SLC9C1, CD200, BTLA, äëèííàÿ ìåæãåííàÿ íåêîäèðóþùàÿ ðíê

chr3: 182295001-182550000

äóïëèêàöèÿ

äëèííàÿ ìåæãåííàÿ íåêîäèðóþùàÿ ðíê, ïñåâäîãåíû

chr5: 51105001-51270000

äóïëèêàöèÿ

ðèáîñîìàëüíûé ïñåâäîãåí

chr6: 1740001-2130000

äóïëèêàöèÿ

chr6:77175001-77670000

äóïëèêàöèÿ

äëèííàÿ ìåæãåííàÿ íåêîäèðóþùàÿ ðíê, ïñåâäîãåíû, ìàëàÿ ÿäåðíàÿ ÐÍÊ

chr6:86805001-87405000

äóïëèêàöèÿ

ïñåâäîãåí, ìèêðîÐÍÊ

chr7:87705001-87990000

äóïëèêàöèÿ

SRI, STEAP4

chr7:144690001-145095000

äóïëèêàöèÿ

ïðîöåññèðîâàííûé ïñåâäîãåí

chr10:20310001-21045000

äóïëèêàöèÿ

ìèêðîÐÍÊ, ïñåâäîãåíû

chr11: 33525001-33750000

äóïëèêàöèÿ

KIAA1549L, CD59, C11orf91

chr12:114225001-114570000

äóïëèêàöèÿ

RBM19

chr14:104145001-104910000

äóïëèêàöèÿ

PPP1R13B, XRCC3, ATP5MPL, TDRD9, RD3L, ASPG, KIF26A, C14orf144

chr15:47400001-47895000

äóïëèêàöèÿ

ïñåâäîãåíû, ìèêðîÐÍÊ

chr15:54840001-55425000

äóïëèêàöèÿ

äëèííàÿ ìåæãåííàÿ íåêîäèðóþùàÿ ðíê

chr16: 59820001-60345000

äóïëèêàöèÿ

äëèííàÿ ìåæãåííàÿ íåêîäèðóþùàÿ ðíê

chr16: 20130001- 20415000

äóïëèêàöèÿ

GP2

chr18:52320001-52620000

äóïëèêàöèÿ

RAB27B

chr7:53760001-54165000

äåëåöèÿ

ïðîöåññèðîâàííûé ïñåâäîãåí, äëèííàÿ ìåæãåííàÿ íåêîäèðóþùàÿ ðíê è òä

chr2: 212580001-212745000

äåëåöèÿ

ERBB4 Ìóòàöèè â ãåíå ERBB4 ñâÿçàíû ñ àìèîòðîôè÷åñêèì ëàòåðàëüíûì ñêîëåðîçîì è øèçîôðåíèåé, ïðîöåññèðîâàííûå ïñåâäîãåíû

Ïîëó÷åííûé ñïèñîê ãåíîâ áûë ïðîàíàëèçèðîâàí ñ ïîìîùüþ âåá-ñåðâèñà Panther (ðèñ. 18,19). Ýòè ãåíû õàðàêòåðíû äëÿ äóïëèêàöèé èìåííî â ðîññèéñêîé ïîïóëÿöèè. Îäíàêî âëèÿíèå äóïëèêàöèé íà ýêñïðåññèþ ãåíîâ íå èçó÷åíî â äàííîì èññëåäîâàíèè. Ðàññìàòðèâàëîñü òîëüêî ïîëíîå âõîæäåíèå ãåíà â CNV áåç ó÷åòà ðåãóëÿòîðíûõ ïîñëåäîâàòåëüíîñòåé.

Ðèñ. 18 Àííîòàöèÿ ñ òî÷êè çðåíèÿ ìîëåêóëÿðíîé ôóíêöèè:

Ðèñ. 19 Àííîòàöèÿ ñ òî÷êè çðåíèÿ áèîëîãè÷åñêèõ ïðîöåññîâ

Àíàëèç â âåá-ñåðâèñå ÑPDB ïîêàçàë îáîãàùåíèå ãåíàìè, âõîäÿùèìè â ìåòàáîëè÷åñêèé ïóòü ðåöåïòîðîâ âèòàìèíà D (p-value - 0.00115), ÷òî ìîæåò óêàçûâàòü íà àäàïòèâíûå ôóíêöèè îáðàçîâàíèÿ äóïëèêàöèé.

Àíàëèç ëîêóñà chr8:39240000-39400000

Ó÷àñòîê ãåíîìà â ïîçèöèè 39240000-39400000 íà õðîìîñîìå 8 îïèñàí â DGV gold standart êàê äåëåöèÿ ñ ÷àñòîòîé 18% è äóïëèêàöèÿ ñ ÷àñòîòîé 32%.  ñëó÷àå äåòåêöèè CNV ñ ïîìîùüþ ìèêðî÷èïîâ âñåãäà âñòàåò âîïðîñ î êîíòðîëüíîì îáðàçöå. Âûñîêî÷àñòîòíûå CNV òàêèì îáðàçîì ìîãóò äåòåêòèðîâàòüñÿ êàê äåëåöèè èëè êàê äóïëèêàöèè â çàâèñèìîñòè îò òîãî, êàêîé îáðàçåö ïîäîáðàí â êà÷åñòâå êîíòðîëüíîãî.  äàííîì èññëåäîâàíèè îáíàðóæåíà äåëåöèÿ â ýòîì ó÷àñòêå ñ ÷àñòîòîé 19%.

Íà ýòîò ó÷àñòîê ãåíîìà ïðèõîäèòñÿ 2 ïñåâäîãåíà. Ïñåâäîãåíû èìåþò ðàçíîîáðàçíóþ ýòèîëîãèþ. Íåêîòîðûå èìåþò ïàðàëîãè â ãåíîìå, è îáðàçîâàëèñü âñëåäñòâèå äóïëèêàöèè ñ ïîñëåäóþùåé ïîòåðåé ôóíêöèîíàëüíîñòè, äðóãèå - èç-çà íåáîëüøèõ äåëåöèé/èíñåðöèé èëè âñòàâêè òðàíñïîçîíîâ ñî ñäâèãîì ðàìêè ñ÷èòûâàíèÿ. Ïñåâäîãåíû adam5 è adam3a ÿâëÿþòñÿ îäèíî÷íûìè, ò. å. íå èìåþò ôóíêöèîíèðóþùèõ ïàðàëîãîâ â ãåíîìå. [25] Ðàáîòàþùèå âåðñèè ýòèõ ãåíîâ íàéäåíû ó ìíîãèõ ìëåêîïèòàþùèõ, â òîì ÷èñëå ó ìàêàêè, ìûøè, êðûñû. Ñðàâíèòåëüíûé àíàëèç ÑNV â ãåíîìå ÷åëîâåêà è øèìïàíçå ïîêàçàë íàëè÷èå äåëåöèè ó ÷åëîâåêà è îòñóòñòâèå ó øèìïàíçå. [7] Îäíàêî ýòè ãåíû íå ðàáîòàþò òàêæå ó ãîðèëëû. Adam5 êîäèðóåò áåëîê èç ñåìåéñòâà ADAM, ê êîòîðîìó ïðèíàäëåæàò äèçèíòåãðèí- è ìåòàëëîïèïòåäàçíûé äîìåí. Åãî ôóíêöèÿ èìååò îòíîøåíèå ê ôåðòèëüíîñòè, ò.ê. ïîêàçàíà âàæíàÿ ðîëü äèçèíòåãðèíà ïðè âçàèìîäåéñòâèè ñïåðìàòîçîèäà è ÿéöåêëåòêè. Èññëåäîâàòåëè ñ÷èòàþò, ÷òî ó ÷åëîâåêà ëèáî äåéñòâèòåëüíî ñíèæåííàÿ ïî ñðàâíåíèþ ñ äðóãèìè âèäàìè ôåðòèëüíîñòü, ëèáî ðàáîòà ýòîãî ãåíà íå ÿâëÿåòñÿ êðèòè÷åñêè âàæíîé äëÿ íîðìàëüíîé ôåðòèëüíîñòè.[47]

Âî ôëàíêèðóþùèõ îáëàñòÿõ áûëè íàéäåíû ïîñëåäîâàòåëüíîñòè, îòíîñÿùèåñÿ ê ñåìåéñòâó Alu-ïîâòîðîâ äëèíîé 305, ÷òî ñîîòâåòñòâóåò ìèíèìàëüíîé äëèíå, ïðè êîòîðîé âîçìîæíà ãîìîëîãè÷íàÿ ðåêîìáèíàöèÿ. Ïîñëåäîâàòåëüíîñòè ñõîæè íà 81%. Îáû÷íî äëÿ ãîìîëîãè÷íîé ðåêîìáèíàöèè òðåáóåòñÿ ñõîäñòâî îêîëî 95%. Íî åñëè äàííàÿ CNV ñôîðìèðîâàëàñü äàâíî, à ó÷àñòîê íå ïîäâåðæåí åñòåñòâåííîìó îòáîðó, òî ñòåïåíü ñõîäñòâà ãîìîëîãè÷íûõ ó÷àñòêîâ ìîæåò áûòü è ìåíüøå. Òàêèì îáðàçîì, ïî ðåçóëüòàòàì àíàëèçà ôëàíêèðóþùèõ ó÷àñòêîâ äëÿ ôðàãìåíòà chr8:39250000-39400000, ìîæíî ïðåäïîëîæèòü, ÷òî ýòî äåëåöèÿ îáðàçîâàëàñü äàâíî, âåðîÿòíî, âî âðåìåíà âçðûâà òðàíñïîçîíîâ, êîòîðûé ïðîõîäèë ó ïðèìàòîâ áîëåå 40 ëåò íàçàä. [11] è åå ÷àñòîòà â ïîïóëÿöèè îáóñëîâëåíà âðåìåíåì âîçíèêíîâåíèÿ è òåì ôàêòîì, ÷òî îíà íåéòðàëüíàÿ (ò.å. îòñóòñòâóåò îòáîð). Ìåõàíèçì îáðàçîâàíèÿ îäíîçíà÷íî óñòàíîâèòü íå óäàëîñü. Íåàëëåëüíàÿ ãîìîëîãè÷íàÿ ðåêîìáèíàöèÿ ìîæåò ïðîèñõîäèòü ñ âîâëå÷åíèåì Alu-ïîâòîðîâ, íî îáû÷íî êîðîòêèå ïîâòîðû çàäåéñòâîâàíû â äðóãèõ ìåõàíèçìàõ, òàêèõ êàê FoSTeS, MMBIR, MHEJ è äð. Òàêæå íà ýòîò ó÷àñòîê ãåíîìà ïðèõîäèòñÿ áîëüøîå êîëè÷åñòâî ðàçëè÷íûõ âèäîâ ïîâòîðîâ, ÷òî òàêæå óêàçûâàåò íà îòñóòñòâèå äàâëåíèÿ îòáîðà è ìåíüøóþ êîíñåðâàòèâíîñòü. Ðåãèîí ñ ïñåâäîãåíîì ADAM5 èìååò àëüòåðíàòèâíûé ëîêóñ â âåðñèè ãåíîìà GRCh38. Èíòåðåñíî, ÷òî âòîðàÿ ïî ÷àñòîòå äåëåöèÿ (íà õðîìîñîìå 2), â îòëè÷èå îò îñòàëüíûõ, òàêæå õàðàêòåðèçóåòñÿ íàëè÷èåì àëüòåðíàòèâíîãî ëîêóñà. Äàííàÿ äåëåöèÿ ïîêàçàíà ñ ìåíüøåé ÷àñòîòîé â DGV gold standart, ÷åì â 1000Genomes. DGV gold standart ó÷èòûâàåò ðåçóëüòàòû 1000Genomes, ãäå äëÿ äåòåêöèè CNV ïðèìåíÿëè àëãîðèòìû íà îñíîâå NGS, à òàêæå ðåçóëüòàòû ìíîãèõ èññëåäîâàíèé, ñ ïðèìåíåíèåì ìèêðî÷èïîâ. Î÷åâèäíî, ìåòîäû äåòåêöèè íà îñíîâå NGS è ãèáðèäèçàöèè ïîêàçûâàþò íåñêîëüêî ðàçëè÷íûå ðåçóëüòàòû.

Çàêëþ÷åíèå

 õîäå äàííîãî èññëåäîâàíèÿ áûëî ïðîàíàëèçèðîâàíî 611 ãåíîìîâ ñ êðàéíå íèçêèì ïîêðûòèåì, ïîëó÷åííûõ â õîäå íåèíâàçèâíîãî ïðåíàòàëüíîãî ÄÍÊ-ñêðèíèíãà. Âñåãî áûëî îáíàðóæåíî 87 CNV, c ðàçëè÷íîé ÷àñòîòîé âñòðå÷àþùèõñÿ â âûáîðêå, èç íèõ 21 ðàíåå íå áûëè îáíàðóæåíû. Ýòè ÑNV â îñíîâíîì ïðèõîäÿòñÿ íà äóïëèêàöèè. Áîëåå ïîëîâèíû íå ñîäåðæàò áåëîê-êîäèðóþùèõ ãåíîâ. Îòîáðàííûå CNV íå ÷èñëÿòñÿ â áàçàõ äàííûõ DGV, DECIPHER è ISCA. Äåòåêöèÿ ñ ïîìîùüþ QDNAseq íà òðåõ ðàçðåøåíèÿõ, äîïîëíèòåëüíàÿ ïðîâåðêà âñåõ ïîëó÷åííûõ CNV íà ïåðåñå÷åíèå ñ «÷åðíûì ñïèñêîì ENCODE» è ïåðìóòàöèîííûé àíàëèç ïåðåñå÷åíèÿ ñ áàçîé äàííûõ DGV gold standart ïðåäïîëàãàåò êîððåêòíîñòü ïîëó÷åííûõ ðåçóëüòàòîâ. Òàêèì îáðàçîì, äàííûå ÍÈÏÑ ìîãóò áûòü èñïîëüçîâàíû äëÿ ïîëó÷åíèÿ èíôîðìàöèè î êðóïíûõ CNV â ãåíîìå ó æåíùèí, ÷òî, ó÷èòûâàÿ ìàñøòàáû ïðèìåíåíèÿ ÍÈÏÑ, ìîæåò ïîñëóæèòü îñíîâîé äëÿ ïîïóëÿöèîííûõ èññëåäîâàíèé âàðèàöèé ÷èñëà êîïèé. Îáíàðóæåííûå CNV (â êà÷åñòâå íåéòðàëüíûõ â ðîññèéñêîé ïîïóëÿöèè) ìîãóò ñëóæèòü äîïîëíèòåëüíûì èñòî÷íèêîì èíôîðìàöèè ïðè èíòåðïðåòàöèè êëèíè÷åñêèõ äàííûõ.

Ãåíû, âõîäÿùèå â äóïëèêàöèè, ïåðåïðåäñòàâëåíû â ìåòàáëè÷åñêîì ïóòè ðåöåïòîðà âèòàìèíà D, ÷òî ìîæåò óêàçûâàòü íà àäàïòèâíóþ ôóíêöèþ.

Òàêæå áûëà ïðîàíàëèçèðîâàíà âûñîêî÷àñòîòíàÿ äåëåöèÿ íà õðîìîñîìå 8. Åå ÷àñòîòà îáóñëîâëåíà âðåìåíåì ïðîèñõîæäåíèÿ è îòñóòñòâèåì îòáîðà, íî íå ìåõàíèçìîì îáðàçîâàíèÿ.

Áûë ïðîâåäåí ñðàâíèòåëüíûé àíàëèç ðàçëè÷íûõ èíñòðóìåíòîâ äëÿ îïðåäåëåíèÿ CNV â ãåíîìå ñ êðàéíå íèçêèì ïîêðûòèåì. QDNAseq îêàçàëñÿ ëó÷øèì èíñòðóìåíòîì, äàþùèì ïðèåìëåìûå ðåçóëüòàòû íà àóòîñîìàõ ñ ìàêñèìàëüíûì ðàçðåøåíèåì, ïî ñðàâíåíèþ ñ äðóãèìè. Âàæíîé ñîñòàâëÿþùåé ÿâëÿåòñÿ ó÷åò «÷åðíîãî ñïèñêà» ENCODE ïðè îïðåäåëåíèè ÑNV ïî äàííûì NGS.

Ëèòåðàòóðà

1. Stevens NE. Studies in spermatogenesis with especial reference to the accessory chromosome. 1905.Carnegie Institute of Washington, Publication no. 36, 1-32.

2. R. V. Thakker. Genetics of Bone Biology and Skeletal Disease. Academic Press, 2013

3. Paul H. Dear. Copy-number variation: the end of the huan genome? 2009, Elsevier, trends in Biotechnology Vol.27 No.8 doi:10.1016/j.tibtech.2009.05.003

4. Stranger et al. Relative impact of nucleotide and copy number variation on gene expression phenotypes. Science. 2007 Feb 9;315(5813):848-53. doi: 10.1126/science.1136678.

5. James R. Lupski. Structural Variation Mutagenesis of the Human Genome: Impact on Disease and Evolution Environ Mol Mutagen. 2015 Jun; 56(5): 419-436. doi: 10.1002/em.21943

6. Zarrei M et al. A copy number variation map of the human genome. Nat Rev Genet. 2015 Mar;16(3):172-83. doi: 10.1038/nrg3871.

7. Perry GH et al. Copy number variation and evolution in humans and chimpanzee. Genome Res. 2008 Nov;18(11):1698-710. doi: 10.1101/gr.082016.108.

8. Veerappa AM et al. Global spectrum of copy number variations reveals genome organizational plasticity and proposes new migration routes. PLoS One. 2015 Apr 24;10(4):e0121846. doi: 10.1371/journal.pone.0121846.

9. Chen et al. Ñopy number variation across European population. PLoS One. 2011; 6(8): e23087. doi: 10.1371/journal.pone.0023087.

10. Itsara A et al. Population analysis of large copy number variants and hotspots of human genetic disease. Am J Hum Genet. 2009 Feb;84(2):148-61. doi: 10.1016/j.ajhg.2008.12.014.

11. Ohshima K et al. Whole-genome screening indicates a possible burst of formation of processed pseudogenes and Alu repeats by particular L1 subfamilies in ancestral primates. Genome Biol. 2003;4(11):R74. Epub 2003 Oct 28. doi:10.1186/gb-2003-4-11-r74.

12. Ana R. Cardoso et al. Major influence of repetitive elements on disease-associated copy number variants (CNVs). Hum Genomics. 2016; 10: 30. doi: 10.1186/s40246-016-0088-9.

13. Rene J. Herrera et al. Genomes,evolution and culture: Past, Present, and Future of Humankind. John Wiley & Sons, 2016.

14. Kim et al. Copy number variations in the human genome: potential source for individual diversity and disease association studies. Genomics Inform. 2008;6:1-7.

15. Gu W et al. Mechanisms for human genomic rearrangements. Pathogenetics. 2008 Nov 3;1(1):4. doi: 10.1186/1755-8417-1-4.

16. Arlt MF et al. Replication stress and mechanisms of CNV formation. Curr Opin Genet Dev. 2012 Jun;22(3):204-10. doi: 10.1016/j.gde.2012.01.009.

17. Conrad DF et al. Origins and functional impact of copy number variation in the human genome. Nature. 2010 Apr 1;464(7289):704-12. doi: 10.1038/nature08516

18. Feng Zhang. Copy number variation in human health, disease, and evolution. Annu Rev Genomics Hum Genet. 2009 ; 10: 451-481. doi:10.1146/annurev.genom.9.081307.164217.

19. Carvalho CM et al. Mechanisms underlying structural variant formation in genomic disorders. Nat Rev Genet. 2016 Apr;17(4):224-38. doi: 10.1038/nrg.2015.25.

20. Liu P et al. Mechanisms for recurrent and complex human genomic rearrangements. Curr Opin Genet Dev. 2012 Jun;22(3):211-20. doi: 10.1016/j.gde.2012.02.012

21. Hastings PJ, Ira G, Lupski JR. A microhomology-mediated break-induced replication model for the origin of human copy number variation. Plos Genet. 2009;5:e1000327.

22. Zhang F et al.The DNA replication FoSTeS/MMBIR mechanism can generate genomic, genic and exonic complex rearrangements in humans. Nat Genet. 2009 Jul;41(7):849-53. doi: 10.1038/ng.399.

23. À. À. Êàøåâàðîâà, È. Í. Ëåáåäåâ. Ãåíîìíàÿ àðõèòåêòóðà õðîìîñîìíûõ áîëåçíåé. ÃÅÍÅÒÈÊÀ, 2016, òîì ...


Ïîäîáíûå äîêóìåíòû

  • Ðåøåíèå çàäà÷ ïî îïðåäåëåíèþ âåðîÿòíîñòíûõ è ÷èñëîâûõ õàðàêòåðèñòèê ñëó÷àéíûõ ÿâëåíèé ñ îáîñíîâàíèåì è àíàëèçîì ïîëó÷åííûõ ðåçóëüòàòîâ. Îïðåäåëåíèå âåðîÿòíîñòè, ñðåäíåãî çíà÷åíèÿ ÷èñëà, íàäåæíîñòè ñèñòåìû, ôóíêöèè ðàñïðåäåëåíèÿ, ìàòåìàòè÷åñêîãî îæèäàíèÿ.

    êóðñîâàÿ ðàáîòà [227,6 K], äîáàâëåí 06.12.2010

  • Îáëàñòü îïðåäåëåíèÿ ôóíêöèè, êîòîðàÿ ñîäåðæèò ìíîæåñòâî âîçìîæíûõ çíà÷åíèé. Íàõîæäåíèå çàêîíà ðàñïðåäåëåíèÿ è õàðàêòåðèñòèê ôóíêöèè ñëó÷àéíîé âåëè÷èíû, åñëè èçâåñòåí çàêîí ðàñïðåäåëåíèÿ åå àðãóìåíòà. Ïðèìåðû îïðåäåëåíèÿ äèñêðåòíûõ ñëó÷àéíûõ âåëè÷èí.

    ïðåçåíòàöèÿ [68,7 K], äîáàâëåí 01.11.2013

  • Äâóìåðíàÿ ôóíêöèÿ ðàñïðåäåëåíèÿ âåðîÿòíîñòåé ñëó÷àéíûõ âåëè÷èí. Ïîíÿòèå óñëîâíîé ôóíêöèè ðàñïðåäåëåíèÿ è ïëîòíîñòè ðàñïðåäåëåíèÿ âåðîÿòíîñòåé. Êîððåëÿöèÿ äâóõ ñëó÷àéíûõ âåëè÷èí. Ñèñòåìà ïðîèçâîëüíîãî ÷èñëà âåëè÷èí, óñëîâíàÿ ïëîòíîñòü ðàñïðåäåëåíèÿ.

    ðåôåðàò [325,3 K], äîáàâëåí 23.01.2011

  • Õàðàêòåðíûå îñîáåííîñòè ëîãàðèôìîâ, èõ ñâîéñòâà. Ìåòîäèêà îïðåäåëåíèÿ ëîãàðèôìà ÷èñëà ïî îñíîâàíèþ a. Îñíîâíûå ñâîéñòâà ëîãàðèôìè÷åñêîé ôóíêöèè. Ìíîæåñòâî âñåõ äåéñòâèòåëüíûõ ÷èñåë R. Àíàëèç ôóíêöèé âîçðàñòàíèÿ è óáûâàíèÿ íà âñåé îáëàñòè îïðåäåëåíèÿ.

    ïðåçåíòàöèÿ [796,3 K], äîáàâëåí 06.02.2012

  • Ïîñòàíîâêà çàäà÷ ïðèíÿòèÿ ðåøåíèé â óñëîâèÿõ íåîïðåäåëåííîñòè, ãåíåðàöèÿ è îöåíêè àëüòåðíàòèâíûõ âàðèàíòîâ èõ ðåøåíèÿ äëÿ õîðîøî è ñëàáî ñòðóêòóðèðîâàííûõ ïðîáëåì. Àíàëèòè÷åñêàÿ èåðàðõè÷åñêàÿ ïðîöåäóðà Ñààòè, ìåòîä ïîðîãîâ íåñðàâíèìîñòè "Ýëåêòðà".

    êóðñîâàÿ ðàáîòà [38,3 K], äîáàâëåí 10.04.2011

  • Àëãåáðàè÷åñêèé ðàñ÷åò ïëîòíîñòè ñëó÷àéíûõ âåëè÷èí, ìàòåìàòè÷åñêèõ îæèäàíèé, äèñïåðñèè è êîýôôèöèåíòà êîððåëÿöèè. Ðàñïðåäåëåíèå âåðîÿòíîñòåé îäíîìåðíîé ñëó÷àéíîé âåëè÷èíû. Ñîñòàâëåíèå âûáîðî÷íûõ óðàâíåíèé ïðÿìîé ðåãðåññèè, îñíîâàííîå íà èñõîäíûõ äàííûõ.

    çàäà÷à [143,4 K], äîáàâëåí 31.01.2011

  • Êëàññè÷åñêîå, ñòàòèñòè÷åñêîå è ãåîìåòðè÷åñêîå îïðåäåëåíèÿ âåðîÿòíîñòè. Äèñêðåòíûå ñëó÷àéíûå âåëè÷èíû è çàêîíû èõ ðàñïðåäåëåíèÿ. ×èñëîâûå õàðàêòåðèñòèêè ñèñòåìû ñëó÷àéíûõ âåëè÷èí. Çàêîíû ðàâíîìåðíîãî è íîðìàëüíîãî ðàñïðåäåëåíèÿ ñèñòåì ñëó÷àéíûõ âåëè÷èí.

    äèïëîìíàÿ ðàáîòà [797,0 K], äîáàâëåí 25.02.2011

  • Ïðîáëåìà íåñîèçìåðèìûõ, ïåðâûé êðèçèñ â îñíîâàíèè ìàòåìàòèêè, åãî ñëåäñòâèÿ è ïîïûòêè ïðåîäîëåíèÿ. Çàðîæäåíèå è ðàçâèòèå ïîíÿòèÿ ÷èñëà. Ñòàíîâëåíèå òåîðèè ïðåäåëà, ñîçäàíèå òåîðèè äåéñòâèòåëüíîãî ÷èñëà. Âåëèêèå ìåòåìàòèêè: Âåéåðøòðàññ, Êàíòîð, Äåäåêèíä.

    ðåôåðàò [65,2 K], äîáàâëåí 26.11.2009

  • ×èñëî êàê îñíîâíîå ïîíÿòèå ìàòåìàòèêè. Íàòóðàëüíûå ÷èñëà. Ïðîñòûå ÷èñëà Ìåðñåííà, ñîâåðøåííûå ÷èñëà. Ðàöèîíàëüíûå ÷èñëà. Äðîáíûå ÷èñëà. Äðîáè â Äðåâíåì Åãèïòå, Äðåâíåì Ðèìå. Îòðèöàòåëüíûå ÷èñëà. Êîìïëåêñíûå, âåêòîðíûå, ìàòðè÷íûå, òðàíñôèíèòíûå ÷èñëà.

    ðåôåðàò [104,5 K], äîáàâëåí 12.03.2004

  • Ïîíÿòèå è íàïðàâëåíèÿ èññëåäîâàíèÿ ñëó÷àéíûõ âåëè÷èí â ìàòåìàòèêå, èõ êëàññèôèêàöèÿ è òèïû: äèñêðåòíûå è íåïðåðûâíûå. Èõ îñíîâíûå ÷èñëîâûå õàðàêòåðèñòèêè, îòëè÷èòåëüíûå ïðèçíàêè è ñâîéñòâà. Çàêîíû ðàñïðåäåëåíèÿ ñëó÷àéíûõ âåëè÷èí, èõ ñîäåðæàíèå è ðîëü.

    ïðåçåíòàöèÿ [1,4 M], äîáàâëåí 19.07.2015

  • Âû÷èñëåíèå ñðåäíåãî îäíîìåðíûõ ñëó÷àéíûõ âåëè÷èí. Îïðåäåëåíèå äîâåðèòåëüíîãî èíòåðâàëà äëÿ ìàòåìàòè÷åñêîãî îæèäàíèÿ è äëÿ äèñïåðñèè. Ïîñòðîåíèå ýìïèðè÷åñêîé è ïðèáëèæåííîé ëèíèé ðåãðåññèè Y ïî X. Äèñïåðñèîííûé àíàëèç ãðåêî-ëàòûíñêîãî êóáà âòîðîãî ïîðÿäêà.

    êóðñîâàÿ ðàáîòà [698,0 K], äîáàâëåí 08.05.2012

  • Ìåòîäû ðåãèñòðàöèè, îïèñàíèÿ è àíàëèçà ñòàòèñòè÷åñêèõ ýêñïåðèìåíòàëüíûõ äàííûõ, ïîëó÷àåìûõ â ðåçóëüòàòå íàáëþäåíèÿ ìàññîâûõ ñëó÷àéíûõ ÿâëåíèé. Îáçîð çàäà÷ ìàòåìàòè÷åñêîé ñòàòèñòèêè. Çàêîí ðàñïðåäåëåíèÿ ñëó÷àéíîé âåëè÷èíû. Ïðîâåðêà ïðàâäîïîäîáèÿ ãèïîòåç.

    ïðåçåíòàöèÿ [113,3 K], äîáàâëåí 01.11.2013

  • Îïðåäåëåíèå ìàòåìàòè÷åñêîãî îæèäàíèÿ è ñðåäíåêâàäðàòè÷åñêîãî îòêëîíåíèÿ ñ öåëüþ ïîäáîðà çàêîíà ðàñïðåäåëåíèÿ ê âûáîðêå ñòàòèñòè÷åñêèõ äàííûõ îá îòêàçàõ ýëåìåíòîâ àâòîìîáèëÿ. Íàõîæäåíèÿ ÷èñëà ñîáûòèé â çàäàííîì èíòåðâàëå; ðàñ÷åò çíà÷åíèÿ êðèòåðèÿ Ïèðñîíà.

    êîíòðîëüíàÿ ðàáîòà [336,3 K], äîáàâëåí 01.04.2014

  • Ïîíÿòèå êîððåëÿöèîííîãî ìîìåíòà äâóõ ñëó÷àéíûõ âåëè÷èí. Ìàòåìàòè÷åñêîå îæèäàíèå ïðîèçâåäåíèÿ íåçàâèñèìûõ ñëó÷àéíûõ âåëè÷èí Õ è Ó. Ñòåïåíü òåñíîòû ëèíåéíîé çàâèñèìîñòè ìåæäó íèìè. Àáñîëþòíîå çíà÷åíèå êîýôôèöèåíòà êîððåëÿöèè, åãî ðàñ÷åò è ïîêàçàòåëü.

    ïðåçåíòàöèÿ [92,4 K], äîáàâëåí 01.11.2013

  • Êëàññèôèêàöèÿ ñëó÷àéíûõ ñîáûòèé. Ôóíêöèÿ ðàñïðåäåëåíèÿ. ×èñëîâûå õàðàêòåðèñòèêè äèñêðåòíûõ ñëó÷àéíûõ âåëè÷èí. Çàêîí ðàâíîìåðíîãî ðàñïðåäåëåíèÿ âåðîÿòíîñòåé. Ðàñïðåäåëåíèå Ñòüþäåíòà. Çàäà÷è ìàòåìàòè÷åñêîé ñòàòèñòèêè. Îöåíêè ïàðàìåòðîâ ñîâîêóïíîñòè.

    ëåêöèÿ [387,7 K], äîáàâëåí 12.12.2011

  • Ïîèñê ó÷àñòêîâ âîçðàñòàíèÿ è óáûâàíèÿ ôóíêöèé, êëàññèôèêàöèÿ ýêñòðåìóìà. Óìíîæåíèå ìàòðèö À–1Ñ. Òåîðèÿ âåðîÿòíîñòè ñîáûòèÿ è ñëó÷àéíûõ âåëè÷èí. Ïîñòðîåíèå èíòåðâàëüíîé ãðóïïèðîâêè äàííûõ. Ðåøåíèå çàäà÷è ëèíåéíîãî ïðîãðàììèðîâàíèÿ, ïîñòðîåíèå ãðàôèêà.

    êîíòðîëüíàÿ ðàáîòà [127,1 K], äîáàâëåí 11.11.2012

  • Çíàêîìñòâî ñ Ïüåðîì äå Ôåðìà - ôðàíöóçñêèì ìàòåìàòèêîì, îäíèì èç ñîçäàòåëåé àíàëèòè÷åñêîé ãåîìåòðèè, ìàòåìàòè÷åñêîãî àíàëèçà, òåîðèè âåðîÿòíîñòåé è òåîðèè ÷èñåë. Ðàçðàáîòêà ñïîñîáîâ ñèñòåìàòè÷åñêîãî íàõîæäåíèÿ âñåõ äåëèòåëåé ÷èñëà. Âåëèêàÿ òåîðåìà Ôåðìà.

    ïðåçåíòàöèÿ [389,1 K], äîáàâëåí 16.12.2011

  • Ñóùíîñòü è ìåòîäèêà îïðåäåëåíèÿ àëãåáðàè÷åñêîãî ÷èñëà, îöåíêà ñóùåñòâóþùåãî ïîëÿ. Ðàöèîíàëüíûå ïðèáëèæåíèÿ àëãåáðàè÷åñêèõ ÷èñåë. Çàäà÷à ïîñòðîåíèÿ óðàâíåíèÿ ñ çàäàííûìè êîðíÿìè. Ïðèâîäèìûå è íåïðèâîäèìûå ìíîãî÷ëåíû. Òðàíñöåíäåíòíûå ÷èñëà Ëèóâèëëÿ.

    êóðñîâàÿ ðàáîòà [219,6 K], äîáàâëåí 23.03.2015

  • Ïèñüìåííàÿ èñòîðèÿ ÷èñëà "ïè", ïðîèñõîæäåíèå åãî îáîçíà÷åíèÿ è "ïîãîíÿ" çà äåñÿòè÷íûìè çíàêàìè. Îïðåäåëåíèå ÷èñëà "ïè" êàê îòíîøåíèÿ äëèíû îêðóæíîñòè ê å¸ äèàìåòðó. Èñòîðèÿ ÷èñëà "å", ìíåìîíèêà è ìíåìîíè÷åñêîå ïðàâèëî, ÷èñëà ñ ñîáñòâåííûìè èìåíàìè.

    ðåôåðàò [125,9 K], äîáàâëåí 28.11.2010

  • Êðèòåðèè âûáðîñîâ â ñëó÷àå íîðìàëüíîãî ðàñïðåäåëåíèÿ, èõ àñèìïòîòè÷åñêèå ñâîéñòâà è ýìïèðè÷åñêàÿ ìîùíîñòü. Èññëåäîâàíèå ðàñïðåäåëåíèÿ ñòàòèñòèê ïî êðèòåðèÿì Êîëìîãîðîâà è Ñìèðíîâà. Ðåàëèçàöèÿ êðèòåðèåâ îïðåäåëåíèÿ âûáðîñîâ â ñòàòèñòè÷åñêîì ïàêåòå R.

    êóðñîâàÿ ðàáîòà [521,9 K], äîáàâëåí 10.01.2016

Ðàáîòû â àðõèâàõ êðàñèâî îôîðìëåíû ñîãëàñíî òðåáîâàíèÿì ÂÓÇîâ è ñîäåðæàò ðèñóíêè, äèàãðàììû, ôîðìóëû è ò.ä.
PPT, PPTX è PDF-ôàéëû ïðåäñòàâëåíû òîëüêî â àðõèâàõ.
Ðåêîìåíäóåì ñêà÷àòü ðàáîòó.