Èññëåäîâàíèå âàðèàöèé ÷èñëà êîïèé (CNV) â ãåíîìå ó æåíùèí íà îñíîâàíèè äàííûõ ñåêâåíèðîâàíèÿ âíåêëåòî÷íîé ÄÍÊ ïëàçìû êðîâè
Ïîâòîðû â ãåíîìå êàê èñòî÷íèêè CNV. Ìåõàíèçìû ôîðìèðîâàíèÿ è êëàññèôèêàöèÿ CNV. Ïðîãðàììû, îñíîâàííûå íà "ãëóáèíå ðèäîâ", äëÿ îïðåäåëåíèÿ CNV ïðè ìàëîì ïîêðûòèè. Ãåíåðàöèÿ ñëó÷àéíûõ ëîêóñîâ äëÿ ïåðìóòàöèîííîãî àíàëèçà. Êàòàëîã âñåõ äåòåêòèðîâàííûõ CNV.
Ðóáðèêà | Ìàòåìàòèêà |
Âèä | äèññåðòàöèÿ |
ßçûê | ðóññêèé |
Äàòà äîáàâëåíèÿ | 02.09.2018 |
Ðàçìåð ôàéëà | 1,8 M |
Îòïðàâèòü ñâîþ õîðîøóþ ðàáîòó â áàçó çíàíèé ïðîñòî. Èñïîëüçóéòå ôîðìó, ðàñïîëîæåííóþ íèæå
Ñòóäåíòû, àñïèðàíòû, ìîëîäûå ó÷åíûå, èñïîëüçóþùèå áàçó çíàíèé â ñâîåé ó÷åáå è ðàáîòå, áóäóò âàì î÷åíü áëàãîäàðíû.
Tåñòèðîâàíèå ðàáîòû èíñòðóìåíòà ïðîâîäèëîñü äëÿ 2-õ êîíòðîëüíûõ ãåíîìîâ. Âõîäíûå äàííûå: bam-ôàéë ñ èíäåêñîì, êîíòðîëüíûé bam-ôàéë ñ èíäåêñîì. Èíñòðóìåíò âûäàåò ÑNV ñ íîìåðîì õðîìîñîìû, êîîðäèíàòàìè, log2-îòíîøåíèåì, íîðìèðîâàííûì êîëè÷åñòâîì ðèäîâ äëÿ òåñòîâîãî è êîíòðîëüíîãî îáðàçöà.
QDNA-seq
R-ïàêåò, äîñòóïíûé â Bioconductor. Ðàáîòà ñ ýòèì ïðîãðàììíûì ïàêåòîì ïðåäñòàâëÿëà ñîáîé âûïîëíåíèå êîìàíä ñîãëàñíî îáùåé ñõåìå:
- çàãðóçêà àííîòàöèè äëÿ áèíîâ óêàçàííîãî ðàçìåðà: àííîòàöèÿ ñîäåðæèò èíôîðìàöèþ î ïðîöåíòå îïðåäåëåííûõ íóêëåîòèäîâ (íå N), GC-ñîñòàâå, ñðåäíåé êàðòèðóåìîñòè 50-ìåðîâ ñ 2 âîçìîæíûìè íåñîâïàäåíèÿìè, ïðîöåíò ïåðåñå÷åíèÿ ñ «÷åðíûì ñïèñêîì» èç ïðîåêòà ENCODE è äð.
- çàãðóçêà bam-ôàéëà è ïîäñ÷åò ÷èñëà ðèäîâ: êîëè÷åñòâî ðèäîâ ïîñëå ôèëüòðàöèè ïî óìîë÷àíèþ ìîæíî âèçóàëèçèðîâàòü.
êàðòèíî÷êà
- ôèëüòðàöèÿ êîëè÷åñòâà ðèäîâ ïî ïåðåñå÷åíèþ ñ «÷åðíûì ñïèñêîì», êàðòèðóåìîñòè, ó÷åò âûáðîñîâ è ïîëîâûõ õðîìîñîì
- îöåíêà êîððåêöèè ïî GC-ñîñòàâó è êàðòèðóåìîñòè è åå ïðèìåíåíèå äëÿ ïîäñ÷åòà ÷èñëà êîïèé (íà âûõîäå ïîëó÷àåì îáúåêò QDNAseqCopyNumbers)
- íîðìàëèçàöèÿ áèíîâ, ñãëàæèâàíèå è óäàëåíèå âûáðîñîâ
- ñåãìåíòàöèÿ ïðîôèëÿ ñ ïîìîùüþ ïðîãðàììû DNAcopy è ïîñëåäóþùàÿ íîðìàëèçàöèÿ
- îïðåäåëåíèå CNV
Ïî óìîë÷àíèþ îïðåäåëåíèå CNV íà çàâåðøàþùåì ýòàïå ïðîèñõîäèò ñ ïîìîùüþ âñòðîåííîãî R-ïàêåò CGHcall, îäíàêî â íåêîòîðûõ ñëó÷àÿõ, íàïðèìåð, êîãäà î÷åâèäíî çàøóìëåíèå äàííûõ îò ïîëîâûõ õðîìîñîì, àâòîðû ðåêîìåíäóþò èñïîëüçîâàòü ìåòîä cutoff, êîòîðûé ïðîñòî çàäàåò ãðàíèöû log2-îòíîøåíèÿ äëÿ îïðåäåëåíèÿ äóïëèêàöèé, äåëåöèé è àìïëèôèêàöèé.  äàííîé ðàáîòå ïðèìåíÿëñÿ èìåííî ýòîò ìåòîä.
Ïðîãðàììà ïîçâîëÿåò ëåãêî âèçóàëèçèðîâàòü ìåäèàíó ÷èñëà ðèäîâ (êàê ôóíêöèþ GC- ñîñòàâà è êàðòèðóåìîñòè), ãðàôèê çàøóìëåííîñòè êàê ôóíêöèþ îò ãëóáèíû ïîêðûòèÿ è ïðîôèëü ÷èñëà ïîñëå êîððåêöèè.
Ïðåäâàðèòåëüíîå òåñòèðîâàíèå QDNAseq ïîêàçàëî ëó÷øèå ðåçóëüòàòû (òàáëèöû 1, 2) ïî ñðàâíåíèþ ñ äðóãèìè èíñòðóìåíòàìè. Äëÿ äàëüíåéøåãî ïðèìåíåíèÿ ýòîé ïðîãðàììû áûë íàïèñàí R-ñêðèïò, êîòîðûé îïðåäåëÿåò ÑNV, óñòîé÷èâûå ê èçìåíåíèþ âåëè÷èíû îêíà.
 äàííîé ðàáîòå ïðîâîäèëñÿ ïîèñê CNV äëÿ òðåõ ðàçðåøåíèé: 15, 30, 50 êá. CNV ñ÷èòàëàñü èñòèííîé, åñëè îíà áûëà çàôèêñèðîâàíà äëÿ âñåõ òðåõ ðàçðåøåíèé, ïðè ýòîì äîñòàòî÷íî áûëî, ÷òîáû ïåðåñå÷åíèå ãðàíèö CNV äëÿ òðåõ ðàçðåøåíèå áûëî áîëüøå íóëÿ. Ïî óìîë÷àíèþ êîëè÷åñòâî áèíîâ, ïîäòâåðæäàþùèõ âàðèàöèþ (êîë-âî áèíîâ â ñåãìåíòå), áûëî íå ìåíåå 3-õ. Ò.î. èññëåäîâàíèå ïðîâîäèëîñü äëÿ CNV ñ ðàçìåðîì áîëåå 60 êá. Ãðàíèöû îïðåäåëÿëèñü ïî 15êá-ðàçðåøåíèþ. Àíàëèç ïðîâîäèëñÿ äëÿ àóòîñîì, ò. å. â êîððåêöèè íå ó÷èòûâàëèñü äàííûå äëÿ Õ-õðîìîñîìû. Òàêæå äëÿ 100 îáðàçöîâ äîïîëíèòåëüíî áûë ïðîâåäåí ðàñ÷åò ñ Õ-õðîìîñîìîé.
QDNAseq ïðåäëàãàåò ðàçëè÷íûå âàðèàíòû ïðåäñòàâëåíèÿ ðåçóëüòàòîâ (ôîðìàòû bed, seg, vcf, igv). Íàèáîëåå óäîáíûì ïîêàçàëñÿ ôîðìàò seg c èíôîðìàöèåé î õðîìîñîìå, ïîëîæåíèè íà÷àëà è êîíöà CNV, çíà÷åíèåì log2-ratio, êîëè÷åñòâîì áèíîâ â ñåãìåíòå. CNV c log2-îòíîøåíèåì áîëåå 0.49 ñ÷èòàëèñü äóïëèêàöèåé, ìåíåå -0,98 - äåëåöèåé.
2.3 Ñðàâíåíèå ðåçóëüòàòîâ ðàáîòû DWAQseq, cn.MOPS è QDNAseq íà áîëüøîì êîëè÷åñòâå îáðàçöîâ
 êà÷åñòâå îñíîâíîé ïðîãðàììû, èñïîëüçóåìîé äëÿ ïîèñêà CNV â ïîïóëÿöèè, áûëà âûáðàíà ïðîãðàììà QDNAseq. DWAC-seq è ñn.MOPS òàêæå ïîêàçàëè íàëè÷èå èçâåñòíîé äóïëèêàöèè ïðè íå áîëüøîì îáùåì êîëè÷åñòâå äåòåêòèðîâàííûõ CNV (òàáëèöà 2). Ðàñ÷åòû ñ ïîìîùüþ ýòèõ ïðîãðàìì áûëè òàêæå ïðîâåäåíû íà 235 îáðàçöàõ, â êîòîðûõ QDNAseq îïðåäåëèë 123 CNV íà òðåõ ðàçðåøåíèÿõ. Äëÿ DWAC-seq â êà÷åñòâå êîíòðîëüíîãî áûë èñïîëüçîâàí ãåíîì ñ ïîêðûòèåì 1.2õ. Äëÿ cn.MOPS âñå îáðàçöû áûëè ðàçáèòû ñëó÷àéíûì îáðàçîì íà 5 ãðóïï ñ êîëè÷åñòâîì 46-48 øò. Ñîîòâåòñòâåííî ïîèñê CNV ïðîâîäèëñÿ â 5 ãðóïïàõ ñ ðàçðåøåíèåì 300 êá.
2.4 Ãåíåðàöèÿ ñëó÷àéíûõ ëîêóñîâ äëÿ ïåðìóòàöèîííîãî àíàëèçà
Äëÿ ñðàâíåíèÿ ïîëó÷åííûõ CNV c áàçîé äàííûõ DGV áûëà èñïîëüçîâàíà ðàíåå íàïèñàííàÿ ïðîãðàììà (Python), ãåíåðèðóþùàÿ ñëó÷àéíûå ëîêóñû çàäàííîãî ðàçìåðà. Íà âõîä ïîäàåòñÿ íàáîð ÷èñåë, ñîîòâåòñòâóþùèõ äëèíàì CNV, íà âûõîäå ïîëó÷àåì íàáîð êîîðäèíàò ëîêóñîâ, ðàçáðîñàííûõ ñëó÷àéíûì îáðàçîì ïî ãåíîìó, â bed-ôîðìàòå. Ñëó÷àéíûå ëîêóñû ìîäåëèðóþòñÿ áåç ïåðåñå÷åíèÿ. Ó÷èòûâàÿ òî, ÷òî QDNAseq íå îïðåäåëÿåò CNV â ó÷àñòêàõ ãåíîìà, âõîäÿùèõ â «÷åðíûé ñïèñîê», ñëó÷àéíûå ëîêóñû ìîäåëèðîâàëèñü òàêæå áåç ïåðåñå÷åíèÿ ñ íèì.
Îïðåäåëåíèå ïåðåñå÷åíèÿ ñëó÷àéíûõ ôðàãìåíòîâ ãåíîìà ñ êîîðäèíàòàìè CNV èç áàçû DGV ïðîâîäèëîñü ñ ïîìîùüþ ïàêåòà bedtools (ïîäïðîãðàììà intersect), êîòîðàÿ èñïîëüçóåòñÿ äëÿ èññëåäîâàíèÿ ïðîñòðàíñòâåííîé êîððåëÿöèè ãåíîìíûõ äàííûõ â âèäå çàäàííûõ èíòåðâàëîâ. Äàëåå áûëî ïîñ÷èòàíî ñóììàðíîå ïåðåñå÷åíèå. Ãèñòîãðàììà ðàñïðåäåëåíèÿ ñóììàðíîé äëèíû ïåðåñå÷åíèÿ êîîðäèíàò CNV èç DGV gold standart ñî ñëó÷àéíûìè ôðàãìåíòàìè áûëà ïîñòðîåíà íà îñíîâå 1000 ñèìóëÿöèé (ðèñ. 17, 18). Àíàëèç ïðîâîäèëñÿ îòäåëüíî äëÿ äåëåöèé è äóïëèêàöèé.
2.5 Àííîòàöèÿ ïîëó÷åííûõ ðåçóëüòàòîâ
Àííîòàöèÿ ñåãìåíòîâ ïðîâîäèëàñü íà îñíîâå èíôîðìàöèè èç áàçû äàííûõ DGV. Òàêæå äëÿ ïîñëåäóþùåãî ñðàâíåíèÿ áûëè ðàññìîòðåíû ðåçóëüòàòû ïîèñêà CNV â ðàìêàõ 3 ôàçû ïðîåêòà 1000Genomes, èç ñïèñêà CNV áûëè îòôèëüòðîâàíû òðàíñïîçîíû - Alu-ïîâòîðû, LINE è SINE ýëåìåíòû, CNV íà ìèòîõîíäðèàëüíîé ÄÍÊ, èíâåðñèè è òðàíñëîêàöèè, òàê êàê QDNAseq íà èìåþùèõñÿ äàííûõ ÍÈÏÑ íå ïîçâîëÿë îïðåäåëÿòü ïîäîáíûå ñòðóêòóðíûå ýëåìåíòû ãåíîìà.
Äëÿ àíàëèçà ïîâòîðîâ â ó÷àñòêàõ, ôëàíêèðóþùèõ äåëåöèþ íà õðîìîñîìå 8 â ïîçèöèÿõ 39240000-39400000, èñïîëüçîâàëñÿ RepeatMaster. Ïîñêîëüêó ðàçðåøàþùàÿ ñïîñîáíîñòü QDNAseq íà èìåþùåìñÿ ïîêðûòèè ñîñòàâèëà 15 êá, ïîèñê ïîâòîðîâ ïðîâîäèëñÿ êàê äëÿ ãðàíèö, ïîêàçàííûõ QDNAseq, òàê è äëÿ ãðàíèö, óêàçàííûõ â DGV gold standart. Ñîîòâåòñòâóþùèå ðåãèîíû ïîèñêà ïîâòîðîâ: 39220000-39240000 è 39390000-39405000 ïî QDNAseq è 39190000-39215000 è 39380000-39400000 ïî DGV gold standart. Äëÿ ëîêàëüíîãî âûðàâíèâàíèÿ ñ öåëüþ íàõîæäåíèÿ ó÷àñòêîâ ñ íàèáîëüøåé ãîìîëîãèåé ïðèìåíÿëàñü ïðîãðàììà EMBOSS water.
Ãëàâà 3. Ðåçóëüòàòû
3.1 Òåñòèðîâàíèå ðàçëè÷íûõ èíñòðóìåíòîâ äëÿ îïðåäåëåíèÿ CNV íà ìàëîì ïîêðûòèè
Ïðåäâàðèòåëüíîå òåñòèðîâàíèå èíñòðóìåíòîâ íà òðåõ ðàçðåøåíèÿõ (30, 100 è 1000 êá) ïðîâîäèëîñü íà ãåíîìàõ ñ èçâåñòíîé äåëåöèåé (48 Má) è äóïëèêàöèåé (45 Ìá). Êîëè÷åñòâî ÷òåíèé ñîîòâåòñòâåííî 1,5 è 1,3 ìëí. Ñn.MOPS è DWAQ-seq õóæå âñåãî ñïðàâèëèñü ñ çàäà÷åé, DWAQ-seq îïðåäåëèë CNV â ñîñòàâå íåñêîëüêèõ ñåãìåíòîâ, ò.å. ñëàáûì ìåñòîì ÿâëÿåòñÿ àëãîðèòì ñåãìåíòàöèè, èñïîëüçîâàííûé íà çàâåðøàþùåì ýòàïå. Êîëè÷åñòâî CNV â ñðåäíåì íà îäíîãî ÷åëîâåêà îòëè÷àåòñÿ â ðàçíûõ èññëåäîâàíèÿõ è çàâèñèò îò ðàçðåøàþùåé ñïîñîáíîñòè ìåòîäà äåòåêöèè, îäíàêî ïðè õîðîøåì ðàçðåøåíèè îíî ñîñòàâëÿåò íå áîëåå 20 [50], â äðóãîì èññëåäîâàíèè ïîêàçàíà 1-2 CNV ïðè ñðåäíåé ïðîòÿæåííîñòè 200 êá [9]. Ïîýòîìó ìíîæåñòâî äåòåêòèðîâàííûõ CNV ìîæíî ðàññìàòðèâàòü êàê ïðèçíàê ëîæíîïîëîæèòåëüíûõ ðåçóëüòàòîâ. Äëÿ îáîèõ èíñòðóìåíòîâ õàðàêòåðíî áîëüøîå êîëè÷åñòâî äåòåêòèðîâàííûõ CNV. Âîçìîæíî, ïëîõèå ðåçóëüòàòû ðàáîòû cn.MOPS (òàáëèöà 1) ñâÿçàíû ñ òåñòèðîâàíèì íà ãåíîìàõ ñ ðàçíûì ïîêðûòèåì (12 ñ 5-6 ìëí ðèäîâ è 2 ñ 1,3 è 1,5 ìëí ðèäîâ). Äëÿ DWAQ-seq òàêæå ïîêðûòèå (˜0,08x) íèæå, ÷åì íåîáõîäèìûé ìèíèìóì, çàÿâëåííûé ðàçðàáîò÷èêàìè (0,23x).
CNVnator è XCAVATOR äåòåêòèðîâàëè ìíîæåñòâî CNV, â òîì ÷èñëå èçâåñòíûå. Íà ìàëîì ðàçðåøåíèè (1Má ) XCAVATOR îïðåäåëèë òîëüêî îäíó êðóïíóþ ÑNV â îäíîì îáðàçöå, íî íå ñðàáîòàë íà äðóãîì.  öåëîì, âîçìîæíî, ïðè óìåíüøåíèè âåëè÷èíû áèíà äî 500-700 XCAVATOR ìîæåò äåòåêòèðîâàòü êðóïíûå CNV ñ ìèíèìàëüíûì êîëè÷åñòâîì ëîæíîïîëîæèòåëüíûõ. Äëÿ ïðîâåðêè íåîáõîäèìî äîïîëíèòåëüíîå òåñòèðîâàíèå. QDNAseq ïîêàçàë íàèìåíüøåå êîëè÷åñòâî CNV, îäíàêî íå âåðíî îïðåäåëèë ãðàíèöû â îäíîì îáðàçöå. C äðóãîé ñòîðîíû, ïðè íàèìåíüøåì îáùåì êîëè÷åñòâå äåòåêòèðîâàííûõ CNV îí îïðåäåëèë òàêæå âûñîêî÷àñòîòíóþ äåëåöèþ äëÿ ðàçìåðà áèíà 30 êá.
Òàáëèöà 1
èíñòðóìåíò |
âåëè÷èíà áèíà, êá |
NA05067 |
NA14164 |
||||
êîë-âî cnv |
Äóïëèêàöèÿ íà õðîì. 9, 45 Ìá |
Äåëåöèÿ íà õðîì. 8, 200 êá |
êîë-âî cnv |
Äåëåöèÿ íà õðîì. 13, 48 Má |
|||
QDNAseq |
30 |
3 |
71 Ìá |
äà |
3 |
äà |
|
100 |
1 |
141 Ìá |
- |
1 |
äà |
||
1000 |
1 |
äà |
- |
1 |
äà |
||
XCAVATOR |
30 |
56 |
äà |
äà |
55 |
äà |
|
100 |
56 |
äà |
äà |
36 |
äà |
||
1000 |
íå ñðàáîòàë |
1 |
äà |
||||
CNVnator |
30 |
56 |
äà, â ñîñòàâå íåñêîëüêèõ ñåãìåíòîâ |
äà |
46 |
äà |
|
100 |
32 |
äà |
- |
27 |
äà |
||
1000 |
18 |
äà |
- |
19 |
äà |
||
Cn.mops |
30 |
169 |
íåò |
äà |
88 |
íåò |
|
100 |
61 |
íåò |
- |
53 |
íåò |
||
1000 |
1 |
3 Ìá |
- |
0 |
|||
DWAQ-seq |
ïîêðûòèå 1.2x |
39 |
÷àñòè÷íî |
- |
32 |
íåò |
|
ïîêðûòèå 2.4x |
100 |
÷àñòè÷íî, â ñîñòàâå íåñêîëüêèõ ñåãìåíòîâ |
- |
91 |
äà, â ñîñòàâå íåñêîëüêèõ ñåãìåíòîâ |
Îáðàçöû äëÿ äàëüíåéøåãî èññëåäîâàíèÿ ñîäåðæàò îêîëî 6 ìëí ðèäîâ. Ïîýòîìó âàæíî áûëî ïðîòåñòèðîâàòü èíñòðóìåíòû èìåííî íà òàêîì ïîêðûòèè.  îòñóòñòâèå ãåíîìîâ ñ èçâåñòíîé CNV è êîëè÷åñòâîì ðèäîâ 6 ìëí, äëÿ òåñòèðîâàíèÿ áûë âûáðàí ãåíîì ñ ëîêàëüíûì ïîâûøåíèåì â ïîêðûòèè, óñëîâíî ðàññìàòðèâàåìîì â êà÷åñòâå äóïëèêàöèè.
Òàáëèöà 2
Èíñòðóìåíò |
Êîë-âî CNV |
Äåòåêöèÿ ïðåäïîëàãàåìîé äóïëèêàöèè íà õðîì. 4 |
Âðåìÿ ðàáîòû, ìèí |
|
QDNAseq |
1 |
Äà |
3 |
|
XCAVATOR |
54 |
Äà |
20 |
|
CNVnator |
42 |
Äà |
47 |
|
Cn.MOPS |
7 |
Äà |
15 |
|
DWAQ-seq |
4 |
äà |
31 |
Âñå èíñòðóìåíòû äåòåêòèðîâàëè ïðåäïîëàãàåìóþ äóïëèêàöèþ (òàáëèöà 2). Äëÿ CNVnator è XCAVATOR óâåëè÷åíèå ïîêðûòèÿ ïî÷òè â 4 ðàçà íå çíà÷èòåëüíî ïîâëèÿëî íà îáùåå êîëè÷åñòâî CNV, ïîýòîìó îíè íå ïðèìåíÿëèñü â äàëüíåéøåì àíàëèçå. Êðîìå òîãî, äàííûå èíñòðóìåíòû èìåþò íåóäîáíûé èíòåðôåéñ, òðåáóþò îòäåëüíûõ âû÷èñëåíèé äëÿ êàæäîé õðîìîñîìû (CNVnator) èëè ïîäãîòîâêè ñïåöèàëüíûõ òåêñòîâûõ ôàéëîâ íà íåñêîëüêèõ ýòàïàõ ðàáîòû è ïðåäâàðèòåëüíîãî ïåðåâîäà bam-ôàéëîâ â ôîðìàò BigWig (XCAVATOR). Ðàçðàáîò÷èêè ïðîãðàììû DWAC-seq òàêæå òåñòèðîâàëè CNVnator íà ãåíîìå ñ êðàéíå íèçêèì ïîêðûòèåì è òàêæå îòìå÷àþò íåêîððåêòíûå ðåçóëüòàòû ðàáîòû. [34] Äëÿ DWAQ-seq è cn.MOPS îáùåå êîëè÷åñòâî CNV çàìåòíî ñîêðàòèëîñü (òàáëèöà 2). Íàèìåíüøåå êîëè÷åñòâî CNV ïðè äåòåêöèè ïðåäïîëàãàåìîé äóïëèêàöèè ïîêàçàë QDNAseq. Áûñòðåå âñåãî ñ çàäà÷åé ñïðàâèëñÿ cn.MOPS (çà 15 ìèíóò îáðàáîòàíî 12 ãåíîìîâ) è QDNAseq.
Òàêæå QDNAseq áûë çàïóùåí íà ýòîì æå îáðàçöå ñ ìåíüøåé âåëè÷èíîé áèíà, äëÿ òîãî ÷òîáû ïðîâåðèòü ðàçðåøàþùóþ ñïîñîáíîñòü. Íà âåëè÷èíå áèíà 15, 30 è 50 êá áûëî ïîëó÷åíî 7, 4, 3 CNV. 3 CNV áûëè äåòåêòèðîâàíû âî âñåõ ñëó÷àÿõ, îäíà èç êîòîðûõ ïðèõîäèëàñü íà ïðåäïîëàãàåìóþ äóïëèêàöèþ, à âòîðàÿ íà âûñîêî÷àñòîòíóþ äåëåöèþ. Äîïîëíèòåëüíûå èññëåäîâàíèÿ íà äðóãèõ îáðàçöàõ ïîêàçûâàþò, ÷òî â ðåäêèõ ñëó÷àÿõ CNV, äåòåêòèðîâàííàÿ íà 50êá, íå ïîêàçàíà íà 15. Ïîýòîìó ïîñëåäóþùèé àíàëèç îáðàçöîâ ïðîâîäèëñÿ íà òðåõ ðàçðåøåíèÿõ.
Äëÿ ïðîãðàììû cn.MOPS âåëè÷èíà áèíà, íàïðîòèâ, áûëà óâåëè÷åíà, äëÿ òîãî ÷òîáû ïðîñëåäèòü èçìåíåíèå êîëè÷åñòâà äåòåêòèðîâàííûõ CNV. Ïðè âåëè÷èíå áèíà 200, 300, 400 êá êîëè÷åñòâî äåòåêòèðîâàííûõ ÑNV, â òîì ÷èñëå ïðåäïîëàãàåìàÿ äóïëèêàöèÿ, ñîñòàâèëî 2, 2, 1. Ò.å. ïðè ïðàâèëüíîì âûáîðå ðàçðåøåíèÿ cn.MOPS òàêæå äàåò ïðèåìëåìûå ðåçóëüòàòû.
QDNAseq è cn.MOPS ÿâëÿþòñÿ R-ïàêåòàìè, ëåãêî óñòàíàâëèâàþòñÿ è èìåþò óäîáíûé èíòåðôåéñ.
Ïðîãðàììà GROM-RD, çàÿâëåííàÿ ðàçðàáîò÷èêàìè êàê õîðîøî ðàáîòàþùàÿ íà ìàëîì ïîêðûòèè, íî íå ïðîòåñòèðîâàííàÿ íà ýêñòðåìàëüíî íèçêîì, îêàçàëàñü íå ïîäõîäÿùåé äëÿ ðåøåíèÿ äàííîé çàäà÷è. Ïîñëå âûâîäà íà ýêðàí èíôîðìàöèè î ïîêðûòèè ïðîãðàììà ïåðåñòàåò ðàáîòàòü.
 öåëîì QDNAseq äàåò âîçìîæíîñòü îïðåäåëÿòü CNV c íàèìåíüøèì êîëè÷åñòâîì ëîæíîïîëîæèòåëüíûõ è íàèëó÷øèì ðàçðåøåíèåì. Ýòà ïðîãðàììà áûëà âûáðàíà â êà÷åñòâå áàçîâîé äëÿ èññëåäîâàíèÿ CNV â ðîññèéñêîé ïîïóëÿöèè. Òàêæå ÷àñòü îáðàçöîâ (235) áûëà îáðàáîòàíà àëãîðèòìàìè cn.MOPS è DWAQ-seq.
Ðèñ. 11 Ïðîôèëü log2-ratio, ïîëó÷åííûé ïðîãðàììîé QDNAseq äëÿ îáðàçöà ñ äåëåöèåé íà õðîìîñîìå 13.
3.2 Àíàëèç CNV â ðîññèéñêîé ïîïóëÿöèè ó æåíùèí íà îñíîâå äàííûõ íåèíâàçèâíîé ïðåíàòàëüíîé äèàãíîñòèêè
Ïîñëå ïðåäâàðèòåëüíîãî òåñòèðîâàíèÿ QDNAseq ïðèìåíÿëñÿ äëÿ àíàëèçà 611 ãåíîìîâ æåíùèí. CNV ñ÷èòàëàñü èñòèííî-ïîëîæèòåëüíîé, åñëè îíà îïðåäåëÿëàñü íà òðåõ ðàçðåøåíèÿõ: 15, 30 è 50 êá. Îñíîâíûå ðàñ÷åòû áûëè ïðîâåäåíû áåç ó÷åòà X-õðîìîñîìû. Âñåãî áûëî âûÿâëåíî 243 CNV ó 214 ÷åëîâåê. Ñðåäè íèõ 19 óíèêàëüíàÿ äåëåöèÿ è 68 äóïëèêàöèè. Êðóïíûå äåëåöèè â îáùåì ñëó÷àå ÷àùå áûâàþò áîëåå ïàòîãåííûìè ïî ñðàâíåíèþ ñ äóïëèêàöèÿìè, ÷òî îáóñëàâëèâàåò èõ ìåíüøåå êîëè÷åñòâî â ãåíîìå è ïîäòâåðæäàåòñÿ ðåçóëüòàòàìè äðóãèõ èññëåäîâàíèé. [44, 45] Ñ äðóãîé ñòîðîíû, îáùåå êîëè÷åñòâî äåëåöèé ñîñòàâèëî 163, äóïëèêàöèé 89. Ïðè ýòîì ñóùåñòâåííàÿ ÷àñòü ñðåäè âñåõ äåëåöèé ïðèõîäèòñÿ íà îäíó ðàñïðîñòðàíåííóþ äåëåöèþ íà õðîìîñîìå 8.  òðåòüåé ôàçå ïðîåêòà 1000Genomes ÷àñòîòà äàííîé äåëåöèè äîñòèãàåò 44%. Áûëî ïîñòðîåíî ðàñïðåäåëåíèå äëèí CNV (ðèñ. 12). Ñðåäíåå çíà÷åíèå äëèíû CNV äëÿ äóïëèêàöèé áîëüøå, ÷åì äëÿ äåëåöèé (458±15 êá è 286±15 êá cîîòâåòñòâåííî), ÷òî òàêæå ìîæåò áûòü ñâÿçàíî ñ áîëüøåé ïàòîãåííîñòüþ ïîñëåäíèõ. Äëèíà íàèáîëüøåé è íàèìåíüøåé äóïëèêàöèè: 2025000 êá è 75000 êá.  óêàçàííîì äèàïàçîíå ðàñïðåäåëåíèå ïî ðàçìåðàì: 8,8% - ìåíåå 200êá, 61,7% - îò 200 äî 500 êá, 23,5% - îò 500 äî 1000 êá, 5,8% - áîëåå 1Ìá. Äëèíà íàèáîëüøåé è íàèìåíüøåé äåëåöèè: 1184999 êá è 135000 êá.  óêàçàííîì äèàïàçîíå ðàñïðåäåëåíèå ïî ðàçìåðàì: 47,3% - ìåíåå 200êá, 47,3% - îò 200 äî 500 êá, 0% - îò 500 äî 1000 êá, 5,2% - áîëåå 1Ìá. Áîëüøàÿ ÷àñòü CNV ïðåäñòàâëåíà ñèíãëòîíàìè: 85% èç âñåõ ÑNV (ïðåäïîëàãàåòñÿ, ÷òî êàæäàÿ ÑNV ó÷èòûâàåòñÿ 1 ðàç). Íà èìåþùèõñÿ äàííûõ ó 2 ÷åëîâåê äåòåêòèðîâàíî 3 ÑNV, ó 12 - 2 CNV, ó îñòàëüíûõ ïî îäíîé. Ñðåäíåå êîëè÷åñòâî CNV íà ÷åëîâåêà ñîñòàâèëî 0.4 ïðè ìåäèàíå ïðîòÿæåííîñòè îêîëî 380 êá.
Ðèñ12. Ðàñïðåäåëåíèå äëèí óíèêàëüíûõ äåëåöèé/äóïëèêàöèé (ââåðõó). Ðàñïðåäåëåíèå óíèêàëüíûõ äåëåöèé è äóïëèêàöèé ïî õðîìîñîìàì (âíèçó).
Ðàñïðåäåëåíèå äëèí äåëåöèé è äóïëèêàöèé äëÿ óíèêàëüíûõ ÑNV îòðàæàåò èõ ðàçíîîáðàçèå, òîãäà êàê àíàëîãè÷íîå ðàñïðåäåëåíèå äëÿ âñåõ ÑNV ó÷èòûâàåò òàêæå ÷àñòîòó âñòðå÷àåìîñòè âàðèàöèé íåêîòîðîãî ðàçìåðà. Ðàñïðåäåëåíèå äëèí äëÿ äåëåöèé õàðàêòåðèçóåòñÿ âûáðîñîì (1,2 Ìá), ìàêñèìóì ïðèõîäèòñÿ íà 150 êá, ÷òî îáúÿñíÿåòñÿ àëãîðèòìîì âûáîðà CNV ïðè äåòåêöèè íà òðåõ ðàçðåøåíèÿõ ñ îïðåäåëåíèåì ãðàíèö ïî ðàçðåøåíèþ 15 êá.  òàêîì ñëó÷àå òåîðåòè÷åñêè ìàëûå CNV ðàçìåðîì îêîëî 75 êá ìîãóò áûòü äåòåêòèðîâàíû, îäíàêî ïîäîáíûå ñèòóàöèè äîëæíû âñòðå÷àòüñÿ ðåäêî, ò.ê. òàêàÿ âàðèàöèÿ õàðàêòåðèçóåòñÿ ïåðåñå÷åíèåì ðåçóëüòàòîâ QDNAseq íà äâóõ ðàçðåøåíèÿõ íå áîëåå, ÷åì íà 50%.  òî æå âðåìÿ òåñòèðîâàíèå ïîêàçàëî, ÷òî ðåçóëüòàòû QDNAseq áîëåå óñòîé÷èâû ê èçìåíåíèþ ðàçðåøåíèÿ ïî ñðàâíåíèþ ñ äðóãèìè èíñòðóìåíòàìè. Ôîðìà ðàñïðåäåëåíèÿ äëÿ äåëåöèé íå ïîääàåòñÿ èíòåðïðåòàöèè, ò ê îæèäàåìî áûëî áû óâèäåòü ìàêñèìóì îêîëî 150 êá, òîãäà êàê â äàííîì ñëó÷àå îí ïðèõîäèòñÿ íà 250-300 êá. Ðàñïðåäåëåíèå ïî õðîìîñîìàì äëÿ äåëåöèé ïîêàçûâàåò íàèáîëüøåå ÷èñëî CNV íà 2é õðîìîñîìå, ïðè ýòîì äåëåöèè áûëè äåòåêòèðîâàíû íå íà âñåõ õðîìîñîìàõ. Âîçìîæíî, ôîðìà ðàñïðåäåëåíèé äëÿ äåëåöèé ñâÿçàíà ñ ìàëûì êîëè÷åñòâîì ñîáûòèé (18).
Àíàëîãè÷íûå ãðàôèêè áûëè ïîñòðîåíû äëÿ âñåõ äåëåöèé è äóïëèêàöèé.
Ðèñ. 13 Ðàñïðåäåëåíèå äëèí CNV äëÿ âñåõ äåëåöèé è äóïëèêàöèé (ââåðõó), ðàñïðåäåëåíèå âñåõ äåëåöèé/äóïëèêàöèé ïî õðîìîñîìàì (âíèçó)
Íà ãðàôèêå ðàñïðåäåëåíèÿ äåëåöèé ïî õðîìîñîìàì îò÷åòëèâî âèäíî íàèáîëåå ÷àñòóþ CNV â ýòîì èññëåäîâàíèè: chr8:39250000-39400000.
Òàêæå áûëè ïîñòðîåíû ãðàôèêè äëÿ êðóïíûõ äåëåöèé è äóïëèêàöèé ïî ðåçóëüòàòàì 3åé ôàçû èññëåäîâàíèÿ 1000Genomes (ðèñ. 14).
Ðèñ.14 Ðàñïðåäåëåíèå äëèí CNV äëÿ äåëåöèé è äóïëèêàöèé (ââåðõó), ðàñïðåäåëåíèå âñåõ äåëåöèé/äóïëèêàöèé ïî õðîìîñîìàì (âíèçó) äëÿ äàííûõ èç ïðîåêòà 1000Genomes.
Íàèìåíüøåå êîëè÷åñòâî CNV íà 21 õðîìîñîìå, ÷òî ñêîðåå âñåãî ñâÿçàíî ñ åå ðàçìåðîì. Ðàñïðåäåëåíèÿ äëèí, ïîëó÷åííûå â äðóãèõ èññëåäîâàíèÿõ, â öåëîì ñõîæè ñ ðåçóëüòàòàìè äàííîé ðàáîòû. Ðàçìåð âûáîðêè îòëè÷àåòñÿ ïî èññëåäîâàíèÿì, îäíàêî êîëè÷åñòâî êðóïíûõ CNV, íà÷èíàÿ ñ 300 êá, ñîïîñòàâèìî äëÿ âñåõ èññëåäîâàíèé (ðèñ. 15).
Ðèñ. 15 Ðàñïðåäåëåíèÿ äëèí CNV. Âåðõ - äàííîå èññëåäîâàíèå (611 èíäèâèäîâ), ñåðåäèíà - àíàëèç CNV â åâðîïåéñêîé ïîïóëÿöèè (1964 èíäèâèäîâ), íèç ñëåâà -â ëèòîâñêîé ïîïóëÿöèè (286 èíäèâèäîâ), íèç ñïðàâà - â ôèíñêîé ïîïóëÿöèè (286 èíäèâèäîâ)
Ñðàâíèâàòü ðåçóëüòàòû, ïîëó÷åííûå â äàííîé ðàáîòå, ñ CNV èç áàçû äàííûõ ïî ðàñïðåäåëåíèÿì íå âïîëíå êîððåêòíî: âî-ïåðâûõ ñèëüíî îòëè÷àåòñÿ ðàçìåð âûáîðêè (â 1000Genomes - 2504 èíäèâèäà), âî-âòîðûõ, â ñëó÷àå ñ êðàéíå íèçêèì ïîêðûòèåì è ïðèìåíåííûì ïðàâèëîì òðåõ ðàçðåøåíèé, âåðîÿòíåå âñåãî ñïåöèôè÷íîñòü ïðåîáëàäàåò íà ÷óâñòâèòåëüíîñòüþ. Òàêîé ïîäõîä âàæåí ïðè ñîçäàíèè áàçû äàííûõ, òàê êàê íåâåðíî äåòåêòèðîâàííàÿ CNV ìîæåò îêàçàòüñÿ â äåéñòâèòåëüíîñòè ïàòîãåííîé. Ïîýòîìó äëÿ ñðàâíåíèÿ ñ áàçîé äàííûõ DGV gold standart áûë ïðîâåäåí ïåðìóòàöèîííûé àíàëèç. Ñóììàðíîå ïåðåñå÷åíèå ïîëó÷åííûõ óíèêàëüíûõ ëîêóñîâ ñ áàçîé äàííûõ DGV gold standart äëÿ äåëåöèé ñîñòàâèëî 3989 êá, äëÿ äóïëèêàöè - 10646 êá. Ðàñïðåäåëåíèÿ ñóììàðíîé äëèíû ïåðåñå÷åíèÿ DGV gold standart ñî ñëó÷àéíûìè ëîêóñàìè ñîîòâåòñòâóþùåé äëèíû ïðåäñòàâëåíû íà ðèñóíêàõ 16 è 17.
Ðèñ.16. Ãèñòîãðàììà ðàñïðåäåëåíèÿ ñóììàðíîãî ïåðåñå÷åíèÿ ñëó÷àéíûõ ëîêóñîâ ñ áàçîé äàííûõ DGV äëÿ äåëåöèé, êðàñíàÿ ëèíèÿ - ñóììàðíîå ïåðåñå÷åíèå ïîëó÷åííûõ ó÷àñòêîâ äåëåöèé ñ DGV gold standart.
Ðèñ.17 Ãèñòîãðàììà ðàñïðåäåëåíèÿ ñóììàðíîãî ïåðåñå÷åíèÿ ñëó÷àéíûõ ëîêóñîâ ñ áàçîé äàííûõ DGV äëÿ äóïëèêàöèé, êðàñíàÿ ëèíèÿ - ñóììàðíîå ïåðåñå÷åíèå ïîëó÷åííûõ äóïëèöèðîâàííûõ ó÷àñòêîâ ñ DGV gold standart.
Ãèñòîãðàììû ïîêàçûâàþò, ÷òî ñóììàðíûå âåëè÷èíû ïåðåñå÷åíèÿ ïîëó÷åííûõ ëîêóñîâ ñ áàçîé äàííûõ DGV ñóùåñòâåííî îòëè÷àþòñÿ îò ñëó÷àéíûõ.
Òàêèì îáðàçîì, ïðèìåíåíèå QDNAseq îïðàâäàíî íà ãåíîìå ñ êðàéíå íèçêèì ïîêðûòèåì è â îáùåì äàåò ðåçóëüòàò, çíà÷èòåëüíî îòëè÷àþùèéñÿ îò ñëó÷àéíîãî. Ò. å. â öåëîì ìîæíî îæèäàòü, ÷òî áîëüøàÿ ÷àñòü äåòåêòèðîâàííûõ ÑNV ÿâëÿåòñÿ èñòèííî ïîëîæèòåëüíûìè.
3.3 Àíàëèç ðåçóëüòàòîâ QDNAseq ñ ó÷åòîì X - õðîìîñîìû
Ïðîãðàììà QDNAseq ïîçâîëÿåò âêëþ÷àòü â ðàññìîòðåíèå X-õðîìîñîìó ïî óñìîòðåíèþ ïîëüçîâàòåëÿ. Àíàëèç CNV íà Õ-õðîìîñîìå ÿâëÿåòñÿ ñëîæíîé çàäà÷åé, ðåäêî âêëþ÷àåòñÿ â ïîïóëÿöèîííûå èññëåäîâàíèÿ.  ñëó÷àå QDNAseq ðàçðàáîò÷èêè ïèøóò î òîì, ÷òî ó÷åò X-õðîìîñîìû ìîæåò ïîâëèÿòü íà ðåçóëüòàòû loess-ðåãðåññèè, è èñêàçèòü ðåçóëüòàòû äåòåêöèè íà äðóãèõ õðîìîñîìàõ. Ñ äðóãîé ñòîðîíû, àíàëèç CNV íà Õ-õðîìîñîìå âàæåí äëÿ èíòåðïðåòàöèè êëèíè÷åñêèõ ðåçóëüòàòîâ, òàê êàê ïî ðåçóëüòàòàì ìèêðîìàòèðè÷íîãî àíàëèçà CNV ñ íåîïðåäåëåííîé êëèíè÷åñêîé çíà÷èìîñòüþ òàì âñòðå÷àþòñÿ äîâîëüíî ÷àñòî. Ïîýòîìó QDNAseq áûë ïðîòåñòèðîâàí íà íåñêîëüêèõ îáðàçöàõ ñ ðàçðåøåíèåì 15 êá ñ ó÷åòîì X-õðîìîñîìû è áåç.
Òàáëèöà 3
Êîëè÷åñòâî ïðîàíàëèçèðîâàííûõ îáðàçöîâ |
121 |
|
Îáùåå êîëè÷åñòâî CNV |
1295 |
|
Ñðåäíåå êîëè÷åñòâî äóïëèêàöèé íà X õðîìîñîìå íà îäèí îáðàçåö |
3 (îò 1 äî 5) |
|
Ñðåäíåå êîëè÷åñòâî äåëåöèé íà Õ õðîìîñîìå íà îäèí îáðàçåö |
7,5 (îò 1 äî 24) |
|
Êîëè÷åñòâî äóïëèêàöèé íà àóòîñîìàõ ñ ó÷åòîì X-õðîìîñîìû |
50 |
|
Êîëè÷åñòâî äóïëèêàöèé íà àóòîñîìàõ áåç ó÷åòà X-õðîìîñîìû |
68 |
|
Êîëè÷åñòâî äåëåöèé íà àóòîñîìàõ ñ ó÷åòîì X-õðîìîñîìû |
134 |
|
Êîëè÷åñòâî äåëåöèé íà àóòîñîìàõ áåç ó÷åòà X-õðîìîñîìû |
205 |
Ó÷åò Õ - õðîìîñîìû íåãàòèâíî ñêàçûâàåòñÿ íà ðåçóëüòàòàõ. Ïðîãðàììà QDNAseq ïîêàçûâàåò áîëüøîå êîëè÷åñòâî CNV íà Õ-õðîìîñîìå, ðåçóëüòàòû íå ñîâïàäàþò ñ áàçàìè äàííûõ. Ñ äðóãîé ñòîðîíû, íàáëþäàåòñÿ óìåíüøåíèå êîëè÷åñòâà äåòåêòèðîâàííûõ CNV íà àóòîñîìàõ, ÷òî ìîæåò áûòü ïîëåçíî â äàëüíåéøåì àíàëèçå. Îäíàêî ê ÷èñëó íåäåòåêòèðîâàííûõ CNV îòíîñèòñÿ òàêæå âûñîêî÷àñòîòíàÿ äåëåöèÿ, ò. å. ýòè CNV ìîãóò îêàçàòüñÿ ëîæíî-îòðèöàòåëüíûìè. Òàêæå ÷àñòü âàðèàöèé, îïðåäåëåííûõ ïðè âêëþ÷åíèè Õ-õðîìîñîìû, íå ïîêàçàíû ïðè çàïóñêå QDNAseq íà àóòîñîìàõ. Íè îíà èç íèõ íå âîøëà â êàòàëîã, ñîçäàííûé íà â õîäå äàííîãî èññëåäîâàíèÿ. Íàïðèìåð, ïðåîáëàäàþùàÿ äåëåöèÿ íà 19 õðîìîñîìå áûëà äåòåêòèðîâàíà êàê ëîæíî-ïîëîæèòåëüíàÿ â ñâÿçè ñ ãðàíè÷íûì ðàñïîëîæåíèåì ïî îòíîøåíèþ ê ó÷àñòêó ãåíîìà èç «÷åðíîãî ñïèñêà». Òàêèì îáðàçîì, âêëþ÷åíèå Õ-õðîìîñîìû íå æåëàòåëüíî ïðè íàñòðîéêå ïàðàìåòðîâ QDNAseq, ò.ê. îíî íå äàåò êîððåêòíûõ ðåçóëüòàòîâ äëÿ X õðîìîñîìû è èñêàæàåò ðåçóëüòàòû äëÿ äðóãèõ õðîìîñîì, ÷òî, âåðîÿòíî ñâÿçàíî, ñ GC - êîððåêöèåé è ñ èñêàæåíèåì ñèãíàëà èç-çà èçìåíåíèÿ â êîëè÷åñòâå ðèäîâ íà X-õðîìîñîìå ïðè áåðåìåííîñòè ïëîäîì ìóæñêîãî ïîëà.
3.4 Ïîèñê CNV ñ ïîìîùüþ ïðîãðàìì DWAC-seq è cn.MOPS
Òàê êàê íà âòîðîì ýòàïå ïðåäâàðèòåëüíîãî òåñòèðîâàíèÿ DWAQseq è cn.MOPS òàêæå îïðåäåëèëè ïðåäïîëàãàåìóþ CNV c íåáîëüøèì îáùèì êîëè÷åñòâîì äåòåêòèðîâàííûõ CNV (òàáëèöà 2), ýòè ïðîãðàììû áûëè èñïîëüçîâàíû äëÿ àíàëèçà CNV â 235 îáðàçöàõ. Òàêæå äëÿ ýòèõ îáðàçöîâ èìåëèñü äàííûå QDNAseq äëÿ òðåõ ðàçðåøåíèé (íàéäåíî 123 CNV). Ïîñêîëüêó «ïðàâèëî òðåõ ðàçðåøåíèé» ïðèâîäèò ê ñîêðàùåíèþ êîëè÷åñòâà íàéäåííûõ CNV, âîçìîæíî, ÷àñòü èç íèõ îêàçûâàåòñÿ ëîæíîîòðèöàòåëüíûìè. Ïðè êîððåêòíûõ ðåçóëüòàòàõ ñðàâíåíèÿ ðàáîòû QDNAseq, DWAQseq è cn.MOPS ïðåäïîëàãàëîñü â äàëüíåéøåì ðàñøèðèòü êàòàëîã CNV âêëþ÷åíèåì âàðèàöèé, äåòåêòèðîâàííûõ QDNAseq íà îäíîì ðàçðåøåíèè è åùå îäíèì èíñòðóìåíòîì.
Äëÿ cn.mops áûëî âûáðàíî ðàçðåøåíèå 300 êá, è ñ åãî ïîìîùüþ ìîæíî áûëî îïðåäåëèòü òîëüêî êðóïíûå CNV ðàçìåðîì áîëåå 900 êá. QDNAseq ïîêàçàë 5 òàêèõ CNV äëÿ èññëåäóåìûõ îáðàçöîâ. Âñåãî ñn.mops äåòåêòèðîâàë 178 êðóïíûõ CNV, ïðè ýòîì 5 èç 5 âîçìîæíûõ CNV ñîâïàëè ñ QDNAseq.
DWAQ-seq íå ïðåäïîëàãàåò çàäàíèÿ ïàðàìåòðà âåëè÷èíû áèíà, ìèíèìàëüíûé ðàçìåð CNV ñîñòàâèë 1 êá, ÷òî óæå ãîâîðèò î âîçìîæíîñòè ëîæíîïîëîæèòåëüíûõ ðåçóëüòàòîâ, ò.ê. îæèäàåìîå êîëè÷åñòâî ðèäîâ, ïðèõîäÿùèõñÿ íà ôðàãìåíò òàêîé âåëè÷èíû, ñîñòàâëÿåò 2 øò ïðè îáùåì êîëè÷åñòâå ðèäîâ îêîëî 6ìëí.  235 îáðàçöàõ ñ ïîìîùüþ äàííîãî èíñòðóìåíòà áûëî ïîëó÷åíî 264 CNV, èç êîòîðûõ 4 êðóïíûõ ñîâïàëè ñ QDNAseq.
Îòëè÷èòåëüíîé îñîáåííîñòüþ ïðîãðàììû QDNAseq ÿâëÿåòñÿ ó÷åò «÷åðíîãî ñïèñêà» ENCODE.  ýòîò ñïèñîê âõîäÿò ó÷àñòêè ãåíîìà, õàðàêòåðèçóþùèåñÿ ñëîæíîñòÿìè ïðè êàðòèðîâàíèè. Îáû÷íî êàðòèðîâàíèå ðèäîâ íà ýòè ó÷àñòêè äàåò àíîìàëüíî áîëüøîå êîëè÷åñòâî ðèäîâ, â îñíîâíîì èç-çà ïîâòîðÿþùèõñÿ ïîñëåäîâàòåëüíîñòåé.
Òàêæå ðàçðàáîò÷èêè QDNAseq äîïîëíèëè ýòîò ñïèñîê íåñêîëüêèìè ó÷àñòêàìè, ïîëó÷åííûìè ïðè àíàëèçå äàííûõ èç 1000Genomes. Ïðîãðàììû DWAQseq è cn.MOPS íå ó÷èòûâàþò «÷åðíûé ñïèñîê». Èìåííî ýòèì îáúÿñíÿåòñÿ áîëüøîå êîëè÷åñòâî äåòåêòèðîâàííûõ äóïëèêàöèé.
DWAQseq |
cn.MOPS |
||
Êîëè÷åñòâî CNV, ïåðåñåêàþùèõñÿ ñ «÷åðíûì ñïèñêîì» |
259 |
171 |
Òàêèì îáðàçîì, áîëüøèíñòâî CNV, äåòåêòèðîâàííûõ DWAQseq è cn.MOPS, ïåðåñåêàþòñÿ ñ «÷åðíûì ñïèñêîì» ENCODE è îòðàæàþò ïðîáëåìó êàðòèðîâàíèÿ ðèäîâ ïðè àíàëèçå CNV c ïîìîùüþ NGS, à íå èñòèííóþ âàðèàáåëüíîñòü ÷èñëà êîïèé.  ñëó÷àå DWAQseq ãèáðèäíûé ãåíîì ïîëó÷àåòñÿ â ýòèõ ó÷àñòêàõ åùå áîëåå èñêàæåííûì. Ðåçóëüòàòû ðàáîòû èíñòðóìåíòîâ îêàçàëèñü íåóäîâëåòâîðèòåëüíûìè ïðè àíàëèçå áîëüøîãî ÷èñëà îáðàçöîâ. Íåñêîëüêî êðóïíûõ CNV ñîâïàëè ñ ðåçóëüòàòàìè QDNAseq íà òðåõ ðàçðåøåíèÿõ. Òàêæå ñ ïîìîùüþ DWAQ-seq è cn.MOPS áûëî íàéäåíî 1 è 2 êðóïíûå CNV ñîîòâåòñòâåííî, íå ïåðåñåêàþùèåñÿ ñ «÷åðíûì ñïèñêîì» è QDNAseq.  äàííîì èññëåäîâàíèè îíè íå áûëè âêëþ÷åíû â ôèíàëüíûé êàòàëîã. Èñêëþ÷åíèå ïðîáëåìíûõ ó÷àñòêîâ èç ðàññìîòðåíèÿ ìîãëî áû óëó÷øèòü ðàáîòó ïðîãðàìì, è â äàëüíåéøåì èõ ìîæíî áûëî áû ïðèìåíÿòü äëÿ äåòåêöèè êðóïíûõ (áîëåå 700 êá) CNV.
3.5 Êàòàëîã âñåõ äåòåêòèðîâàííûõ CNV
Ïî ðåçóëüòàòàì àíàëèçà îáðàçöîâ ñ ïîìîùüþ QDNAseq áûë ñîñòàâëåí êàòàëîã CNV, ïðåäïîëîæèòåëüíî, íåéòðàëüíûõ â ðîññèéñêîé ïîïóëÿöèè ó æåíùèí. CNV, äåòåêòèðîâàííûå QDNAseq íà òðåõ ðàçðåøåíèÿõ, íî ïåðåñåêàþùèå öåëèêîì êàê ìèíèìóì 1 ó÷àñòîê èç «÷åðíîãî ñïèñêà», òàêæå áûëè îòôèëüòðîâàíû. Ïîëó÷åííûå CNV áûëè ïðîàíàëèçèðîâàíû ñ òî÷êè çðåíèÿ ïåðåñå÷åíèÿ ñ áàçîé äàííûõ DGV. 10 äóïëèêàöèé è 13 äåëåöèé ñîâïàäàåò ñ DGV gold standart, 9 äåëåöèé è 23 äóïëèêàöèè ïîëíîñòüþ èëè ÷àñòè÷íî ïåðåñåêàåòñÿ ñ íåñêîëüêèìè èññëåäîâàíèÿìè â DGV, 13 CNV îòñóòñòâóåò â áàçå äàííûõ DGV, íî ïðè ýòîì âõîäÿò â áàçó äàííûõ ISCA êàê äîáðîêà÷åñòâåííûå, åùå 7 CNV âõîäÿò â ISCA c íå ÿñíîé êëèíè÷åñêîé çíà÷èìîñòüþ. Òàêæå äåòåêòèðîâàíî 20 íå âûÿâëåííûõ ðàíåå CNV (íå ïåðåñåêàþòñÿ íè ñ îäíèì èññëåäîâàíèåì èç DGV è íå óêàçàíà â ISCA). Ïðè ýòîì 3 äóïëèêàöèè, ÷àñòè÷íî ïåðåñåêàþùèåñÿ ñ èññëåäîâàíèÿìè èç DGV, óêàçàíû â áàçå äàííûõ DECIPHER êàê ïàòîãåííûå (óìåðåííàÿ óìñòâåííàÿ îòñòàëîñòü, ñóäîðîãè). Îäíà èç äåëåöèé íå îáíàðóæåíà â áàçàõ äàííûõ, îäíàêî ìóòàöèÿ â ãåíå, îòíîñÿùåìñÿ ê ýòîìó ëîêóñó, àññîöèèðîâàíà ñ àìèîòðîôè÷åñêèì ëàòåðàëüíûì ñêîëåðîçîì (ïîêàçàíî äëÿ ãåòåðîçèãîòû) è øèçîôðåíèåé. Ïðåäïîëîæèòåëüíî, ýòè CNV ÿâëÿþòñÿ ëîæíîïîëîæèòåëüíûìè. Îíè èñêëþ÷åíû èç êàòàëîãà.
16% â ñóììå ïðèõîäèòñÿ íà áåëîê-êîäèðóþùèå ãåíû äëÿ äåëåöèé è 25% - äëÿ äóïëèêàöèé. Ðàçíèöà â ïðîöåíòíîì ñîäåðæàíèè áåëîê-êîäèðóþùèõ ãåíîâ òàêæå îòðàæàåò òîò ôàêò, ÷òî äåëåöèè îáû÷íî áûâàþò áîëåå âðåäíûìè ïî ñðàâíåíèþ ñ äóïëèêàöèÿìè. Îñòàëüíûå ãåíû ïðåäñòàâëåíû ïñåâäîãåíàìè, ìàëûìè ÿäåðíûìè ÐÍÊ, ìèêðîÐÍÊ, äëèííûìè âñòàâêàìè íåêîäèðóþùèõ ÐÍÊ è äð. Íà âñå ãåíû â ñîâîêóïíîñòè ïðèõîäèòñÿ 24% äëÿ äåëåöèé è 29% äëÿ äóïëèêàöèé.
Òàáëèöà 4. Äóïëèêàöèè.
õðîìoñîìà |
êîîðäèíàòû |
íàëè÷èå â áàçå dgv (ïðè ñîâïàäåíèè ñ dgv gold standart óêàçàíà ÷àñòîòà) |
êîëè÷åñòâî ÷åëîâåê ñ äàííîé CNV |
íàëè÷èå è ñòàòóñ â áàçå äàííûõ isca ëèáî DECIPHER |
|
1 |
46215001-46470000 |
1 |
äîáðîêà÷åñòâåííàÿ |
||
1 |
164865001-165285000 |
dwaq |
1 |
||
1 |
175410001-175770000 |
dwaq |
1 |
äîáðîêà÷åñòâåííàÿ |
|
1 |
229920001-230160000 |
1 |
|||
1 |
246165001-247410000 |
1 |
íåîïðåäåëåííîé êëèíè÷åñêîé çíà÷èìîñòè |
||
2 |
31605001-31860000 |
0.02% |
1 |
||
2 |
86280001-86505000 |
0.08% |
1 |
||
2 |
99840001-99915000 |
0.16% |
1 |
||
2 |
173535001-173895000 |
÷àñòè÷íîå ïåðåñå÷åíèå ñ 2-ìÿ èññëåäîâàíèÿìè |
1 |
||
2 |
215145001-216375000 |
1 |
íåîïðåäåëåííîé êëèíè÷åñêîé çíà÷èìîñòè |
||
2 |
237180001-237705000 |
ïåðåñå÷åíèå ñ 1 èññëåäîâàíèåì è ÷àñòè÷íî ñ 2-ìÿ |
2 |
äîáðîêà÷åñòâåííàÿ |
|
3 |
6735001-7020000 |
0.02% |
1 |
||
3 |
65880001-66165000 |
÷àñòè÷íîå ïåðåñå÷åíèå ñ dgv gold standart è ïîëíîå ñ 1 èññëåäîâàíèåì |
1 |
||
3 |
100335001-100425000 |
1,43% |
1 |
||
3 |
111810001-112275000 |
1 |
|||
3 |
165510001-165900000 |
÷àñòè÷íîå ïåðåñå÷åíèå ñ 2-ìÿ èññëåäîâàíèÿìè |
1 |
äîáðîêà÷åñòâåííàÿ |
|
3 |
90001-345000 |
0.02% |
1 |
||
3 |
182295001-182550000 |
1 |
|||
4 |
10125001-10755000 |
÷àñòè÷íîå ïåðåñå÷åíèå ñ dgv gold standart, 0,01% |
1 |
||
4 |
17295001-17520000 |
ïåðåñå÷åíèå ñ 1 èññëåäîâàíèåì |
1 |
||
4 |
83460001-83640000 |
÷àñòè÷íîå ïåðåñå÷åíèå ñ 1 èññëåäîâàíèåì |
1 |
||
4* |
96150001-98175000 |
1 |
|||
4 |
164820001-165465000 |
1 |
íåîïðåäåëåííîé êëèíè÷åñêîé çíà÷èìîñòè |
||
4 |
183660001-184170000 |
÷àñòè÷íîå ïåðåñå÷åíèå ñ 1 èññëåäîâàíèåì dwaq 1 |
1 |
äîáðîêà÷åñòâåííàÿ |
|
4 |
189480001-190065000 |
÷àñòè÷íîå ïåðåñå÷åíèå ñ dgv gold standart è ïîëíîå ñ 1 èññëåäîâàíèåì |
1 |
äîáðîêà÷åñòâåííàÿ |
|
5 |
27195001-27720000 |
ïåðåñå÷åíèå ñ 2 èññëåäîâàíèåì |
1 |
äîáðîêà÷åñòâåííàÿ |
|
5 |
51105001-51270000 |
1 |
|||
5 |
130080001-130485000 |
ïåðåñå÷åíèå ñ 2 èññëåäîâàíèåì |
1 |
||
6 |
1740001-2130000 |
1 |
|||
6* |
77175001-77670000 |
1 |
|||
6 |
86805001-87405000 |
1 |
|||
6 |
141345001-141945000 |
0.04% |
2 |
||
6 |
168330001-168615000 |
2.61% |
5 |
||
7 |
9735001-10050000 |
÷àñòè÷íîå ïåðåñå÷åíèå ñ dgv gold standart, 0.28% |
1 |
||
7 |
87705001-87990000 |
1 |
|||
7 |
144690001-145095000 |
1 |
|||
7 |
100965001-101145000 |
0.67% |
2 |
||
8 |
13320001-13635000 |
÷àñòè÷íîå ïåðåñå÷åíèå ñ dgv gold standart, 0.04 % |
2 |
||
8 |
2355001- 2580000 |
0.14% |
2 |
äîáðîêà÷åñòâåííàÿ |
|
9 |
4125001-4530000 |
÷àñòè÷íîå ïåðåñå÷åíèå ñ 2 èññëåäîâàíèÿìè |
1 |
||
9* |
10905001-12915000 |
1 |
äîáðîêà÷åñòâåííàÿ |
||
9 |
37725001-38160000 |
1 |
ïðèïàäêè |
||
10 |
20310001-21045000 |
1 |
|||
10 |
21180001 21750000 |
1 |
íåîïðåäåëåííîé êëèíè÷åñêîé çíà÷èìîñòè |
||
11 |
33525001-33750000 |
1 |
|||
11 |
101430001-101865000 |
ïåðåñå÷åíèå ñ 1 èññëåäîâàíèåì |
1 |
íåîïðåäåëåííîé êëèíè÷åñêîé çíà÷èìîñòè |
|
12 |
33780001-34305000 |
0.18% |
1 |
||
12 |
109545001-109665000 |
ïåðåñå÷åíèå ñ 4 èññëåäîâàíèåì |
1 |
äîáðîêà÷åñòâåííàÿ |
|
12 |
114225001-114570000 |
3 |
|||
12 |
127590001-128055000 |
ïåðåñå÷åíèå ñ 4 èññëåäîâàíèåì |
1 |
||
12 |
129315001-129540000 |
÷àñòè÷íîå ïåðåñå÷åíèå ñ 3 èññëåäîâàíèÿìè |
1 |
||
12 |
129825001-130485000 |
÷àñòè÷íîå ïåðåñå÷åíèå ñ 1 èññëåäîâàíèåì |
1 |
óìåðåííàÿ óìñòâåííàÿ îòñòàëîñòü |
|
13 |
75390001-75615000 |
ïåðåñå÷åíèå ñ 1 èññëåäîâàíèåì è ÷àñòè÷íî ñ 1 |
1 |
||
13 |
83925001-84330000 |
1 |
|||
13 |
84885001-85320000 |
÷àñòè÷íîå ïåðåñå÷åíèå ñ 1 èññëåäîâàíèåì |
1 |
||
14 |
43830001-44250000 |
0,34% |
3 |
||
14* |
104145001-104910000 |
1 |
|||
15 |
47400001-47895000 |
1 |
|||
15 |
54840001-55425000 |
1 |
|||
15 |
85830001- 86010000 |
0.20% |
1 |
||
16 |
59820001-60345000 |
1 |
|||
16 |
77280001-77595000 |
÷àñòè÷íîå ïåðåñå÷åíèå ñ 3 èññëåäîâàíèÿìè |
1 |
||
16 |
20130001- 20415000 |
1 |
|||
16 |
21945001- 22380000 |
0.03% |
1 |
||
17 |
77145001-77385000 |
ïåðåñå÷åíèå ñ 2 èññëåäîâàíèÿìè |
1 |
||
18 |
52320001-52620000 |
1 |
|||
20 |
12915001-13710000 |
÷àñòè÷íîå ïåðåñå÷åíèå ñ 3 èññëåäîâàíèÿìè |
1 |
êîãíèòèâíûå íàðóøåíèÿ |
|
22 |
22305001-22575000 |
0,45% |
2 |
Çåëåíûì öâåòîì âûäåëåíû ïàòîãåííûå äóïëèêàöèè èç áàçû äàííûõ DECIPHER. Çíàêîì «*» îòìå÷åíû CNV, ïîäòâåðæäåííûå òàêæå DWAQ-seq ëèáî cn.mops ïîñëå ôèëüòðàöèè ðåçóëüòàòîâ ðàáîòû ýòèõ àëãîðèòìîâ íà ïðåäìåò ïåðåñå÷åíèÿ ñ «÷åðíûì ñïèñêîì» ENCODE.
Òàáëèöà 5. Äåëåöèè.
Õðîìî ñîìà |
êîîðäèíàòû |
íàëè÷èå â áàçå dgv (ïðè ñîâïàäåíèè ñ dgv gold standart óêàçàíà ÷àñòîòà) |
êîëè÷åñòâî ÷åëîâåê ñ äàííîé CNV |
íàëè÷èå è ñòàòóñ â áàçå äàííûõ isca ëèáî OMIM |
ãåíû (áåëîê-êîäèðóþùèå - ñèíèé) |
|
1 |
102660001-102855000 |
0.32% |
1 |
ENSG00000233359 |
||
2 |
168420001-168645000 |
÷àñòè÷íîå ïåðåñå÷åíèå ñ dgv gold standart (0.05%) è ïîëíîå ñ 1 èññëåäîâàíèåì |
1 |
ENSG00000214211,ENSG00000238357 |
||
2 |
193395001-193560000 |
÷àñòè÷íîå ïåðåñå÷åíèå ñ dgv gold standart (0.05%) è ïîëíîå ñ 1 èññëåäîâàíèåì |
1 |
ENSG00000229395,ENSG00000232227 |
||
2 |
212580001-212745000 |
1 |
Ìóòàöèè â ãåíå ERBB4 ñâÿçàíû ñ àìèîòðîôè÷åñêèì ëàòåðàëüíûì ñêîëåðîçîì è øèçîôðåíèåé |
ENSG00000178568,ENSG00000232631,ENSG00000236007 |
||
2 |
242850001-243015000 |
0,67% |
16 |
ENSG00000226423,ENSG00000232002,ENSG00000233806,ENSG00000237940 |
||
3 |
1695001-1980000 |
ïåðåñå÷åíèå ñ 2 èññëåäîâàíèÿìè, ÷àñòè÷íî ñ DGV gold standart |
1 |
äîáðîêà÷åñòâåííàÿ |
||
3 |
164145001-164385000 |
ïåðåñå÷åíèå ñ 2 èññëåäîâàíèÿìè |
1 |
äîáðîêà÷åñòâåííàÿ |
||
4 |
187245001-188430000 |
Äóïëèêàöèÿ â DGV |
1 |
Íåÿñíîé êëèíè÷åñêîé çíà÷èìîñòè |
||
4 |
28485001-28620000 |
Ïåðåñå÷åíèå ñ îäíèì èññëåäîâàíèåì |
1 |
|||
7 |
53760001-54165000 |
1 |
||||
7 |
111045001-111195000 |
0.07% |
1 |
|||
8 |
39225001-39405000 |
18,16% |
116 (18,9%) |
|||
8 |
137670001-137865000 |
3,56% |
11 (1,8%) |
|||
9 |
12015001-12420000 |
ïåðåñåêàåòñÿ ñ 4 èññëåäîâàíèÿìè |
3 |
äîáðîêà÷åñòâåííàÿ |
||
9 |
28590001-28770000 |
0,04% |
1 |
|||
11 |
91170001-91425000 |
Ïåðåñåêàåòñÿ ÷àñòè÷íî ñ 1 èññëåäîâàíèåì |
1 |
äîáðîêà÷åñòâåííàÿ |
||
12 |
21015001-21420000 |
0,06% |
1 |
ENSG00000084453,ENSG00000111700,ENSG00000134538,ENSG00000205754,ENSG00000257046,ENSG00000257062 |
||
20 |
14850001-15105000 |
0,07% |
1 |
|||
20 |
14655001-14865000 |
0,07% |
1 |
äîáðîêà÷åñòâåííàÿ |
ENSG00000172264, ENSG00000213950 |
|
22 |
25725001-25965000 |
2,4% |
1 |
ENSG00000100058,ENSG00000100068,ENSG00000100077,ENSG00000230637,ENSG00000231466,ENSG00000234884,ENSG00000265978,ENSG00000271138,ENSG00000272798,ENSG00000272942,ENSG00000272977 |
Êðàñíûì öâåòîì âûäåëåíà äåëåöèÿ ëîêóñà, ãåòåðîçèãîòíàÿ ìóòàöèÿ â êîòîðîì àññîöèèðîâàíà ñ àìèîòðîôè÷åñêèì ëàòåðàëüíûì ñêîëåðîçîì, à òàêæå ìóòàöèè â ëîêóñå ñâÿçàíû ñ øèçîôðåíèåé ñîãëàñíî áàçå äàííûõ OMIM.
Ðàíåå íå îïèñàííûå CNV
Ïî ðåçóëüòàòàì àíàëèçà âñåõ CNV áûëî âûäåëåíî 19 äóïëèêàöèé è 2 äåëåöèè, íå âñòðå÷àþùèåñÿ â áàçàõ äàííûõ DGV, DECIPHER è ISCA. Ýòè âàðèàöèè êîïèé ìîæíî ðàññìàòðèâàòü êàê õàðàêòåðíûå äëÿ ðîññèéñêîé ïîïóëÿöèè â íîðìå.
Òàáëèöà 6. Íå îïèñàííûå ðàíåå CNV.  ñòîëáöå àííîòàöèè («ãåíû/ íå êîäèðóþùèå ïîñëåäîâàòåëüíîñòè») óêàçàíû òîëüêî òå ãåíû, êîòîðûå ïîëíîñòüþ âõîäÿò â äóïëèöèðîâàííûé ó÷àñòîê
Êîîðäèíàòû |
Òèï |
Ãåíû/ íå êîäèðóþùèå ïîñëåäîâàòåëüíîñòè |
|
chr1:164865001-165285000 |
äóïëèêàöèÿ |
ïðîöåññèðîâàííûé ïñåâäîãåí, ìàëàÿ ÿäåðíàÿ ðíê, ìàëàÿ ÿäðûøêîâàÿ ðíê |
|
chr1: 229920001-230160000 |
äóïëèêàöèÿ |
äëèííàÿ ìåæãåííàÿ íåêîäèðóþùàÿ ðíê |
|
chr3: 111810001-112275000 |
äóïëèêàöèÿ |
GCSAM, SLC9C1, CD200, BTLA, äëèííàÿ ìåæãåííàÿ íåêîäèðóþùàÿ ðíê |
|
chr3: 182295001-182550000 |
äóïëèêàöèÿ |
äëèííàÿ ìåæãåííàÿ íåêîäèðóþùàÿ ðíê, ïñåâäîãåíû |
|
chr5: 51105001-51270000 |
äóïëèêàöèÿ |
ðèáîñîìàëüíûé ïñåâäîãåí |
|
chr6: 1740001-2130000 |
äóïëèêàöèÿ |
||
chr6:77175001-77670000 |
äóïëèêàöèÿ |
äëèííàÿ ìåæãåííàÿ íåêîäèðóþùàÿ ðíê, ïñåâäîãåíû, ìàëàÿ ÿäåðíàÿ ÐÍÊ |
|
chr6:86805001-87405000 |
äóïëèêàöèÿ |
ïñåâäîãåí, ìèêðîÐÍÊ |
|
chr7:87705001-87990000 |
äóïëèêàöèÿ |
SRI, STEAP4 |
|
chr7:144690001-145095000 |
äóïëèêàöèÿ |
ïðîöåññèðîâàííûé ïñåâäîãåí |
|
chr10:20310001-21045000 |
äóïëèêàöèÿ |
ìèêðîÐÍÊ, ïñåâäîãåíû |
|
chr11: 33525001-33750000 |
äóïëèêàöèÿ |
KIAA1549L, CD59, C11orf91 |
|
chr12:114225001-114570000 |
äóïëèêàöèÿ |
RBM19 |
|
chr14:104145001-104910000 |
äóïëèêàöèÿ |
PPP1R13B, XRCC3, ATP5MPL, TDRD9, RD3L, ASPG, KIF26A, C14orf144 |
|
chr15:47400001-47895000 |
äóïëèêàöèÿ |
ïñåâäîãåíû, ìèêðîÐÍÊ |
|
chr15:54840001-55425000 |
äóïëèêàöèÿ |
äëèííàÿ ìåæãåííàÿ íåêîäèðóþùàÿ ðíê |
|
chr16: 59820001-60345000 |
äóïëèêàöèÿ |
äëèííàÿ ìåæãåííàÿ íåêîäèðóþùàÿ ðíê |
|
chr16: 20130001- 20415000 |
äóïëèêàöèÿ |
GP2 |
|
chr18:52320001-52620000 |
äóïëèêàöèÿ |
RAB27B |
|
chr7:53760001-54165000 |
äåëåöèÿ |
ïðîöåññèðîâàííûé ïñåâäîãåí, äëèííàÿ ìåæãåííàÿ íåêîäèðóþùàÿ ðíê è òä |
|
chr2: 212580001-212745000 |
äåëåöèÿ |
ERBB4 Ìóòàöèè â ãåíå ERBB4 ñâÿçàíû ñ àìèîòðîôè÷åñêèì ëàòåðàëüíûì ñêîëåðîçîì è øèçîôðåíèåé, ïðîöåññèðîâàííûå ïñåâäîãåíû |
Ïîëó÷åííûé ñïèñîê ãåíîâ áûë ïðîàíàëèçèðîâàí ñ ïîìîùüþ âåá-ñåðâèñà Panther (ðèñ. 18,19). Ýòè ãåíû õàðàêòåðíû äëÿ äóïëèêàöèé èìåííî â ðîññèéñêîé ïîïóëÿöèè. Îäíàêî âëèÿíèå äóïëèêàöèé íà ýêñïðåññèþ ãåíîâ íå èçó÷åíî â äàííîì èññëåäîâàíèè. Ðàññìàòðèâàëîñü òîëüêî ïîëíîå âõîæäåíèå ãåíà â CNV áåç ó÷åòà ðåãóëÿòîðíûõ ïîñëåäîâàòåëüíîñòåé.
Ðèñ. 18 Àííîòàöèÿ ñ òî÷êè çðåíèÿ ìîëåêóëÿðíîé ôóíêöèè:
Ðèñ. 19 Àííîòàöèÿ ñ òî÷êè çðåíèÿ áèîëîãè÷åñêèõ ïðîöåññîâ
Àíàëèç â âåá-ñåðâèñå ÑPDB ïîêàçàë îáîãàùåíèå ãåíàìè, âõîäÿùèìè â ìåòàáîëè÷åñêèé ïóòü ðåöåïòîðîâ âèòàìèíà D (p-value - 0.00115), ÷òî ìîæåò óêàçûâàòü íà àäàïòèâíûå ôóíêöèè îáðàçîâàíèÿ äóïëèêàöèé.
Àíàëèç ëîêóñà chr8:39240000-39400000
Ó÷àñòîê ãåíîìà â ïîçèöèè 39240000-39400000 íà õðîìîñîìå 8 îïèñàí â DGV gold standart êàê äåëåöèÿ ñ ÷àñòîòîé 18% è äóïëèêàöèÿ ñ ÷àñòîòîé 32%.  ñëó÷àå äåòåêöèè CNV ñ ïîìîùüþ ìèêðî÷èïîâ âñåãäà âñòàåò âîïðîñ î êîíòðîëüíîì îáðàçöå. Âûñîêî÷àñòîòíûå CNV òàêèì îáðàçîì ìîãóò äåòåêòèðîâàòüñÿ êàê äåëåöèè èëè êàê äóïëèêàöèè â çàâèñèìîñòè îò òîãî, êàêîé îáðàçåö ïîäîáðàí â êà÷åñòâå êîíòðîëüíîãî.  äàííîì èññëåäîâàíèè îáíàðóæåíà äåëåöèÿ â ýòîì ó÷àñòêå ñ ÷àñòîòîé 19%.
Íà ýòîò ó÷àñòîê ãåíîìà ïðèõîäèòñÿ 2 ïñåâäîãåíà. Ïñåâäîãåíû èìåþò ðàçíîîáðàçíóþ ýòèîëîãèþ. Íåêîòîðûå èìåþò ïàðàëîãè â ãåíîìå, è îáðàçîâàëèñü âñëåäñòâèå äóïëèêàöèè ñ ïîñëåäóþùåé ïîòåðåé ôóíêöèîíàëüíîñòè, äðóãèå - èç-çà íåáîëüøèõ äåëåöèé/èíñåðöèé èëè âñòàâêè òðàíñïîçîíîâ ñî ñäâèãîì ðàìêè ñ÷èòûâàíèÿ. Ïñåâäîãåíû adam5 è adam3a ÿâëÿþòñÿ îäèíî÷íûìè, ò. å. íå èìåþò ôóíêöèîíèðóþùèõ ïàðàëîãîâ â ãåíîìå. [25] Ðàáîòàþùèå âåðñèè ýòèõ ãåíîâ íàéäåíû ó ìíîãèõ ìëåêîïèòàþùèõ, â òîì ÷èñëå ó ìàêàêè, ìûøè, êðûñû. Ñðàâíèòåëüíûé àíàëèç ÑNV â ãåíîìå ÷åëîâåêà è øèìïàíçå ïîêàçàë íàëè÷èå äåëåöèè ó ÷åëîâåêà è îòñóòñòâèå ó øèìïàíçå. [7] Îäíàêî ýòè ãåíû íå ðàáîòàþò òàêæå ó ãîðèëëû. Adam5 êîäèðóåò áåëîê èç ñåìåéñòâà ADAM, ê êîòîðîìó ïðèíàäëåæàò äèçèíòåãðèí- è ìåòàëëîïèïòåäàçíûé äîìåí. Åãî ôóíêöèÿ èìååò îòíîøåíèå ê ôåðòèëüíîñòè, ò.ê. ïîêàçàíà âàæíàÿ ðîëü äèçèíòåãðèíà ïðè âçàèìîäåéñòâèè ñïåðìàòîçîèäà è ÿéöåêëåòêè. Èññëåäîâàòåëè ñ÷èòàþò, ÷òî ó ÷åëîâåêà ëèáî äåéñòâèòåëüíî ñíèæåííàÿ ïî ñðàâíåíèþ ñ äðóãèìè âèäàìè ôåðòèëüíîñòü, ëèáî ðàáîòà ýòîãî ãåíà íå ÿâëÿåòñÿ êðèòè÷åñêè âàæíîé äëÿ íîðìàëüíîé ôåðòèëüíîñòè.[47]
Âî ôëàíêèðóþùèõ îáëàñòÿõ áûëè íàéäåíû ïîñëåäîâàòåëüíîñòè, îòíîñÿùèåñÿ ê ñåìåéñòâó Alu-ïîâòîðîâ äëèíîé 305, ÷òî ñîîòâåòñòâóåò ìèíèìàëüíîé äëèíå, ïðè êîòîðîé âîçìîæíà ãîìîëîãè÷íàÿ ðåêîìáèíàöèÿ. Ïîñëåäîâàòåëüíîñòè ñõîæè íà 81%. Îáû÷íî äëÿ ãîìîëîãè÷íîé ðåêîìáèíàöèè òðåáóåòñÿ ñõîäñòâî îêîëî 95%. Íî åñëè äàííàÿ CNV ñôîðìèðîâàëàñü äàâíî, à ó÷àñòîê íå ïîäâåðæåí åñòåñòâåííîìó îòáîðó, òî ñòåïåíü ñõîäñòâà ãîìîëîãè÷íûõ ó÷àñòêîâ ìîæåò áûòü è ìåíüøå. Òàêèì îáðàçîì, ïî ðåçóëüòàòàì àíàëèçà ôëàíêèðóþùèõ ó÷àñòêîâ äëÿ ôðàãìåíòà chr8:39250000-39400000, ìîæíî ïðåäïîëîæèòü, ÷òî ýòî äåëåöèÿ îáðàçîâàëàñü äàâíî, âåðîÿòíî, âî âðåìåíà âçðûâà òðàíñïîçîíîâ, êîòîðûé ïðîõîäèë ó ïðèìàòîâ áîëåå 40 ëåò íàçàä. [11] è åå ÷àñòîòà â ïîïóëÿöèè îáóñëîâëåíà âðåìåíåì âîçíèêíîâåíèÿ è òåì ôàêòîì, ÷òî îíà íåéòðàëüíàÿ (ò.å. îòñóòñòâóåò îòáîð). Ìåõàíèçì îáðàçîâàíèÿ îäíîçíà÷íî óñòàíîâèòü íå óäàëîñü. Íåàëëåëüíàÿ ãîìîëîãè÷íàÿ ðåêîìáèíàöèÿ ìîæåò ïðîèñõîäèòü ñ âîâëå÷åíèåì Alu-ïîâòîðîâ, íî îáû÷íî êîðîòêèå ïîâòîðû çàäåéñòâîâàíû â äðóãèõ ìåõàíèçìàõ, òàêèõ êàê FoSTeS, MMBIR, MHEJ è äð. Òàêæå íà ýòîò ó÷àñòîê ãåíîìà ïðèõîäèòñÿ áîëüøîå êîëè÷åñòâî ðàçëè÷íûõ âèäîâ ïîâòîðîâ, ÷òî òàêæå óêàçûâàåò íà îòñóòñòâèå äàâëåíèÿ îòáîðà è ìåíüøóþ êîíñåðâàòèâíîñòü. Ðåãèîí ñ ïñåâäîãåíîì ADAM5 èìååò àëüòåðíàòèâíûé ëîêóñ â âåðñèè ãåíîìà GRCh38. Èíòåðåñíî, ÷òî âòîðàÿ ïî ÷àñòîòå äåëåöèÿ (íà õðîìîñîìå 2), â îòëè÷èå îò îñòàëüíûõ, òàêæå õàðàêòåðèçóåòñÿ íàëè÷èåì àëüòåðíàòèâíîãî ëîêóñà. Äàííàÿ äåëåöèÿ ïîêàçàíà ñ ìåíüøåé ÷àñòîòîé â DGV gold standart, ÷åì â 1000Genomes. DGV gold standart ó÷èòûâàåò ðåçóëüòàòû 1000Genomes, ãäå äëÿ äåòåêöèè CNV ïðèìåíÿëè àëãîðèòìû íà îñíîâå NGS, à òàêæå ðåçóëüòàòû ìíîãèõ èññëåäîâàíèé, ñ ïðèìåíåíèåì ìèêðî÷èïîâ. Î÷åâèäíî, ìåòîäû äåòåêöèè íà îñíîâå NGS è ãèáðèäèçàöèè ïîêàçûâàþò íåñêîëüêî ðàçëè÷íûå ðåçóëüòàòû.
Çàêëþ÷åíèå
 õîäå äàííîãî èññëåäîâàíèÿ áûëî ïðîàíàëèçèðîâàíî 611 ãåíîìîâ ñ êðàéíå íèçêèì ïîêðûòèåì, ïîëó÷åííûõ â õîäå íåèíâàçèâíîãî ïðåíàòàëüíîãî ÄÍÊ-ñêðèíèíãà. Âñåãî áûëî îáíàðóæåíî 87 CNV, c ðàçëè÷íîé ÷àñòîòîé âñòðå÷àþùèõñÿ â âûáîðêå, èç íèõ 21 ðàíåå íå áûëè îáíàðóæåíû. Ýòè ÑNV â îñíîâíîì ïðèõîäÿòñÿ íà äóïëèêàöèè. Áîëåå ïîëîâèíû íå ñîäåðæàò áåëîê-êîäèðóþùèõ ãåíîâ. Îòîáðàííûå CNV íå ÷èñëÿòñÿ â áàçàõ äàííûõ DGV, DECIPHER è ISCA. Äåòåêöèÿ ñ ïîìîùüþ QDNAseq íà òðåõ ðàçðåøåíèÿõ, äîïîëíèòåëüíàÿ ïðîâåðêà âñåõ ïîëó÷åííûõ CNV íà ïåðåñå÷åíèå ñ «÷åðíûì ñïèñêîì ENCODE» è ïåðìóòàöèîííûé àíàëèç ïåðåñå÷åíèÿ ñ áàçîé äàííûõ DGV gold standart ïðåäïîëàãàåò êîððåêòíîñòü ïîëó÷åííûõ ðåçóëüòàòîâ. Òàêèì îáðàçîì, äàííûå ÍÈÏÑ ìîãóò áûòü èñïîëüçîâàíû äëÿ ïîëó÷åíèÿ èíôîðìàöèè î êðóïíûõ CNV â ãåíîìå ó æåíùèí, ÷òî, ó÷èòûâàÿ ìàñøòàáû ïðèìåíåíèÿ ÍÈÏÑ, ìîæåò ïîñëóæèòü îñíîâîé äëÿ ïîïóëÿöèîííûõ èññëåäîâàíèé âàðèàöèé ÷èñëà êîïèé. Îáíàðóæåííûå CNV (â êà÷åñòâå íåéòðàëüíûõ â ðîññèéñêîé ïîïóëÿöèè) ìîãóò ñëóæèòü äîïîëíèòåëüíûì èñòî÷íèêîì èíôîðìàöèè ïðè èíòåðïðåòàöèè êëèíè÷åñêèõ äàííûõ.
Ãåíû, âõîäÿùèå â äóïëèêàöèè, ïåðåïðåäñòàâëåíû â ìåòàáëè÷åñêîì ïóòè ðåöåïòîðà âèòàìèíà D, ÷òî ìîæåò óêàçûâàòü íà àäàïòèâíóþ ôóíêöèþ.
Òàêæå áûëà ïðîàíàëèçèðîâàíà âûñîêî÷àñòîòíàÿ äåëåöèÿ íà õðîìîñîìå 8. Åå ÷àñòîòà îáóñëîâëåíà âðåìåíåì ïðîèñõîæäåíèÿ è îòñóòñòâèåì îòáîðà, íî íå ìåõàíèçìîì îáðàçîâàíèÿ.
Áûë ïðîâåäåí ñðàâíèòåëüíûé àíàëèç ðàçëè÷íûõ èíñòðóìåíòîâ äëÿ îïðåäåëåíèÿ CNV â ãåíîìå ñ êðàéíå íèçêèì ïîêðûòèåì. QDNAseq îêàçàëñÿ ëó÷øèì èíñòðóìåíòîì, äàþùèì ïðèåìëåìûå ðåçóëüòàòû íà àóòîñîìàõ ñ ìàêñèìàëüíûì ðàçðåøåíèåì, ïî ñðàâíåíèþ ñ äðóãèìè. Âàæíîé ñîñòàâëÿþùåé ÿâëÿåòñÿ ó÷åò «÷åðíîãî ñïèñêà» ENCODE ïðè îïðåäåëåíèè ÑNV ïî äàííûì NGS.
Ëèòåðàòóðà
1. Stevens NE. Studies in spermatogenesis with especial reference to the accessory chromosome. 1905.Carnegie Institute of Washington, Publication no. 36, 1-32.
2. R. V. Thakker. Genetics of Bone Biology and Skeletal Disease. Academic Press, 2013
3. Paul H. Dear. Copy-number variation: the end of the huan genome? 2009, Elsevier, trends in Biotechnology Vol.27 No.8 doi:10.1016/j.tibtech.2009.05.003
4. Stranger et al. Relative impact of nucleotide and copy number variation on gene expression phenotypes. Science. 2007 Feb 9;315(5813):848-53. doi: 10.1126/science.1136678.
5. James R. Lupski. Structural Variation Mutagenesis of the Human Genome: Impact on Disease and Evolution Environ Mol Mutagen. 2015 Jun; 56(5): 419-436. doi: 10.1002/em.21943
6. Zarrei M et al. A copy number variation map of the human genome. Nat Rev Genet. 2015 Mar;16(3):172-83. doi: 10.1038/nrg3871.
7. Perry GH et al. Copy number variation and evolution in humans and chimpanzee. Genome Res. 2008 Nov;18(11):1698-710. doi: 10.1101/gr.082016.108.
8. Veerappa AM et al. Global spectrum of copy number variations reveals genome organizational plasticity and proposes new migration routes. PLoS One. 2015 Apr 24;10(4):e0121846. doi: 10.1371/journal.pone.0121846.
9. Chen et al. Ñopy number variation across European population. PLoS One. 2011; 6(8): e23087. doi: 10.1371/journal.pone.0023087.
10. Itsara A et al. Population analysis of large copy number variants and hotspots of human genetic disease. Am J Hum Genet. 2009 Feb;84(2):148-61. doi: 10.1016/j.ajhg.2008.12.014.
11. Ohshima K et al. Whole-genome screening indicates a possible burst of formation of processed pseudogenes and Alu repeats by particular L1 subfamilies in ancestral primates. Genome Biol. 2003;4(11):R74. Epub 2003 Oct 28. doi:10.1186/gb-2003-4-11-r74.
12. Ana R. Cardoso et al. Major influence of repetitive elements on disease-associated copy number variants (CNVs). Hum Genomics. 2016; 10: 30. doi: 10.1186/s40246-016-0088-9.
13. Rene J. Herrera et al. Genomes,evolution and culture: Past, Present, and Future of Humankind. John Wiley & Sons, 2016.
14. Kim et al. Copy number variations in the human genome: potential source for individual diversity and disease association studies. Genomics Inform. 2008;6:1-7.
15. Gu W et al. Mechanisms for human genomic rearrangements. Pathogenetics. 2008 Nov 3;1(1):4. doi: 10.1186/1755-8417-1-4.
16. Arlt MF et al. Replication stress and mechanisms of CNV formation. Curr Opin Genet Dev. 2012 Jun;22(3):204-10. doi: 10.1016/j.gde.2012.01.009.
17. Conrad DF et al. Origins and functional impact of copy number variation in the human genome. Nature. 2010 Apr 1;464(7289):704-12. doi: 10.1038/nature08516
18. Feng Zhang. Copy number variation in human health, disease, and evolution. Annu Rev Genomics Hum Genet. 2009 ; 10: 451-481. doi:10.1146/annurev.genom.9.081307.164217.
19. Carvalho CM et al. Mechanisms underlying structural variant formation in genomic disorders. Nat Rev Genet. 2016 Apr;17(4):224-38. doi: 10.1038/nrg.2015.25.
20. Liu P et al. Mechanisms for recurrent and complex human genomic rearrangements. Curr Opin Genet Dev. 2012 Jun;22(3):211-20. doi: 10.1016/j.gde.2012.02.012
21. Hastings PJ, Ira G, Lupski JR. A microhomology-mediated break-induced replication model for the origin of human copy number variation. Plos Genet. 2009;5:e1000327.
22. Zhang F et al.The DNA replication FoSTeS/MMBIR mechanism can generate genomic, genic and exonic complex rearrangements in humans. Nat Genet. 2009 Jul;41(7):849-53. doi: 10.1038/ng.399.
23. À. À. Êàøåâàðîâà, È. Í. Ëåáåäåâ. Ãåíîìíàÿ àðõèòåêòóðà õðîìîñîìíûõ áîëåçíåé. ÃÅÍÅÒÈÊÀ, 2016, òîì ...
Ïîäîáíûå äîêóìåíòû
Ðåøåíèå çàäà÷ ïî îïðåäåëåíèþ âåðîÿòíîñòíûõ è ÷èñëîâûõ õàðàêòåðèñòèê ñëó÷àéíûõ ÿâëåíèé ñ îáîñíîâàíèåì è àíàëèçîì ïîëó÷åííûõ ðåçóëüòàòîâ. Îïðåäåëåíèå âåðîÿòíîñòè, ñðåäíåãî çíà÷åíèÿ ÷èñëà, íàäåæíîñòè ñèñòåìû, ôóíêöèè ðàñïðåäåëåíèÿ, ìàòåìàòè÷åñêîãî îæèäàíèÿ.
êóðñîâàÿ ðàáîòà [227,6 K], äîáàâëåí 06.12.2010Îáëàñòü îïðåäåëåíèÿ ôóíêöèè, êîòîðàÿ ñîäåðæèò ìíîæåñòâî âîçìîæíûõ çíà÷åíèé. Íàõîæäåíèå çàêîíà ðàñïðåäåëåíèÿ è õàðàêòåðèñòèê ôóíêöèè ñëó÷àéíîé âåëè÷èíû, åñëè èçâåñòåí çàêîí ðàñïðåäåëåíèÿ åå àðãóìåíòà. Ïðèìåðû îïðåäåëåíèÿ äèñêðåòíûõ ñëó÷àéíûõ âåëè÷èí.
ïðåçåíòàöèÿ [68,7 K], äîáàâëåí 01.11.2013Äâóìåðíàÿ ôóíêöèÿ ðàñïðåäåëåíèÿ âåðîÿòíîñòåé ñëó÷àéíûõ âåëè÷èí. Ïîíÿòèå óñëîâíîé ôóíêöèè ðàñïðåäåëåíèÿ è ïëîòíîñòè ðàñïðåäåëåíèÿ âåðîÿòíîñòåé. Êîððåëÿöèÿ äâóõ ñëó÷àéíûõ âåëè÷èí. Ñèñòåìà ïðîèçâîëüíîãî ÷èñëà âåëè÷èí, óñëîâíàÿ ïëîòíîñòü ðàñïðåäåëåíèÿ.
ðåôåðàò [325,3 K], äîáàâëåí 23.01.2011Õàðàêòåðíûå îñîáåííîñòè ëîãàðèôìîâ, èõ ñâîéñòâà. Ìåòîäèêà îïðåäåëåíèÿ ëîãàðèôìà ÷èñëà ïî îñíîâàíèþ a. Îñíîâíûå ñâîéñòâà ëîãàðèôìè÷åñêîé ôóíêöèè. Ìíîæåñòâî âñåõ äåéñòâèòåëüíûõ ÷èñåë R. Àíàëèç ôóíêöèé âîçðàñòàíèÿ è óáûâàíèÿ íà âñåé îáëàñòè îïðåäåëåíèÿ.
ïðåçåíòàöèÿ [796,3 K], äîáàâëåí 06.02.2012Ïîñòàíîâêà çàäà÷ ïðèíÿòèÿ ðåøåíèé â óñëîâèÿõ íåîïðåäåëåííîñòè, ãåíåðàöèÿ è îöåíêè àëüòåðíàòèâíûõ âàðèàíòîâ èõ ðåøåíèÿ äëÿ õîðîøî è ñëàáî ñòðóêòóðèðîâàííûõ ïðîáëåì. Àíàëèòè÷åñêàÿ èåðàðõè÷åñêàÿ ïðîöåäóðà Ñààòè, ìåòîä ïîðîãîâ íåñðàâíèìîñòè "Ýëåêòðà".
êóðñîâàÿ ðàáîòà [38,3 K], äîáàâëåí 10.04.2011Àëãåáðàè÷åñêèé ðàñ÷åò ïëîòíîñòè ñëó÷àéíûõ âåëè÷èí, ìàòåìàòè÷åñêèõ îæèäàíèé, äèñïåðñèè è êîýôôèöèåíòà êîððåëÿöèè. Ðàñïðåäåëåíèå âåðîÿòíîñòåé îäíîìåðíîé ñëó÷àéíîé âåëè÷èíû. Ñîñòàâëåíèå âûáîðî÷íûõ óðàâíåíèé ïðÿìîé ðåãðåññèè, îñíîâàííîå íà èñõîäíûõ äàííûõ.
çàäà÷à [143,4 K], äîáàâëåí 31.01.2011Êëàññè÷åñêîå, ñòàòèñòè÷åñêîå è ãåîìåòðè÷åñêîå îïðåäåëåíèÿ âåðîÿòíîñòè. Äèñêðåòíûå ñëó÷àéíûå âåëè÷èíû è çàêîíû èõ ðàñïðåäåëåíèÿ. ×èñëîâûå õàðàêòåðèñòèêè ñèñòåìû ñëó÷àéíûõ âåëè÷èí. Çàêîíû ðàâíîìåðíîãî è íîðìàëüíîãî ðàñïðåäåëåíèÿ ñèñòåì ñëó÷àéíûõ âåëè÷èí.
äèïëîìíàÿ ðàáîòà [797,0 K], äîáàâëåí 25.02.2011Ïðîáëåìà íåñîèçìåðèìûõ, ïåðâûé êðèçèñ â îñíîâàíèè ìàòåìàòèêè, åãî ñëåäñòâèÿ è ïîïûòêè ïðåîäîëåíèÿ. Çàðîæäåíèå è ðàçâèòèå ïîíÿòèÿ ÷èñëà. Ñòàíîâëåíèå òåîðèè ïðåäåëà, ñîçäàíèå òåîðèè äåéñòâèòåëüíîãî ÷èñëà. Âåëèêèå ìåòåìàòèêè: Âåéåðøòðàññ, Êàíòîð, Äåäåêèíä.
ðåôåðàò [65,2 K], äîáàâëåí 26.11.2009×èñëî êàê îñíîâíîå ïîíÿòèå ìàòåìàòèêè. Íàòóðàëüíûå ÷èñëà. Ïðîñòûå ÷èñëà Ìåðñåííà, ñîâåðøåííûå ÷èñëà. Ðàöèîíàëüíûå ÷èñëà. Äðîáíûå ÷èñëà. Äðîáè â Äðåâíåì Åãèïòå, Äðåâíåì Ðèìå. Îòðèöàòåëüíûå ÷èñëà. Êîìïëåêñíûå, âåêòîðíûå, ìàòðè÷íûå, òðàíñôèíèòíûå ÷èñëà.
ðåôåðàò [104,5 K], äîáàâëåí 12.03.2004Ïîíÿòèå è íàïðàâëåíèÿ èññëåäîâàíèÿ ñëó÷àéíûõ âåëè÷èí â ìàòåìàòèêå, èõ êëàññèôèêàöèÿ è òèïû: äèñêðåòíûå è íåïðåðûâíûå. Èõ îñíîâíûå ÷èñëîâûå õàðàêòåðèñòèêè, îòëè÷èòåëüíûå ïðèçíàêè è ñâîéñòâà. Çàêîíû ðàñïðåäåëåíèÿ ñëó÷àéíûõ âåëè÷èí, èõ ñîäåðæàíèå è ðîëü.
ïðåçåíòàöèÿ [1,4 M], äîáàâëåí 19.07.2015Âû÷èñëåíèå ñðåäíåãî îäíîìåðíûõ ñëó÷àéíûõ âåëè÷èí. Îïðåäåëåíèå äîâåðèòåëüíîãî èíòåðâàëà äëÿ ìàòåìàòè÷åñêîãî îæèäàíèÿ è äëÿ äèñïåðñèè. Ïîñòðîåíèå ýìïèðè÷åñêîé è ïðèáëèæåííîé ëèíèé ðåãðåññèè Y ïî X. Äèñïåðñèîííûé àíàëèç ãðåêî-ëàòûíñêîãî êóáà âòîðîãî ïîðÿäêà.
êóðñîâàÿ ðàáîòà [698,0 K], äîáàâëåí 08.05.2012Ìåòîäû ðåãèñòðàöèè, îïèñàíèÿ è àíàëèçà ñòàòèñòè÷åñêèõ ýêñïåðèìåíòàëüíûõ äàííûõ, ïîëó÷àåìûõ â ðåçóëüòàòå íàáëþäåíèÿ ìàññîâûõ ñëó÷àéíûõ ÿâëåíèé. Îáçîð çàäà÷ ìàòåìàòè÷åñêîé ñòàòèñòèêè. Çàêîí ðàñïðåäåëåíèÿ ñëó÷àéíîé âåëè÷èíû. Ïðîâåðêà ïðàâäîïîäîáèÿ ãèïîòåç.
ïðåçåíòàöèÿ [113,3 K], äîáàâëåí 01.11.2013Îïðåäåëåíèå ìàòåìàòè÷åñêîãî îæèäàíèÿ è ñðåäíåêâàäðàòè÷åñêîãî îòêëîíåíèÿ ñ öåëüþ ïîäáîðà çàêîíà ðàñïðåäåëåíèÿ ê âûáîðêå ñòàòèñòè÷åñêèõ äàííûõ îá îòêàçàõ ýëåìåíòîâ àâòîìîáèëÿ. Íàõîæäåíèÿ ÷èñëà ñîáûòèé â çàäàííîì èíòåðâàëå; ðàñ÷åò çíà÷åíèÿ êðèòåðèÿ Ïèðñîíà.
êîíòðîëüíàÿ ðàáîòà [336,3 K], äîáàâëåí 01.04.2014Ïîíÿòèå êîððåëÿöèîííîãî ìîìåíòà äâóõ ñëó÷àéíûõ âåëè÷èí. Ìàòåìàòè÷åñêîå îæèäàíèå ïðîèçâåäåíèÿ íåçàâèñèìûõ ñëó÷àéíûõ âåëè÷èí Õ è Ó. Ñòåïåíü òåñíîòû ëèíåéíîé çàâèñèìîñòè ìåæäó íèìè. Àáñîëþòíîå çíà÷åíèå êîýôôèöèåíòà êîððåëÿöèè, åãî ðàñ÷åò è ïîêàçàòåëü.
ïðåçåíòàöèÿ [92,4 K], äîáàâëåí 01.11.2013Êëàññèôèêàöèÿ ñëó÷àéíûõ ñîáûòèé. Ôóíêöèÿ ðàñïðåäåëåíèÿ. ×èñëîâûå õàðàêòåðèñòèêè äèñêðåòíûõ ñëó÷àéíûõ âåëè÷èí. Çàêîí ðàâíîìåðíîãî ðàñïðåäåëåíèÿ âåðîÿòíîñòåé. Ðàñïðåäåëåíèå Ñòüþäåíòà. Çàäà÷è ìàòåìàòè÷åñêîé ñòàòèñòèêè. Îöåíêè ïàðàìåòðîâ ñîâîêóïíîñòè.
ëåêöèÿ [387,7 K], äîáàâëåí 12.12.2011Ïîèñê ó÷àñòêîâ âîçðàñòàíèÿ è óáûâàíèÿ ôóíêöèé, êëàññèôèêàöèÿ ýêñòðåìóìà. Óìíîæåíèå ìàòðèö À–1Ñ. Òåîðèÿ âåðîÿòíîñòè ñîáûòèÿ è ñëó÷àéíûõ âåëè÷èí. Ïîñòðîåíèå èíòåðâàëüíîé ãðóïïèðîâêè äàííûõ. Ðåøåíèå çàäà÷è ëèíåéíîãî ïðîãðàììèðîâàíèÿ, ïîñòðîåíèå ãðàôèêà.
êîíòðîëüíàÿ ðàáîòà [127,1 K], äîáàâëåí 11.11.2012Çíàêîìñòâî ñ Ïüåðîì äå Ôåðìà - ôðàíöóçñêèì ìàòåìàòèêîì, îäíèì èç ñîçäàòåëåé àíàëèòè÷åñêîé ãåîìåòðèè, ìàòåìàòè÷åñêîãî àíàëèçà, òåîðèè âåðîÿòíîñòåé è òåîðèè ÷èñåë. Ðàçðàáîòêà ñïîñîáîâ ñèñòåìàòè÷åñêîãî íàõîæäåíèÿ âñåõ äåëèòåëåé ÷èñëà. Âåëèêàÿ òåîðåìà Ôåðìà.
ïðåçåíòàöèÿ [389,1 K], äîáàâëåí 16.12.2011Ñóùíîñòü è ìåòîäèêà îïðåäåëåíèÿ àëãåáðàè÷åñêîãî ÷èñëà, îöåíêà ñóùåñòâóþùåãî ïîëÿ. Ðàöèîíàëüíûå ïðèáëèæåíèÿ àëãåáðàè÷åñêèõ ÷èñåë. Çàäà÷à ïîñòðîåíèÿ óðàâíåíèÿ ñ çàäàííûìè êîðíÿìè. Ïðèâîäèìûå è íåïðèâîäèìûå ìíîãî÷ëåíû. Òðàíñöåíäåíòíûå ÷èñëà Ëèóâèëëÿ.
êóðñîâàÿ ðàáîòà [219,6 K], äîáàâëåí 23.03.2015Ïèñüìåííàÿ èñòîðèÿ ÷èñëà "ïè", ïðîèñõîæäåíèå åãî îáîçíà÷åíèÿ è "ïîãîíÿ" çà äåñÿòè÷íûìè çíàêàìè. Îïðåäåëåíèå ÷èñëà "ïè" êàê îòíîøåíèÿ äëèíû îêðóæíîñòè ê å¸ äèàìåòðó. Èñòîðèÿ ÷èñëà "å", ìíåìîíèêà è ìíåìîíè÷åñêîå ïðàâèëî, ÷èñëà ñ ñîáñòâåííûìè èìåíàìè.
ðåôåðàò [125,9 K], äîáàâëåí 28.11.2010Êðèòåðèè âûáðîñîâ â ñëó÷àå íîðìàëüíîãî ðàñïðåäåëåíèÿ, èõ àñèìïòîòè÷åñêèå ñâîéñòâà è ýìïèðè÷åñêàÿ ìîùíîñòü. Èññëåäîâàíèå ðàñïðåäåëåíèÿ ñòàòèñòèê ïî êðèòåðèÿì Êîëìîãîðîâà è Ñìèðíîâà. Ðåàëèçàöèÿ êðèòåðèåâ îïðåäåëåíèÿ âûáðîñîâ â ñòàòèñòè÷åñêîì ïàêåòå R.
êóðñîâàÿ ðàáîòà [521,9 K], äîáàâëåí 10.01.2016