單基因座探針VNrIR—DNA紋印等位基因頻率的計(jì)算方法。
鑒于單基因座DNA紋印等位基因數(shù)是一個(gè)連續(xù)的隨機(jī)變量,基因頻率分布也是一個(gè)變量,為了將連續(xù)變量基因頻率處理成不連續(xù)基因頻率分布,目前應(yīng)用較為廣泛的是“裝箱” ( binning)合并的方法。即將一系列等位基因片段按從大到小的順序分成若干組,以不連續(xù)的分組方式將連續(xù)值處理成不連續(xù)的數(shù)據(jù)群。其原則是將相鄰的多態(tài)片段合并為一組,當(dāng)作一個(gè)等位基因看待,計(jì)算合并后的組的頻率。目前裝箱分組大致有固定箱( fixed - bin)和滑動(dòng)箱(floating bins)兩種分析法。經(jīng)裝箱處理的等位基因頻率又稱“箱頻率”(bin frequency)。
1.固定箱( fixed - bin)分析法。
固定箱分析是一種合并處理辦法,根據(jù)分子量標(biāo)準(zhǔn)物將連續(xù)片段分布人為地轉(zhuǎn)化成一系列不連續(xù)數(shù)據(jù)。DNA圖譜上,從大片段到小片段整個(gè)范圍人為地分成若干個(gè)“箱“。箱的界限值確定靠一套標(biāo)準(zhǔn)的片段長(zhǎng)度標(biāo)記(分子量標(biāo)準(zhǔn)molecular size marker)。Lifecodes公司提供的一套標(biāo)記系統(tǒng)是由限制酶消化后的Lambad、PhiX和T7病毒基因組DNA片段組成,共有30個(gè)片段,長(zhǎng)度分別為(單位bp):12830,11369,10094,8453,7242,6369,5686,5220, 4822, 4324, 3980, 3675, 3330, 3034, 2863, .2693, 2523, 2352, 2089, 1925, 1789, 1638, 1508,1353,1197,1078,964,872,773,640。30個(gè)片段分出31個(gè)箱,每個(gè)箱的大小范圍也就精確地固定下來。GIBCO BRL - 4401AS標(biāo)記的30個(gè)片段長(zhǎng)度分別為(單位bp): 22621, 15005, 11920, 9417, 8272, 7422, 6443, 5862, 5416, 4717, 4334, 3813, 3398, 3102, 2877, 2651, 2434, 2214, 2016, 1862, 1673, 1569, 1432, 1288, 1177, 994, 911, 785, 654,527。
箱值范圍確定后,凡片段長(zhǎng)度落在同一箱內(nèi)的基因,均合并為一個(gè)等位基因。由于箱足夠大,能容下5.6%~16.2%的片段長(zhǎng)度誤差,遠(yuǎn)遠(yuǎn)大于1. 5%的測(cè)量誤差,所以一個(gè)箱內(nèi)可以不止有一個(gè)片段,同一箱內(nèi)等位基因數(shù)則可合并計(jì)算該箱出現(xiàn)的頻率。如果檢測(cè)條件恒定,群體樣本的資料則不會(huì)出現(xiàn)因測(cè)量誤差而引起的頻率偏斜。用固定箱法確定的基因頻率實(shí)際上是箱的頻率。因此。無論何人種群體,等位基因數(shù)都統(tǒng)一為31個(gè)。固定箱分析法將連續(xù)等位基因分布簡(jiǎn)化為一張頻率分布表格,它既照顧到測(cè)量誤差,又得到一套不連續(xù)分布的基因頻率,同時(shí)也能大致反映出基因座多態(tài)性某些特征。裝箱基因座的有效頻率箱多的比少的多態(tài)性要高。
裝箱合并所提供的是保守的箱頻率數(shù)據(jù),但是在群體調(diào)查數(shù)據(jù)中,可能在某個(gè)箱中沒有片段或僅有一條片段,致使箱頻率值出現(xiàn)極端的低數(shù)量值,例如上述D14S13基因座的1、2、28、30和31箱未見有片段,29箱僅一條片段,這5個(gè)箱的頻率范圍大約在10-8。10-14之間。如此極低頻率在實(shí)際應(yīng)用中應(yīng)盡量避免使用。另外按照統(tǒng)計(jì)學(xué)X2檢驗(yàn)要求數(shù)據(jù)運(yùn)算最低為5條片段,因此可將低頻率的箱再合并。這樣處理之后,無論從統(tǒng)計(jì)學(xué)原則或?qū)嶋H應(yīng)用原則均可以接受了。
DNA鑒定之等位基因頻率的計(jì)算方法
2020-11-04 22:36:18 來源: 法醫(yī)物證學(xué)
聲明:該文觀點(diǎn)僅代表作者本人.
閱讀 ()