為實(shí)現(xiàn)STR遺傳標(biāo)記的分析,須確定重復(fù)區(qū)域兩側(cè)序列恒定的側(cè)翼區(qū)域。知道側(cè)翼序列后就可設(shè)計(jì)引物,擴(kuò)增分析重復(fù)區(qū)域。識別新的STR遺傳標(biāo)記有下列兩種方法:①在GeneBank等DNA序列數(shù)據(jù)庫中尋找重復(fù)6次或更多的連續(xù)重復(fù)單元(Weber及May,1989; Collins et a1.,2003;Subramanian et a1.,2003);②通過分子生物學(xué)分離法尋找(Edwards et a1., 1991; Chambers及MacAvoy,2000).
STR重復(fù)序列以重復(fù)單位的長度命名。二核苷酸重復(fù)具有兩個(gè)核苷酸一個(gè)接一個(gè)的重復(fù)。三核苷酸的重復(fù)單位有3個(gè)核苷酸,四核苷酸的有4個(gè),五核苷酸的有5個(gè),六核苷酸的有6個(gè)。理論上講,一、二、三、四、五、六核苷酸的重復(fù)分別會有4、16、64、256、1024、4096種可能的核心序列排列方式(Jin et al.,1994)。
STR序列不僅在重復(fù)單位的長度和重復(fù)次數(shù)上不同,而且其重復(fù)次數(shù)增加的模式嚴(yán)格講也是不一致的。按照重復(fù)模式的不同,STR被分成幾類。簡單重復(fù)中重復(fù)單位的長度和序列一致,復(fù)合重復(fù)由兩種或兩種以上的簡單重復(fù)連接而成,復(fù)雜重復(fù)則可能包含幾種不同長度的重復(fù)單元,并且重復(fù)單元之間可能含有不同長度的插入序列( Urquhart et a1., 1994)U。高變復(fù)雜重復(fù)具有大量長度和序列不一致的等位基因,因此給基鼠分型帶來函難(urquhart etal.1993 ,Gill et al. 1994)。最后一種分類方法在法醫(yī)實(shí)驗(yàn)室并不常用,因?yàn)閷?shí)驗(yàn)室間等位基因的命名和檢測存在差異。目前有兩種包含高變復(fù)雜STR基因座SE33(有時(shí)稱ACTBP2)的商業(yè)試劑盒(Urquhart et a1.,1993;Promega Corporati仰,2002;Applied Bio-systems,2002)。
對一個(gè)STR基因座而言,并非所有的等位基因都包含完整的重復(fù)單位。即使是簡單重復(fù)也可能在完整重TH01之間插入不一致的等位基因。微變異即指含有不完全重復(fù)單位的等位基因。比如THol的等位基因9.3,它包含9個(gè)四核苷酸完全重復(fù)和一個(gè)不完整的三核苷酸重復(fù),因?yàn)榈?個(gè)重復(fù)的AATG重復(fù)中缺失了一個(gè)A('Puers et a1.,1993)。