
DNA 분석의 법과학적 응용은 1985년 Alec J. Jeffreys의 제한효소 분절 길이 다형성(Restriction fragment length polymorphism, RFLP) 패턴확인 기술로부터 시작되었다(Butler, 2015). DNA 절편이 개인 별로 특징적인 반복단위(repeat elements)를 갖는다는 점을 개인식별 및 친족(kinship)확인에 응용함으로써 1986년 영국에서 발생한 살인 및 강간 사건 해결에 기여하였고, 이는 현재까지 유전자 지문(DNA fingerprinting)을 활용한 최초의 법과학적 사례로 인정된다(Nwawuba Stanley et al., 2020).
다양한 기술의 발전을 통하여 DNA 감식법은 현재 범죄과학수사(forensic case)를 위한 전형적 기술로서 변사자 신원확인, 용의자의 정확한 개인식별 확인 및 다양한 상황에서 정보제공 역할을 수행하고 있다(Kim et al., 2020). 과거 RFLP 실험법은 이후 RFLP 타깃의 방사선 동위원소가 연결된 복합 탐침(multilocus probes)을 활용한 DNA 감식법으로 발전하였다(Roewer, 2013). 하지만 현장증거물 분석에 실용화되기에는 감정을 위한 최소 DNA 필요량이 10~25 ng이라는 점과, 1회 분석에 6개월 이상의 긴 시간이 소요된다는 점, 인체에 유해한 동위원소를 필수적으로 사용해야 한다는 한계점을 가지고 있었다(Jordan and Mills, 2021). 이 문제는 이후 Kary Mullis의 중합 효소 연쇄 반응(PCR) 기법 개발을 통하여 해결되므로, PCR 기법의 개발은 DNA 감식법 발전 역사에서 큰 의미를 가진다(Nwawuba Stanley et al., 2020). 높은 다형성을 포함한 특정 반복 부위를 PCR 기법으로 증폭하는 과정은 현재 활발히 사용 중인 DNA 감식법에서 필수적이다(Roewer, 2013). 이렇듯 여러 발전을 거친 현재 DNA 감식은 다양한 범죄의 해결과 대량 재해에서의 신원확인 등 법과학 분야에서 강력하고 핵심적인 기법으로 인정된다(Yoo et al., 2011).
단편 일렬반복(Short tandem repeat, STR) 분석법은 현재 DNA 감식법의 표준 기술이다(Nwawuba Stanley et al., 2020). STR은 2~7 염기쌍(base pair, bp)의 짧은 DNA 서열이 특정 좌위에서 연속적으로 반복되어 최대 100 뉴클레오타이드 길이를 구성한다(Fan and Chu, 2007). 사람 전체 게놈(genome)의 약 3%를 차지할 것으로 예상되는 가운데 대부분이 비암호화(noncoding) 영역에 존재하고, 8%만이 암호화(coding) 영역에서 발견된다(Nwawuba Stanley et al., 2020). 이러한 STR은 각 염색체의 말단 부위에 주로 산재되어 반복 수에 따라 다양한 대립유전자(allele)가 존재하며 사람마다 반복 횟수가 다르고 독립적으로 유전되어 높은 다형성을 가진다(Jobling and Gill, 2004). STR이 가지는 다형성은 STR을 활용한 DNA 분석에 핵심 요소로 작용하고(Oldoni and Podini, 2019), PCR을 이용하면 여러 종류의 마커를 한번에 신속히 분석 가능하다는 장점이 있다(Butler, 2007). 이와 같이 다형성을 가지는 다중(multiplexing) 좌위의 프로파일링(profiling)을 이용하므로 우연한 일치를 줄이고, 분석의 효율성도 향상시키므로 현재 표준 감식법으로 자리잡게 되었다(Jordan and Mills, 2021). 뿐만 아니라 STR 분석을 통한 DNA 프로필(profile)의 높은 개인식별력을 통해 강력한 법적 증거로서의 효력을 갖게 되었다(Yoo et al., 2011).
사람의 DNA를 구성하는 염기서열의 99.9%는 유사하고, 오직 0.1%의 변이(variation) 부위가 존재한다고 알려진다(Nwawuba Stanley et al., 2020). 특히 상염색체 STR은 다형성이 매우 높고 대부분 이형 접합체이므로, 성염색체 STR보다 식별력이 월등히 높기 때문에 법과학 분야와 더불어 계통분류학에도 폭넓게 활용되고 있다(Hammond et al., 1994).
STR 마커의 개념은 1990년도 초에 신원확인을 위한 효율적인 수단으로 처음 기술되었다(Butler, 2006). 현재 STR 분석 기술은 여러 개의 특정 STR 마커들을 다중 증폭한 후, 모세관 전기영동을 통해 반복 횟수의 차이에 따른 각 STR 좌위의 대립유전자를 확인하는 과정으로 진행된다(Nai et al., 2012). 전 세계에서 표준화된 STR 분석법에 의한 DNA 프로필 일치 여부 및 일치 빈도확인은 현재 대부분의 국가에서 법적 증거로 활용되고 있으며, 우리나라 디엔에이신원확인정보 데이터베이스(DNA-DB)의 구축에도 활용되고 있다(Hammond et al., 1994; Jobling and Gill, 2004; Butler, 2007).
한편 감정 분석을 위한 DNA 농도가 적정 농도 이상으로 검출된 경우에는 일반적으로 상용화 키트를 이용하여 전체 DNA 프로필(full-profile)을 확인할 수 있지만, 분석하고자 하는 DNA의 농도가 너무 낮거나, DNA가 화학물질, 효소작용, 박테리아 등에 의하여 분해되는 경우에는 부분 DNA 프로필(partial-profile)이 분석된다(Coble, 2012). 즉, 어느 정도 이상으로 분해된 DNA를 이용할 경우, 큰 증폭 크기를 갖는 DNA 프로필은 결과를 얻기 어렵다(Butler, 2010). 분해 정도가 심화될수록 짧은 길이로 구성된 적은 수의 DNA 프로필만 확보되어 우연히 일치할 확률이 증가하게 된다(Coble, 2012). 하지만, STR 좌위 확장은 확보할 수 있는 DNA 프로필의 좌위 수를 증가시킴으로써 우연히 일치할 확률을 감소시켜 개인식별력을 높일 수 있다(Novroski et al., 2019; Nwawuba Stanley et al., 2020).
이번 논문에서는 STR 좌위 확장의 배경 및 DNA-DB 운영의 변화에 대해 고찰하였다. 더불어, 좌위 확장을 통해 해결된 사례를 포함한 긍정적 효과와 좌위 확장과 관련된 향후 과제 및 발전 방안을 제시하고자 한다.
2010년 미국 연방수사국(Federal Bureau of Investigation, FBI)에서는 기존 13개의 통합 DNA 색인 시스템(Combined DNA Index System, CODIS) 좌위로 부터의 추가 확장을 목적으로 CODIS Core Loci Working Group을 구성하였다(Ge et al., 2012). 이후 최적의 좌위 선정을 위한 좌위 확장의 필요성 및 목적을 명확히 하였다(Ge et al., 2012).
좌위 확장의 목적은 DNA-DB에 등록되는 DNA 프로필이 빠른 속도로 증가함에 따라 DNA 프로필의 우연히 일치할 확률을 감소시키기 위함이다.
좌위 확장의 목적은 DNA 프로필의 국제적 호환성을 높이기 위함이다.
좌위 확장의 목적은 실종자 확인 등을 위한 개인식별력을 증가시키기 위함이다.
목적 명시 이후 이를 토대로, 법과학 분야에서 사용되고 있는 STR 좌위들에 관한 연구내용을 확인하고, 추가 좌위 선정을 위한 기준을 확립하였다(Ge et al., 2012).
건강상태나 질병과의 연관성이 없어야 한다.
좌위 돌연변이율이 0.3% 이하로 낮아야 한다.
좌위의 독립성이 높아야 한다.
동일 확률이 0.1% 미만으로 높은 식별력을 가져야 한다.
법과학 DNA 분야에서 국제적으로 사용되어야 한다.
총 권장 좌위 수와 이로부터 얻을 수 있는 식별력의 균형을 맞추어야 한다.
선정되는 좌위는 FBI에서 확립한 품질보증기준(QAS)를 따라야 한다.
위의 기준에 따라 관련 좌위 연구에 대한 여러 과정의 평가를 거쳐, 최종적으로 추가 중심 좌위를 선정하였다(Hares, 2015). 초기의 확장 후보 좌위들을 필요 기준에 맞추어 각각 섹션 A와 섹션 B로 구분하였다(Table 1) (Ge et al., 2012). 구분 이후 연구 결과 및 국제적 DB 호환성, 이전 DB 구축에 사용되었던 마커 등의 실용성과 효율성을 참조하여 최종 20개로의 좌위 확장을 이루었다(Table 2) (Ge et al., 2012).
Candidate core loci that were first suggested
Loci | |||||||
---|---|---|---|---|---|---|---|
Section A (Essential) | D18S51 | FGA | D21S11 | D8S1179 | vWA | D13S317 | D16S539 |
D7S820 | TH01 | D3S1358 | CSF1PO | D5S818 | CSF1PO | ||
D2S1338 | D19S433 | D1S1656 | D12S391 | D2S441 | D10S1248 | DYS391 | |
Section B (Preferred) | TPOX | D22S1045 | SE33 | PentaD |
CODIS 20 core loci that were finally selected
Loci | |||||||
---|---|---|---|---|---|---|---|
CODIS 13 loci | CSF1PO | D3S1358 | D5S818 | D7S820 | D8S1179 | D13S31 | D16S539 |
D18S51 | D21S11 | FGA | TPOX | vWA | |||
Additional loci | D1S1656 | D2S441 | D2S1338 | D10S1248 | D12S391 | D19S433 | D22S1045 |
DNA-DB 운영의 중요성에 따라 각 국에서는 DB에 저장되는 프로필 수가 매년 점점 더 증가하고 있다. 이러한 변화를 전적으로 보여주는 한 예로 중국을 들 수 있다. 중국에서는 다른 국가들 보다 상대적으로 늦은 2005년부터 국가 운영 DNA-DB의 운영을 시작하였지만, 2018년 국가 발표에 따르면 이미 6,800만개의 DNA 프로필의 등록을 완료하여 미국과 영국을 넘어섰고, 세계적으로 가장 큰 DNA-DB를 구축하게 되었으며 꾸준히 증가하는 추세이다(Bernotaite, 2020). 이렇듯 각 국에서는 분석 결과가 우연히 일치할 확률이 더욱 증가되는 문제에 직면하고 있다. 뿐만 아니라 국제화되는 사회 분위기 속에서 사건 해결을 위한 국제 공조 필요성 또한 증가하고 있으므로, 각국의 데이터 호환성을 향상시키기 위한 지속적인 STR 좌위 확장이 연구되어야 하는 것이다(Butler, 2015). 한편 유골(뼈, 치아 등), 화재사건 증거물, 접촉증거물 및 장기미제사건 증거물 등에서 확보되는 DNA는 미량(low copy number, LCN)이면서 분해(degraded)된 DNA일 가능성이 크다(Martin et al., 2006). 고령화 사회에서 독거와 고립에 의해 고독사가 증가함으로써 시신이 방치되고 부패되는 경우 및 해양이나 야산 등에서 발견되는 유해 시료의 감정 의뢰가 증가하고 있다. 또한, 방화 사건의 증가, 기후 변화로 인한 화재의 양상 변화, 지능화된 범죄로 인한 DNA 훼손 범죄 및 접촉증거물의 빈도가 점차 증가하는 사회적 상황을 고려해볼 때, 이러한 유형의 증거물로부터 DNA 프로필 확보 노력은 필수적이다.
Alec J. Jeffreys가 DNA 감식 기술을 사건 수사에 적용한 이래로, 1995년 영국에서 세계 최초로 법률에 근거한 범죄자 DNA-DB를 설립하여 운영하기 시작했고, 많은 범죄사건 해결에 도움이 되면서 DNA-DB는 비약적인 성장을 거듭해 왔다. 2019년도 기준으로, 인터폴 회원국 194개국 중 응답한 130개국에 대한 조사 결과 89개의 국가가 경찰 수사에 DNA 감식 기술을 이용 중이며 70개의 국가에서는 실제로 검색이 가능한 DNA-DB를 운영 중으로 확인되었다. 또한 31개국에서는 실종자 DNA-DB도 운영 중이다. 이들 DNA-DB에 수록된 DNA 프로필은 통계에 공개된 자료만 약 1,500만 개에 이르는 것으로 확인되고, 통계에는 제외된 미국, 영국 등 주요 국가들의 자료를 고려한다면 훨씬 더 많은 DNA 프로필들이 전 세계 DNA-DB에 수록되어 있을 것으로 추정된다(INTERPOL, 2019).
세계 최초로 DNA-DB 시스템을 구축하여 운영한 영국에서 초창기 사용하였던 STR 좌위는 총 4개로 1세대 STR 좌위(TH01, vWA, FES/FPS 및 F13A1)로 분류된다 (Butler, 2012; Butler, 2015). 이후 6개로 확장된 2세대 STR 좌위(FGA, TH01, vWA, D8S1179, D18S51 및 D21S11)를 구성하며 '영국 국립 DNA 데이터베이스(United Kingdom National DNA Database, UK NDNAD)' 운영을 시작하였다 (Butler and Hill, 2012; Butler, 2015).
1995년 UK NDNAD의 설립 이후 1998년 미국에서는 13개의 STR 중심 좌위(TH01, vWA, FGA, D8S1179, D18S51, D21S11, CSF1PO, TPOX, D3S1358, D5S818, D7S820, D13S317 및 D16S539)를 포함하는 FBI의 '국가 유전자 정보 색인 시스템(The National DNA Index System, NDIS)'을 운영하였다(Butler, 2015; Nwawuba Stanley et al., 2020). 미국의 DNA-DB는 지역(Local DNA Index System, LDIS), 주(State DNA Index System, SDIS) 및 국가(NDIS)의 세 가지 계층으로 구성된다. 그리고 위의 세 가지 수준의 DNA-DB는 형사 사법 정보 시스템 광역 네트워크(Criminal Justice Information System Wide Area Network)를 통해 함께 네트워크로 연결되어 있다. LDIS에서는 각 지역의 감정인들이 DNA 프로필을 입력하고 지역 내 사건과 일치하는 항목을 검색할 수 있다. 지역 수준에서 시작된 DNA 프로필은 주(SDIS) 및 국가(NDIS) 수준으로 전송 및 수록될 수 있으며 DNA 정보를 서로 비교할 수 있다(Butler, 2015; Nwawuba Stanley et al., 2020). 미국 NDIS는 2004년까지 200만 DNA 프로필을 확보한 이후에도 계속해서 발전해 나갔다. 그 결과 2021년 10월 기준 NDIS에는 14,836,490개의 범죄자, 4,513,955개의 구속피의자, 1,144,255개의 증거물 DNA 프로필이 수록되어 있고, FBI의 통계에 따르면 이를 통해 574,343건 이상의 사건을 수사하는데 도움을 준 것으로 추산된다(FBI, 2021).
위에서 설명한 바와 같이 미국에서는 NDIS 운영을 위해 FBI에서 13개의 표준 STR 유전자 좌위를 지정하였고, 그 이후 DB의 크기가 증가함에 따라 우연히 일치할 가능성이 높아지고 있었다. DB 검색 시 발생하는 우발적인 일치 현상을 해소하고 신원확인을 위한 유전자 좌위의 식별력을 높이는 것은 물론, 국제적 DB의 호환성을 위해 2017년 1월을 기준으로 표준 유전자 중심 좌위(core loci)를 기존 13개에서 20개로 확장하였다(Gill et al., 2006; Hares, 2015).
각 국에서 현재 사용 중인 STR 중심 좌위 정보는 표와 같다(Table 3) (Butler, 2006; Samantha et al., 2015; Dang et al., 2020). 영국에서는 1세대 중심 좌위 이후 6개의 2세대 중심 좌위(SGM)로 확장하였고, 현재 17개의 중심 좌위(DNA17)을 공식적으로 활용하고 있다(Butler, 2006; Hares, 2015). 유럽에서는 유럽 표준 중심 좌위 EES12를 선정하여 유럽 국가 간의 국의 데이터 공유하는 데의 어려움을 줄이고자 하였다(Butler, 2006; Hares, 2015). 중국에서는 국가 DB 운영에 관련된 상세한 정보가 공식적으로 미공개인 상황이지만, 지금까지 공개된 자료를 바탕으로 확장된 20개 CODIS 좌위를 포함한 추가 좌위를 함께 활용하여 국가 DB를 운영하는 것으로 예상할 수 있다(Wang et al., 2018; Bernotaite, 2020). 한국에서도 미국과 동일하게 현재 CODIS 좌위를 포함한 20개의 좌위를 활용하여 DB를 운영 중이다(Jung et al., 2017; Kim et al., 2021).
STR core loci that are currently being used in several countries
United Kingdom | European Standard | United States | China | Korea |
---|---|---|---|---|
TH01 | TH01 | TH01 | TH01 | TH01 |
FGA | FGA | FGA | FGA | FGA |
vWA | vWA | vWA | vWA | vWA |
D3S1358 | D3S1358 | D3S1358 | D3S1358 | D3S1358 |
D8S1179 | D8S1179 | D8S1179 | D8S1179 | D8S1179 |
D18S51 | D18S51 | D18S51 | D18S51 | D18S51 |
D21S11 | D21S11 | D21S11 | D21S11 | D21S11 |
D16S539 | D16S539* | D16S539 | D16S539 | D16S539 |
D1S1656 | D1S1656 | D1S1656 | D1S1656 | D1S1656 |
D2S1338 | D2S1338* | D2S1338 | D2S1338 | D2S1338 |
D2S441 | D2S441 | D2S441 | D2S441 | D2S441 |
D10S1248 | D10S1248 | D10S1248 | D10S1248 | D10S1248 |
D12S391 | D12S391 | D12S391 | D12S391 | D12S391 |
D22S1045 | D22S1045 | D22S1045 | D22S1045 | D22S1045 |
D19S433 | D19S433* | D19S433 | D19S433 | D19S433 |
SE33 | SE33* | |||
CSF1PO | CSF1PO | CSF1PO | ||
TPOX | TPOX | TPOX | ||
D5S818 | D5S818 | D5S818 | ||
D13S317 | D13S317 | D13S317 | ||
D7S820 | D7S820 | D7S820 | ||
D6S1043 | ||||
Penta D | ||||
Penta E |
*Loci that can be further analyzed to improve discrimination power apart from the core loci
현재는 CODIS 20개 좌위와 ESS12 좌위가 포함되어 평균 15~22개의 A-STR 좌위를 분석할 수 있도록 고안된 상용화 키트를 많은 나라에서 사용 중에 있다(Butler, 2015). 각국에서의 상용화 키트 사용으로 인하여, 각국의 DNA 정보의 규격화가 이루어져 국제적으로 공유할 수 있는 기회 및 각국 DB 간의 호환성 또한 증가하게 되었다(Butler, 2015; Jordan and Mills, 2021).
우리나라에서는 2010년 7월 26일 디엔에이신원확인정보의 이용 및 보호에 관한 법률(이하 "DNA법")이 시행되면서, 신원확인정보를 수록 • 관리하며 상호 비교를 통하여 신속하게 범인을 특정하여 검거하는 한편 사건과 무관한 용의자를 배제하며 인권을 옹호할 수 있는 제도가 구축되었다. 현장증거물 및 구속피의자 DNA 프로필은 국립과학수사연구원(이하 국과수)에서 운영하는 디엔에이신원확인시스템(DNA identification management system, DIMS)에, 수형인 DNA 프로필은 대검찰청에서 운영하는 한국 DNA 데이터베이스(Korea DNA database, KODNAD)에 보관되어 상호 간의 연계를 통해 검색이 수행되고 있다. 이러한 DNA-DB 제도 운영을 통하여, 최근에는 30여 년간 미제로 남아있던 화성 연쇄살인사건의 진범을 규명한 것을 비롯하여 다양한 장기미제사건을 해결할 수 있었다.
우리나라는 DNA-DB에 수록되는 DNA 신원확인정보와 범죄자의 인적 정보를 분리하여 각각 독립된 DB로 관리하고, DNA 신원확인정보에서는 고유의 식별번호만 부여하고 인적 정보를 포함시키지 않는 등의 방법으로 개인의 사생활 보호에도 최선의 노력을 다하고 있다(Jang et al., 2021).
국내 DNA-DB에는 범죄현장 등, 구속피의자 등 및 수형인 등의 DNA 신원확인정보가 수록되어 관리되고 있다. 범죄현장 등의 DNA 신원확인정보는 2020년 12월 31일 기준 총 139,311건이 수록되었고, 이는 DNA법 제7조에 따라 채취 되었으며, 법 시행 이전에서부터 보유하고 있던 30,338건을 포함한다. 현재 수록되어 있는 범죄현장 등의 DNA 신원확인정보는 아직 신원이 확인되지 않은 것들이고, 등록 이후 신원이 확인될 경우 DB에서 즉시 삭제되고 있다. 살인, 성폭행, 강도 등 강력 사건들이 지속적으로 늘어나고, 사건 해결에 과학적 증거의 필요성 및 DNA 증거의 중요성이 증가함에 따라 DB에 수록되는 범죄현장 등 DNA 신원확인정보의 수도 꾸준히 증가하는 추세이다(Fig. 1) (Jang et al., 2021).
2020년 12월 31일 기준으로 수형인 등 및 구속피의자 등 DB에 수록된 범죄자의 수는 총 254,719명이다(Fig. 2). 수형인 등이란 DNA법 제5조에 따른 DNA 감식시료 채취대상자들로서 불구속 후 징역 • 금고 • 치료감호 처분 등을 받은 실형 확정자와 벌금 • 집행유예 • 조건부선고유예 등을 받은 자들을 말하고, 구속피의자 등은 DNA법 제5조에 따른 죄를 범하여 구속된 피의자 또는 치료감호법에 따라 보호 구속된 치료감호 대상자인 자들로서, 각각 184,957명과 69,762명이 DB에 수록되었다(Jang et al., 2021).
2020년 12월 31일까지 수형인 등과 범죄현장 등 DNA-DB 간 상호검색 결과 총 172,920건의 범죄현장 등을 수형인 등과 검색하여 총 10,243건의 신원을 확인했고, 200,743명의 수형인 등을 범죄현장 등과 검색하여 총 15,652건의 관련사건을 확인했다(Table 4) (Jang et al., 2021). 또한 구속피의자 등과 범죄현장 등의 상호검색 결과 총 172,920건의 범죄현장 등을 구속피의자 등과 검색하여 총 9,434건의 신원을 확인했고, 75,640명의 구속피의자 등을 범죄현장 등과 검색하여 총 13,739건의 관련사건을 확인했다(Table 5) (Jang et al., 2021). 위와 같은 범죄자들의 DNA 신원확인정보는 DB에 수록되는 범죄현장 등과 실시간으로 연계 및 검색되고, 일치 건이 확인되면 신속하게 회보되어 범인의 특정 및 사건 해결에 기여하고 있다.
DNA-DB matching status between prisoners and crime scene evidences (2010. 7. 26~2020. 12. 31)
Year | Crime scene → Prisoners | Prisoners → Crime scene | |||
---|---|---|---|---|---|
Searches (Cases) | Matches (Cases) | Searches (People) | Matches | ||
Prisoners (People) | Crime scene (Cases) | ||||
2010~2011 | 15,828 | 1,196 | 32,964 | 4,632 | 7,522 |
2012 | 26,636 | 1,415 | 18,068 | 1,172 | 1,806 |
2013 | 16,722 | 877 | 19,053 | 1,032 | 1,385 |
2014 | 14,085 | 724 | 19,219 | 641 | 781 |
2015 | 13,614 | 760 | 16,279 | 444 | 520 |
2016 | 15,141 | 850 | 20,901 | 668 | 783 |
2017 | 17,184 | 1,070 | 21,531 | 649 | 717 |
2018 | 18,641 | 1,128 | 20,597 | 667 | 782 |
2019 | 18,215 | 1,194 | 17,898 | 669 | 767 |
2020 | 16,854 | 1,029 | 14,233 | 504 | 589 |
Total | 172,920 | 10,243 | 200,743 | 11,078 | 15,652 |
DNA-DB matching status between suspects in custody and crime scene evidences (2010. 7. 26~2020. 12. 31)
Year | Crime scene → Suspects in custody | Suspects in custody → Crime scene | ||||
---|---|---|---|---|---|---|
Searches (Cases) | Matches (People) | Matches (Cases) | Searches (Cases) | Matches (People) | Matches (Cases) | |
2010~2011 | 15,828 | 519 | 673 | 17,472 | 2,101 | 3,195 |
2012 | 26,636 | 1,180 | 1,510 | 9,289 | 1,416 | 2,076 |
2013 | 16,722 | 514 | 652 | 8,107 | 1,405 | 2,127 |
2014 | 14,085 | 537 | 673 | 7,382 | 1,064 | 1,422 |
2015 | 13,614 | 605 | 764 | 7,314 | 823 | 1,157 |
2016 | 15,141 | 690 | 791 | 6,596 | 690 | 994 |
2017 | 17,184 | 884 | 1,005 | 5,602 | 518 | 640 |
2018 | 18,641 | 929 | 1,112 | 4,807 | 559 | 767 |
2019 | 18,215 | 990 | 1,158 | 4,799 | 504 | 750 |
2020 | 16,854 | 949 | 1,096 | 4,272 | 426 | 611 |
Total | 172,920 | 7,797 | 9,434 | 75,640 | 9,506 | 13,739 |
국내에서는 DB 관리위원회 및 실무위원회에서 확장 좌위의 도입 및 검색 시스템 구축에 대하여 논의하였으며, (법적 • 윤리적) 검토를 거쳐 대한민국의 DNA-DB 좌위 확장이 결정되었다. 이후 2018년 1월부터 공식적으로 확장 좌위가 포함된 20개 좌위가 DNA-DB에 수록되어, 검색을 시행하고 있다. 확장된 좌위를 도입한 DNA-DB 시스템 운영을 통하여 이후 사건 해결에 도움을 준 사례들이 보고되고 있다(Jung et al., 2017).
한편 좌위 확장으로 인해 감정 및 DB 운영에 주의해야 할 점들도 발생한다. 좌위 확장에 따라 시험할 수 있는 대상 좌위가 늘어나면서 DB 수록 기준에 충족되는 현장증거물에 대한 분석 결과가 증가하게 되어 과거에 비해 DB에 수록 및 검색되는 DNA 프로필의 수가 증가했다. 이를 통해 부분 좌위만 검출되더라도 수록 및 검색이 가능하여 더 많은 사건들을 해결할 수 있는 긍정적 효과를 가지고 있다. 다만, 부분 좌위들의 수록이 늘어나게 되면 부분일치인 검색 결과가 증가하게 되고 이러한 부분일치 검색 결과 중에는 추가적인 검토를 요구하는 경우도 있으므로 DB의 운영에 있어서 주의가 필요할 것으로 보인다.
분석된 좌위 수 증가에 따라 수반되는 STR 분석 키트 간 불일치(discordance, DC) 발생의 증가는 불가피한 현상이다. 2018년 확장 좌위 도입을 전후로 2016년 1월부터 2019년 10월까지 접수된 21,160건의 구속피의자 시료를 분석한 결과, 좌위 확장 전 DC 발생 건이 29건(0.28%)에서 좌위 확장 후 67건(0.63%)로 약 2배 증가한 것으로 확인되었다. 대조시료의 경우 DNA의 양이 충분하여 비교적 명확히 DC의 발생을 확인할 수 있지만, 현장증거물의 경우 시료의 상태에 따라 대립유전자 간 불균형 및 대립유전자 삽입/탈락 등이 발생할 수 있으므로, 데이터 분석에 어려움이 있을 수 있다. 따라서 DNA 데이터 분석 시에 STR 좌위에 따른 DC 발생 비율 및 발생 형태를 감안하여 데이터 해석의 오류를 최소화하기 위해 노력해야 할 것으로 사료된다. 또한 DNA 신원확인정보들을 DB에 수록 및 검색 시 면밀히 검토하고, DC로 인한 특정 좌위의 불일치 가능성을 고려하여 필요한 경우 감정인들에게 데이터의 재검토 및 재분석 요청을 통해 DNA-DB의 무결성을 유지하기 위한 노력이 필요할 것으로 판단된다(Kim et al., 2020).
1990년대 중반부터 범죄자 DNA-DB 설립에 대하여 여러 차례 논의가 이루어졌지만, 주관 부서 및 DB 운영과 관리 책임 등의 합의 과정에서의 문제를 이유로 법 제정은 무산되었다. 하지만 이후 계속해서 사회적 이목을 끄는 강력 사건이 발생하며 이에 대응하기 위한 법 제정 필요에 대한 재논의가 이루어지며, 2009년 12월 DNA법이 통과되었다(Cho, 2010; Jung et al., 2021).
DNA법 제정 이전부터 논란이 되던 개인의 인권 보장 측면에 대한 논란은 여전히 존재하고 있는 상황이다. 따라서 제정된 DNA법에서는 이에 대한 논란을 완화하면서도 범죄 수사, 범죄 예방, 국민의 권익 보호를 목적으로 하기 위하여 DNA 신원확인정보의 수집, 이용, 보호에 관련한 내용을 명시하고 있다(Cho, 2010; Kim, 2012; Jung et al., 2017). 법률에서는 DNA 신원확인정보의 수집 및 처리, 정보의 유출 및 오남용 방지를 위한 내용을 주로 다루어, DNA 감식시료의 채취 및 DNA 정보 관리와 정보 이용에 따른 인간의 존엄성과 개인의 사생활이 침해되지 않도록 시책을 마련하고, DNA 정보에는 개인식별 이외의 질병 또는 유전 정보가 포함되지 않도록 규정하고 있다. 따라서 이러한 규정 내에서 DNA-DB 운영은 개인식별만을 목적으로 하고 개인의 익명성을 보장하여 운영되고 있다(Cho, 2010; Jung et al., 2021). 2021년 보고된 좌위 확장의 윤리적 • 법적 검토 연구에서는 확장 좌위를 포함한 STR 좌위들이 개인의 사생활 침해 가능성이 없고, 법적으로도 비례성의 원칙에 반하지 않는 것으로 판단하였다(Cho, 2010).
DNA-DB 검색 결과 일치로 회보하기 위해서는 DNA-DB 운영지침서에 따라, 최소 9개의 일치하는 STR 좌위가 필요하고, 9개 미만이더라도 개인식별 지수가 5.0×1010 이상인 경우 수록 및 검색이 가능하다(Jung et al., 2020). DNA 신원확인정보 관리위원회에서 2018년 1월 2일부터 20개로 확장된 STR 좌위를 적용하기로 결정한 뒤, 2018년 1년간 의뢰된 구속피의자 DNA 프로필을 검색하여 현장증거물 DNA 프로필과 일치한 사건 중에서 현장증거물 DNA 프로필이 좌위 확장을 통해 DNA-DB 수록 기준에 도달한 사례 연구가 수행되었고, 좌위 확장을 통하여 직접적 사건 해결이 된 사례가 1년간 총 28건으로 보고되었다. 사건의 유형 별 분류 결과 절도 사건이 82%로 가장 높은 비율을 차지하였고, 현장증거물 유형은 접촉증거물이 86%로 보고되었다(Jung et al., 2020). 접촉증거물은 DNA 농도가 낮아 부분 프로필 검출 가능성이 높은 유형의 증거물이고, 좌위 확장을 통해 부분 검출 가능성이 높아져 사건의 해결에 도움을 줄 수 있음을 보여주는 사례이다.
2013년부터 2015년까지(3년) 절도 사건의 증거물 유형 추세를 분석한 논문에 의하면 매년 인체 분비물 유형의 증거물은 감소하는 반면 접촉증거물이 큰 폭으로 증가하는 양상이 관찰되었고(Jung et al., 2017), 절도 사건뿐 아니라 과거에 비해 범죄가 점차 흔적을 남기지 않으려는 지능적 양상을 보임에 따라 접촉증거물에서의 DNA 프로필 확보 중요성이 커지고 있다(Han et al., 2013). 따라서 STR 좌위 확장에 의해 접촉증거물에서 DNA 프로필 확보 가능성이 높아짐에 따라 더욱 사건 해결에 기여할 수 있을 것으로 기대된다.
더불어, 위 사례 연구 28건 중에는 혼합 DNA형에서 1인의 DNA 프로필을 추정한 성범죄 사건이 포함되었다(Jung et al., 2020). 혼합 DNA형은 그 자체로는 DNA-DB에서 검색이 불가능하고, 이후 범인이 특정되었을 때 혼합형에 포함되는지 여부를 판단할 수 있다. DNA-DB를 통한 검색 행위는 혼합 DNA형으로부터 1인의 DNA 프로필을 추정할 수 있어야 가능하고, 혼합 비율, DNA 농도 및 대립유전자 양상 등에 따라 좌위 별로 추정의 정확성이 달라질 수 있다. 즉, 좌위 확장은 혼합 DNA형으로부터 추정되는 DNA 프로필의 좌위 수를 증가시킴에 따라 식별력 및 정확성의 향상에도 도움이 될 수 있음을 보여준다.
2021년 보고된 바에 따르면, 좌위 확장으로 DNA-DB 검색 결과 인해 수형인 등과 일치한 사례가 보고되었으며, 2001년 여아강간 장기미제사건, 2003년~2006년 10회에 걸쳐 발생한 연쇄 강도강간 사건이 해당되었다(Jung et al., 2021). 국과수에서 분석된 DNA 프로필 중에서 2010년 범죄자 DNA-DB의 법률화 이전에 분석된 사건들 중 현재 DNA-DB 수록 및 검색 기준에 미치지 못하는 9좌위 미만으로 존재하는 장기미제사건 DNA 프로필이 2015년 3월을 기준으로 1,801건이 존재하였다. 이는 당시 분석 기법의 좌위 수와 검출 한계에 의한 것으로 국과수에서는 1,801건을 사건의 유형 별로 분류하였고, 강도 • 살인 등에 해당하는 유형-I(131건), 강간 등에 해당하는 유형-II(858건) 및 절도 등에 해당하는 유형-III(812건)을 단계적으로 재분석하였으며, 확장 좌위가 포함된 STR 증폭 키트를 이용하여 현 기술에서 최대한의 좌위 수를 확보하고자 하였다. 2018년도 까지 진행된 유형-I의 재분석 결과에 의하면, 131건 중에서 56.5%에 해당하는 74건의 DNA 프로필이 9좌위 이상으로 업그레이드되었으며, 이중 5건은 수형인과 일치하여 사건이 해결된 것으로 확인되었다. 이와 같은 결과는 유형-I에 한정된 결과지만, 강도, 살인 등 강력 사건에 대한 장기미제사건 수사에 기여하였음을 알 수 있으며, 유형-II 및 III에 해당하는 건에 대한 성과가 반영된다면 장기미제 해결의 기여도가 크게 증가할 것으로 사료된다.
DNA 분석법은 감정물 DNA와 특정 개인의 DNA 프로필을 비교하는 범죄 사건에의 응용 이외에, 개인 신원확인 분야에도 활발히 사용 중이다. 하지만 개인식별력 향상 등의 목적으로 꾸준히 STR 좌위의 확장이 이루어졌지만, 가족관계 확인 목적의 분석에서는 여전히 추가좌위 확장의 필요성이 제기되고 있고, 가족관계 분석의 정확성 향상에 대한 긍정적 가능성이 보고되고 있다(Novroski et al., 2019).
한국인을 대상으로 한 과거 연구에 따르면 분석에 활용되는 STR 좌위가 13개에서 20개로 확장되었을 때, 개체식별력(power of discrimination, PD)은 0.9163으로 향상되었으며, 개체간 디엔에이형이 일치할 확률(probability of match, PM) 값은 2.5963×10-23, 친자관계 분석의 지표가 되는 배제 확률(power of exclusion, PE) 값은 0.99999995로 이전 13개 STR을 좌위로 사용했을 때의 PM 값(2.8090×10-14)과 PE 값(0.99995)보다 훨씬 식별력이 향상된 것을 확인하였다(Kim et al., 2017). 또한 21개의 STR 좌위를 사용하였을 때 집단 내 동일개체 출현 확률(probability of identity, PI) 값은 10개의 STR 좌위를 사용했을 때의 PI 값인 4.93×10-14에서 21개의 확장 좌위 사용으로 인하여 9.66×10-25으로 줄어드는 것을 확인하였다(Hwang et al., 2013). PE 값 혈연관계 판정 기준으로 사용되는 우도비(likelihood ratio, LR)와의 연관성을 분석한 과거 연구에 따르면 LR = 1/(1-PE)이므로 PE 값과 LR 비례 관계가 성립하고, 좌위 확장으로 인하여 혈연 관계가 아닌 경우의 PE 값이 감소됨에 따라 LR 값의 감소로 인하여 가족관계 분석에 대한 정확성을 높일 수 있다는 점을 알 수 있다(Slooten and Egeland, 2014).
실제로 한국인을 대상으로 한 연구 결과에서 13개 STR 좌위 사용과 20개 STR 좌위 사용 시, 부모-자식 관계와 형제관계의 LR 분포 그래프에서 로그 중앙값(median LR)이 증가하는 방향(우측)으로 이동하였으며, 이는 연관성이 없는 그룹 간의 LR 그래프와 중첩되는 부분이 줄어들어 혈연 관계가 없는 관계를 구분하는 능력이 향상되었음을 확인하였다(Yang et al., 2013). 즉, STR 좌위 확장을 적용한 가족관계 분석 시, 혈연관계 파악에 대한 정확성을 향상시킨다는 결론을 얻을 수 있었다(Yang et al., 2013).
STR 좌위에서 발생하는 돌연변이는 개인의 신원확인을 어렵게 만드는 요인 중 하나이다. DNA 복제가 진행되는 동안 가닥 미끄러짐 현상이나 불균등한 염색체 교차 현상이 일어나게 되면, STR 반복 수가 증가 또는 감소되어 돌연변이로 나타나게 되는데, 세대당 돌연변이율이 10-6 ~ 10-2으로 높은 편이기 때문에 돌연변이로 인하여 부모와 자식이 공유하는 대립유전자를 찾지 못하는 경우도 발생한다(Fan and Chu, 2007; Mardini et al., 2013; Nwawuba Stanley et al., 2020). 돌연변이는 각 인종 및 국가에 따라서도 다르게 나타나므로 한국 이외에도 중국, 브라질, 멕시코, 아제르바이잔, 터키 등의 국가에서는 특정 인종에서 발생하는 STR 좌위 별 돌연변이에 대한 연구를 활발히 진행 중에 있다(Mardini et al., 2013; Kim et al., 2021).
가족관계 일치 기준 정립에 있어서, STR 좌위의 확장에 따른 돌연변이 등의 반영이 필요하다. 좌위 별 돌연변이율을 확률 값에 반영하고, 돌연변이로 인한 배제 기준을 결정하기 위해서는 확장된 좌위를 토대로 한국인 집단 내 STR 돌연변이 연구가 필요하다. 이에, 최근 한국에서도 관련 연구가 수행되었고 연구 결과 전체 303 가구의 10.89% 비율로 총 36개의 돌연변이가 보고되었다(Mardini et al., 2013). 돌연변이는 D1S1656, D2S441, D2S1338, FGA, CSF1PO, SE33, D7S820, vWA, D12S391, Penta E, D21S11, Penta D, D22S1045 총 14개의 좌위에서 관찰되었고, 특히 SE33의 돌연변이율(1.28%)이 가장 높았고 뒤를 이어 Penta E, D12S391에서의 돌연변이 관찰율이 높았다(Kim et al., 2021). CODIS 좌위에서 발생한 22개의 돌연변이 중 12개(54.5%)는 기존 13개 CODIS STR 좌위에 해당하지만, 10개(45.5%)는 확장된 7개의 CODIS STR 좌위에 해당됨으로써 확장 좌위 또한 기존 좌위 수준의 높은 돌연변이율을 보였다(Kim et al., 2021). 이는 좌위 확장과 더불어 한국인 집단 내 돌연변이 연구가 필요한 이유를 보여준다. 더불어, CODIS 20 좌위에 미 포함되는 Penta E, Penta D 및 SE33 좌위에서도 전체 36개 돌연변이의 38.9%인 14개의 돌연변이를 확인하였다. 따라서 CODIS 좌위는 아니지만 신원확인을 위해 분석되는 좌위이므로 이들 좌위 또한 돌연변이 연구 등에 포함될 필요가 있다(Kim et al., 2021). 해당 연구에는 545개의 trio(부-모-자) 세트를 분석에 활용하였지만, 가족관계 일치 기준의 정립에 활용에는 보다 많은 trio 세트가 필요하며, 이 외의 국내 STR 돌연변이 연구 사례는 미진한 상황이다. 한국인 집단 내 trio 세트를 수집하고, STR 좌위 확장에 따른 좌위 별 돌연변이 연구 수행을 통해 신원확인의 정확성을 높이고 돌연변이를 반영한 배제 기준을 확립할 필요가 있다.
현재 STR 분석 키트의 상용화에 따라 동일 STR 좌위를 분석할 수 있는 키트가 여러 회사에서 출시되었다. 그리고 국과수에서는 DNA 분석의 무결성 증명 및 교차 검증을 목적으로 동일 좌위에 대하여 다른 키트를 사용하여 중복 확인하고 있으며, 좌위 확장 이전과 확장 이후의 DNA-DB 연속성을 고려하여 키트가 선정되었다(Kim et al., 2020). 만일 STR 좌위를 인지하는 프라이머 부위에 단일염기변형(SNP)이 발생하여 대립유전자 유실(allele drop-out)로 분석되거나, off-ladder로 분석되는 경우, 또는 프라이머 결합 부위에 결실 또는 삽입이 일어나 잘못된 유전자형이 생성되는 경우에는 키트 간의 불일치 현상(DC)이 발생하게 된다(Li et al., 2014; Gill et al., 2015; Kim et al., 2020). 따라서 국내외에서 DC에 대한 다양한 좌위 및 상황에 대한 연구가 진행 중이다(Li et al., 2014; Kim et al., 2020).
STR 키트 내 좌위 수가 증가했음에도 불구하고 다중 증폭을 통한 DNA 프로필 검출률이 향상된 이유는 증폭 키트의 Taq polymerase, 버퍼 등의 개선과 더불어 일정한 증폭 산물의 크기를 유지하기 위한 형광 패널의 수 증가 및 프라이머 위치의 재조정 때문이다. 각 회사에서는 기존 DNA-DB와 확장 좌위의 DNA-DB 호환성을 위해 프라이머 위치의 재조정을 최소화 하였으나, 일부 조정이 불가피하므로 DC 가능성이 존재한다. 이에 DC 문제 해결을 위해 확장 키트와 기존 키트 간의 불일치, 확장 키트 간의 불일치 등의 연구가 필요하며 이를 통해 DNA 분석의 무결성이 증가될 것으로 기대한다.
본 논문에서는 현재 DNA 감식에 표준으로 이용되는 STR 분석법과 이를 바탕으로 운영되고 있는 DNA-DB에 대한 기본적 내용을 기술하였다. 또한 나날이 증가하는 DNA-DB 내의 프로필에 대응하기 위한 STR 좌위 확장의 필요성과 확장 사례를 통한 좌위 확장의 긍정적 효과 및 극복해야 하는 상황에 대한 논의를 함으로써, 앞으로의 효과적인 DNA-DB 운영 시스템을 위해 필요한 연구 방향 또한 제시하였다.
영국에서 가장 먼저 4개의 STR 좌위를 이용한 DNA-DB가 구축되고, 이후 미국에서는 13개의 STR 좌위를 선정하여 DB를 운영하였다. DB 운영을 통하여 국가 수준으로 DNA 정보를 서로 비교할 수 있게 되어 수사에 크게 기여할 수 있었지만 증가하는 프로필 수로 인한 한계점을 가지게 되었다. 따라서 좌위 확장의 목적과 필요성에 근거한 명확한 기준에 따라, 여러 연구 결과를 종합하여 최종 20개로 STR 좌위를 확장하였다. 하지만 여전히 각국 DB에 저장되는 프로필 수는 빠르게 증가하여, 선정 좌위를 이용한 분석 결과가 우연히 일치하게 될 확률 또한 더욱 높아지고 있다. 뿐만 아니라 LCN 시료 및 국제 공조의 필요성 또한 증가하고 있는 여러 사회적 상황에서 STR 좌위 확장 연구는 여전히 문제 해결을 위한 필수적 요소로 여겨지고 있다.
우리나라에서는 2010년 DNA 법 시행 이후 DNA-DB를 운영하였고, 수사에 적극 활용하여 화성 연쇄살인사건 진범 규명과 같은 다양한 장기미제사건의 해결에 활용하였다. 따라서 DNA 증거의 중요성이 꾸준히 증가되어 DNA-DB에 수록되는 프로필 수도 꾸준히 증가하였고, 이에 따라 2018년 이후부터는 공식적으로 확장된 20개의 좌위가 DNA-DB에 수록되어 활용되고 있다. 이는 현재 미국에서 이용 중인 CODIS 20 중심 좌위와 동일한 좌위로, 높은 개인식별력을 가지고 있기 때문에 빠른 속도로 DNA-DB에 축적되는 DNA 프로필들의 우연히 일치할 확률이 현저히 개선되었고, 기존 CODIS 13 좌위에 국제적 호환성이 높은 7개의 좌위를 추가하여 영국, 유럽, 중국 등 국가들과도 15개 공통 좌위를 공유하므로 국제화되는 사회에서 국제 공조에도 적합한 수준을 갖추었다.
확장된 20개 좌위 분석을 통하여 해결된 사례를 분석하였을 때, 이러한 활용은 주로 절도 사건 및 접촉 감정물, LCN 시료를 이용한 분석에서 사건 해결에 결정적 기여를 할 수 있었다는 점을 확인하였다. 또한 과거 미제 사건 DNA를 확장된 좌위로 재분석 후 DNA-DB 검색 결과 범죄자 프로필(수형인 등, 구속피의자 등)과 일치한 사례가 보고되어 장기미제사건의 해결 가능성을 확인하였으며, 확장 좌위를 이용할 때, 개인 신원확인 및 가족관계 확인 분야에서의 정확성 또한 향상될 것으로 기대하고 있다.
STR 좌위 확장 이후 우리가 극복해야 할 과제들도 발생한다. STR 좌위 내에서 발생하는 돌연변이 연구 및 STR 좌위 분석 키트 간 결과 불일치에 대한 연구가 필요하다. STR 돌연변이는 신원확인에 어려운 요인으로 작용할 수 있으며, 가족관계 일치 기준을 정립하기 위한 목적으로 현재 여러 국가에서 확장된 좌위를 토대로 STR 돌연변이에 대한 연구가 진행 중이다. 뿐만 아니라 STR 좌위 분석 키트 간의 결과 불일치에 대한 연구도 분석 결과의 무결성 입증을 위하여 필수적이다.
따라서 이번 총설에서는 현 상황에서 STR 좌위의 확장이 필수적이며, 확장된 좌위를 DNA-DB 운영에 적극 활용함으로써 사건 해결 기여율 향상 및 가족관계 분석 정확성 향상으로 인한 성과 도출이 가능함을 시사한다.
This work was supported by the Korean government and by a grant (NFS2022DNA03) from the Forensic Research Program of the National Forensic Service (NFS).
The authors declare that they have no conflict of interest.