출처:
Jin, Han-Jun, Chris Tyler-Smith, and Wook Kim. “The peopling of Korea revealed by analyses of mitochondrial DNA and Y-chromosomal markers.” PloS one 4.1 (2009): e4210.

 

The Peopling of Korea Revealed by Analyses of Mitochondrial DNA and Y-Chromosomal Markers

모계(mtDNA)와 부계(Y-chromosome) 유전자를 통해 본 한국인의 기원

진한준¹ (Han-Jun Jin), 크리스 타일러-스미스² (Chris Tyler-Smith), 김욱¹* (Wook Kim)

  • ¹ Department of Biological Sciences, Dankook University, Cheonan, Korea
    단국대학교(檀國大學校) 생물학과, 천안(天安), 한국(韓國)
  • ² The Wellcome Trust Sanger Institute, Wellcome Trust Genome Campus, Hinxton, Cambridge, United Kingdom
    웰컴 트러스트 생어 연구소(The Wellcome Trust Sanger Institute), 웰컴 트러스트 게놈 캠퍼스, 힝스턴(Hinxton), 케임브리지(Cambridge), 영국(聯合王國)

 

[논문요약] 한국인의 유전적 조상은 누구인가?

이 연구의 결론은 한국인의 집단 형성이 복잡한 과정이었으며, 초기 북아시아인의 정착을 기반으로 남방에서 북방으로의 남성 위주 이주가 있었고, 이 이주가 벼농사 확산과 관련이 있다는 점을 제시했다.

1. 연구 배경 및 방법: 엄마 유전자 vs. 아빠 유전자

한국은 지리적으로 동북아시아에 위치하지만, 유전자 연구 결과는 한국인이 남부와 북부 동아시아 모두의 혈통을 포함하고 있다는 의문을 제기했다. 이 논문은 이 의문을 해결하기 위해 다음 두 가지 주요 유전자 표지자를 분석했다.

  • mtDNA (미토콘드리아 디엔에이): 엄마에게서만 유전되는 유전자. 모계 혈통(여성의 이동)을 추적한다.
  • Y-chromosome (와이 염색체): 아빠에게서만 유전되는 유전자. 부계 혈통(남성의 이동)을 추적한다.

분석 방법 요약

  • 샘플: 한국인 포함 7개 동아시아 집단(총 445명)의 DNA와 대규모 기존 문헌 데이터(mtDNA N=3307, Y-STR N=2713 등)를 통합 분석했다. [그림 1]은 연구된 집단들의 지리적 위치를 보여주며, 연구의 범위를 시각적으로 파악하는 데 도움을 준다.

  • 기술: 피시알(PCR, 디엔에이 증폭 기술)을 이용해 유전자를 증폭하고, 제한 효소 길이 다형성(RFLP) 등으로 분석했다 (표 1).
    • (표 1 주석: PCR 조건은 변성(denaturation)을 위해 94°C에서 5분간; 증폭(amplification)을 위해 94°C에서 45초, 표에 제시된 어닐링 온도에서 45초, 그리고 72°C에서 1분 동안 총 35회 반복했다. 마지막으로 72°C에서 5분간 배양했다.)

  • 통계: 집단 간 유전적 거리FST, RST를 계산하고, 다차원 척도법(MDS) 플롯으로 시각화했으며 (그림 2), 분자 분산 분석(AMOVA) (표 4) 및 혼합 추정치 (표 5)를 사용했다.

2. 결과 (1): 모계(mtDNA) 혈통은 북방계 우세

한국인의 모계 혈통(mtDNA)은 전반적으로 동북아시아 집단과 매우 강한 유사성을 보였다.

① mtDNA 유전자 분포 및 다양성

  • 높은 다양성: 7개 집단 모두 높은 유전적 다양성(H>0.99)을 보였는데, 이는 각 집단의 유전자 풀이 크고 이질적임을 시사한다 (표 3). (표 3 주석: HVS-I: np 16024–16365; HVS-II: np 73–340.)

  • 북방계 우세: 한국인 mtDNA 풀의 약 60%는 북부 동아시아에서 흔한 D4, A, G와 같은 북방계 유전자형 그룹으로 채워져 있다 (표 2).
  • 남방계 기여: 그러나 동남아시아에서 우세한 B, M7, F와 같은 남방계 혈통도 30% 이상의 중간 빈도로 발견되어 남부 기여도 있음을 보여준다 (표 2).

② 유전적 거리 (mtDNA)

mtDNA 데이터를 기반으로 한 다차원 척도법(MDS) 플롯 (그림 2A, B)에서, 한국인 샘플은 전적으로 북부 집단 클러스터 내에 위치했다. 즉, 유전적으로는 북방계 집단과 가장 가까웠다.

3. 결과 (2): 부계(Y-chromosome) 혈통의 남방계 기여

mtDNA와 대조적으로, 한국인의 부계 혈통(Y-chromosome) 분석 결과는 달랐다.

① Y-chromosome 유전적 거리

  • Y-chromosome 데이터를 기반으로 한 MDS 플롯 (그림 2C, D)에서, 한국인 샘플은 북부 클러스터 내부에 있기보다는 북부와 남부 클러스터 사이의 경계에 위치했다. 이는 남방계와도 유의미한 유전적 관계를 맺고 있음을 시사한다.
  • AMOVA (표 4) 결과, mtDNA는 남부와 유의미한 차이가 없었지만, Y-chromosome은 남동아시아 집단과는 통계적으로 구별되었다 (표 4 주석: P 값은 10,000회 치환을 통해 얻었다).

② Y-STR 네트워크 상세 분석

  • 주로 북방계인 C* 유전자형 그룹과 주로 남방계인 O3 유전자형 그룹 내의 단연쇄 반복(STR) 유전자형을 네트워크로 시각화했다 (그림 3).
  • 두 유전자형 그룹 모두에서 한국인 유전자형은 북부 유전자형보다 남부 유전자형까지의 평균 거리가 더 짧았다. 이는 남방계 조상들과 더 밀접한 유전적 특성을 공유한다는 것을 의미한다.

4. 종합 논의: 남성 편향 이주와 벼농사

① 성별 편향 혼합의 증거

연구의 가장 중요한 발견은 모계와 부계의 기여도가 극명하게 다르다는 점이다. 이는 한국인 집단이 성별 편향 혼합을 겪었음을 의미한다.

유전자 표지자 (Markers) 북동아시아 기여 추정치 남동아시아 기여 추정치
mtDNA (모계) 65% 35%
Y-chromosome (부계) 17% 83%
(표 5 주석: SD, 표준 편차(Standard Deviation))
  • 결론: 한국인 유전자 풀에 대한 남부 동아시아로부터의 기여는 여성(35%)보다 남성(83%)에게서 훨씬 더 컸다 (표 5).

② 남성 이주와 벼농사 확산의 연관성

이러한 남성 위주의 대규모 남방계 유입은 역사적 사건과 연결된다.

  • 유전자형 그룹 O-M122와 같은 남방계 유전자들은 동아시아 전역에서 높은 빈도로 발견되는데, 이는 와이 염색체 확산벼농사 확산 사이에 연관성이 있다는 가설을 지지한다.
  • 해석: 논문은 이 유입이 초기 농업 확산 기간 동안 남성 주도의 인구 확산(demic diffusion) 과정을 통해 이루어졌을 수 있으며, 남성 매개 농업의 확산을 통해 한국으로의 유전적 기여가 이루어졌음을 시사한다고 결론지었다.

 

[논문번역]

요약

Background: The Koreans are generally considered a northeast Asian group because of their geographical location. However, recent findings from Y chromosome studies showed that the Korean population contains lineages from both southern and northern parts of East Asia. To understand the genetic history and relationships of Korea more fully, additional data and analyses are necessary.

배경: 한국인들은 지리적 위치 때문에 일반적으로 동북아시아 집단으로 여겨졌다. 그러나 최근의 와이 염색체(Y chromosome) 연구 결과들은 한국인 집단이 동아시아의 남부와 북부 지역 모두에서 유래한 혈통을 포함하고 있다는 것을 보여주었다. 한국의 유전적 역사와 관계를 더욱 완전하게 이해하기 위해서는 추가적인 데이터와 분석이 필요했다.

Methodology and Results: We analyzed mitochondrial DNA (mtDNA) sequence variation in the hypervariable segments I and II (HVS-I and HVS-II) and haplogroup-specific mutations in coding regions in 445 individuals from seven east Asian populations (Korean, Korean-Chinese, Mongolian, Manchurian, Han (Beijing), Vietnamese and Thais). In addition, published mtDNA haplogroup data (N=3307), mtDNA HVS-I sequences (N=2313), Y chromosome haplogroup data (N=1697) and Y chromosome STR data (N=2713) were analyzed to elucidate the genetic structure of East Asian populations. All the mtDNA profiles studied here were classified into subsets of haplogroups common in East Asia, with just two exceptions. In general, the Korean mtDNA profiles revealed similarities to other northeastern Asian populations through analysis of individual haplogroup distributions, genetic distances between populations or an analysis of molecular variance, although a minor southern contribution was also suggested. Reanalysis of Y-chromosomal data confirmed both the overall similarity to other northeastern populations, and also a larger paternal contribution from southeastern populations.

연구 방법 및 결과: 연구자들은 동아시아 7개 집단(한국인, 한국계 중국인(中國人), 몽골인(蒙古人), 만주인(滿洲人), 한(漢)족(북경(北京)), 베트남인(越南人), 태국인)의 445명에게서 미토콘드리아 디엔에이(mtDNA)의 고변이 구역(HVS-I 및 HVS-II) 서열 변이와 코딩 영역의 유전자형 그룹(haplogroup) 특이적 돌연변이를 분석했다. 또한, 발표된 미토콘드리아 디엔에이(mtDNA) 유전자형 그룹 데이터(N=3307), 미토콘드리아 디엔에이(mtDNA) 고변이 구역(HVS-I) 서열(N=2313), 와이 염색체(Y chromosome) 유전자형 그룹 데이터(N=1697) 및 와이 염색체 단연쇄 반복(STR) 데이터(N=2713)를 분석하여 동아시아 집단의 유전적 구조를 명확히 했다. 연구된 모든 미토콘드리아 디엔에이(mtDNA) 프로파일은 단 두 가지 예외를 제외하고는 동아시아에서 흔히 발견되는 유전자형 그룹의 하위 집단으로 분류했다. 일반적으로 한국인의 미토콘드리아 디엔에이(mtDNA) 프로파일은 개별 유전자형 그룹 분포 분석, 집단 간 유전적 거리 분석 또는 분자 분산 분석(AMOVA)을 통해 다른 동북아시아 집단과 유사성을 보였지만, 소수의 남방 기여도 역시 시사되었다. 와이 염색체 데이터를 재분석한 결과는 다른 동북아시아 집단과의 전반적인 유사성을 재확인했으며, 동시에 남동아시아 집단으로부터의 더 큰 부계 기여도 확인했다.

Conclusion: The present work provides evidence that peopling of Korea can be seen as a complex process, interpreted as an early northern Asian settlement with at least one subsequent male-biased southern-to-northern migration, possibly associated with the spread of rice agriculture.

결론: 이 연구는 한국인의 집단 형성이 복잡한 과정으로 볼 수 있다는 증거를 제시했으며, 이는 초기 북아시아인의 정착과 함께 적어도 한 번의 남성 편향적(male-biased) 남방-북방 이주로 해석될 수 있고, 이 이주는 아마도 벼농사(rice agriculture)의 확산과 관련이 있을 가능성이 높다.

 

목차

서론

연구 재료 및 방법 (Materials and Methods)

결과 및 논의 (Results and Discussion)

보충 정보 (Supporting Information)

감사의 말 (Acknowledgments)

저자 기여 (Author Contributions)

참고문헌 (References)

 

서론

An understanding of the evolutionary history of East Asian populations has long been a subject of interest in the field of human evolutionary genetics. Based on results of classical genetic markers, there is significant separation between southern and northern populations of East Asia [1]. This north-south genetic differentiation is likely to have an origin in the early peopling of the region. There have been two major models for early migration routes into East Asia. The first model postulates a southeast Asian origin, followed by a northward migration [2]. Recent genetic surveys using autosomal microsatellite markers [3] and Y-chromosomal binary markers [4] have been interpreted as supporting this model. In contrast, the second model suggests a multidirectional route: one migration through central Asia and one through southeast Asia [1,5,6]. Thus, understanding the genetic origin and history of Korea may be informative for questions concerning prehistoric migration route(s) and population expansions in East Asia.

동아시아 인구의 진화 역사를 이해하는 것은 인간 진화 유전학 분야에서 오랫동안 관심의 대상이었다. 고전적인 유전적 표지자의 결과에 따르면, 동아시아의 남부와 북부 집단 사이에는 상당한 분리 현상이 있다 [1]. 이러한 남북 유전적 분화는 해당 지역의 초기 집단 형성에 기원했을 가능성이 높다. 동아시아로의 초기 이주 경로에 대한 두 가지 주요 모델이 있었다. 첫 번째 모델은 동남아시아 기원을 가정한 후 북쪽으로 이주가 있었다고 주장한다 [2]. 상염색체 마이크로위성 표지자(autosomal microsatellite markers)를 사용한 최근의 유전적 조사 [3]와 와이 염색체 이진 표지자(Y-chromosomal binary markers)를 사용한 조사 [4]들은 이 모델을 지지하는 것으로 해석되었다. 이와 대조적으로, 두 번째 모델은 다방향 경로를 제시한다. 즉, 하나는 중앙아시아를 통과하는 이주이고 다른 하나는 동남아시아를 통과하는 이주이다 [1,5,6]. 따라서 한국의 유전적 기원과 역사를 이해하는 것은 동아시아의 선사 시대 이주 경로와 인구 확장에 관한 질문에 유익할 수 있다.

The Korean Peninsula is located to the north of the Yellow and Yangtze Rivers of China, and bounded to the northeast by Russia. Therefore, the Koreans are geographically a northeast Asian group. Anthropological and archeological evidence suggests that the early Korean population was related to Mongolian ethnic groups who inhabited the general area of the Altai Mountains and Lake Baikal regions of southeast Siberia [7]. According to Korea’s founding myths, the Ancient Chosun (the first state-level society of Korea) was established around 2,333 BC in the region of southern Manchuria but later moved into the Pyongyang area of northwest Korea. In addition, archeological evidence reveals that rice cultivation had spread to most parts of the Korean Peninsula by around 1,000–2,000 BC, introduced from the Yellow River and/or Yangtze River basin in China [8].

한반도(韓半島)는 중국의 황하(黃河)와 양자강(揚子江) 북쪽에 위치하며 동북쪽으로는 러시아(俄羅斯)와 접해 있다. 따라서 한국인들은 지리적으로 동북아시아 집단이다. 인류학적 및 고고학적 증거는 초기 한국 인구가 알타이(阿爾泰) 산맥과 바이칼(貝加爾) 호 지역, 즉 동남 시베리아(西伯利亞) 일반 지역에 거주했던 몽골(蒙古) 민족 집단과 관련이 있음을 시사한다 [7]. 한국의 건국 신화에 따르면, 고조선(古朝鮮)(한국 최초의 국가 수준 사회)은 기원전 2,333년경 남부 만주(滿洲) 지역에 세워졌으나 나중에 한국 북서부의 평양(平壤) 지역으로 이동했다. 또한, 고고학적 증거는 벼농사가 중국의 황하(黃河) 및/또는 양자강(揚子江) 유역에서 도입되어 기원전 1,000년에서 2,000년경까지 한반도(韓半島) 대부분 지역으로 확산되었음을 보여준다 [8].

Studies of classical genetic markers showed that Koreans tend to have a close genetic affinity with Mongolians among East Asians [9–11]. In contrast, recent surveys of Y-chromosomal DNA variation revealed that the Korean population contained lineages typical of both southern and northern East Asian populations [6,12,13]. The Koreans appeared to have affinities with Manchurians, Yunnan-Chinese from southern China, and Vietnamese [13].

고전적인 유전적 표지자 연구는 한국인이 동아시아인 중에서 몽골인(蒙古人)과 밀접한 유전적 유사성을 가지는 경향이 있음을 보여주었다 [9–11]. 이와 대조적으로, 와이 염색체 디엔에이(DNA) 변이에 대한 최근 조사들은 한국인 집단이 남부 및 북부 동아시아 집단의 전형적인 혈통을 모두 포함하고 있다는 것을 밝혀냈다 [6,12,13]. 한국인은 만주인(滿洲人), 남부 중국의 운남(雲南)-중국인(中國人), 그리고 베트남인(越南人)과 유사성을 가지는 것으로 보였다 [13].

To understand the genetic history of Korea better, more data from additional genetic markers from Korea and its surrounding regions are necessary. Mitochondrial DNA (mtDNA), like the Y chromosome, can also provide valuable information about the phylogeography of human populations due to its special features of haploidy and uniparental inheritance [14–18]. Although recent investigations of mtDNA variation in East Asia have provided valuable information for constructing a robust phylogenetic tree of mtDNA haplotypes, limited data on the Korean population are available [19–21].

한국의 유전적 역사를 더 잘 이해하기 위해서는 한국과 주변 지역의 추가적인 유전적 표지자로부터 더 많은 데이터가 필요하다. 미토콘드리아 디엔에이(mtDNA)는 와이 염색체와 마찬가지로 단수성(haploidy)과 단일 부모 유전(uniparental inheritance)이라는 특별한 특징 때문에 인간 집단의 계통지리학(phylogeography)에 대한 귀중한 정보를 제공할 수 있다 [14–18]. 동아시아의 미토콘드리아 디엔에이(mtDNA) 변이에 대한 최근 조사들이 미토콘드리아 디엔에이(mtDNA) 유전자형(haplotypes)의 강력한 계통 발생 나무를 구축하는 데 귀중한 정보를 제공했지만, 한국 인구에 대한 데이터는 제한적이다 [19–21].

In this study, we present new data on the mtDNA sequence variation of the hypervariable segments I and II (HVS-I and HVS-II) and haplogroup-specific mutations in coding regions in 445 individuals from seven East Asian populations, including Korea. In addition, mtDNA haplogroup data (N=3307), mtDNA HVS-I sequences (N=2313), Y chromosome haplogroup data (N=1697) and Y chromosome STR data (N=2713) from the literature were analyzed to elucidate wider aspects of the genetic structure of East Asian populations.

이 연구에서는 한국을 포함한 동아시아 7개 집단의 445명으로부터 얻은 미토콘드리아 디엔에이(mtDNA)의 고변이 구역(HVS-I 및 HVS-II) 서열 변이 및 유전자형 그룹 특이적 돌연변이에 대한 새로운 데이터를 제시한다. 또한, 동아시아 인구의 유전적 구조의 더 넓은 측면을 명확히 하기 위해 기존 문헌의 미토콘드리아 디엔에이(mtDNA) 유전자형 그룹 데이터 (N=3307), 미토콘드리아 디엔에이(mtDNA) 고변이 구역(HVS-I) 서열 (N=2313), 와이 염색체 유전자형 그룹 데이터 (N=1697), 와이 염색체 단연쇄 반복(STR) 데이터 (N=2713)를 분석했다.

 

연구 재료 및 방법 (Materials and Methods)

디엔에이(DNA) 샘플 및 참고 자료 (DNA samples and reference data)

We analyzed a total of 445 individuals, collected from seven East Asian populations (Korean, Korean-Chinese (People of Korean origin now living in China), Mongolian, Manchurian, Chinese Han (Beijing), Vietnamese, and Thai). The DNA samples included subsets of the samples examined by Jin et al. [13] and Kwak et al. [22], although the exact number of subjects for each population occasionally varies between these studies. In addition, we included the following new Korean-Chinese and Mongolian samples: 51 Korean-Chinese from northern China and 47 Mongolians from Ulaanbaatar. This study was approved by the Ethics Committee and institutional review boards of Institute of Bio-Science and Technology in the Dankook University in Cheonan, and separate written informed consent was obtained for enrollment from all participants. DNA was prepared from whole blood by the standard method [23] or was extracted from buccal cells according to the procedure of Richards et al. [24].

연구자들은 동아시아 7개 집단(한국인, 한국계 중국인(中國人) [현재 중국(中國)에 거주하는 한국계 사람들], 몽골인(蒙古人), 만주인(滿洲人), 중국(中國) 한(漢)족(북경(北京)), 베트남인(越南人), 태국인)으로부터 수집한 총 445명의 개인을 분석했다. 디엔에이(DNA) 샘플에는 Jin 등 [13]과 Kwak 등 [22]이 검사한 샘플의 하위 집합이 포함되었지만, 각 집단의 정확한 대상 수는 이 연구들 간에 때때로 차이가 있다. 또한, 연구자들은 중국(中國) 북부의 한국계 중국인(中國人) 51명과 울란바토르(Ulaanbaatar)의 몽골인(蒙古人) 47명의 새로운 샘플을 포함했다. 이 연구는 천안(天安)의 단국대학교(檀國大學校) 생명과학기술연구소의 윤리위원회와 기관심사위원회(IRBs)의 승인을 받았으며, 모든 참가자로부터 연구 참여에 대한 별도의 서면 동의를 받았다. 디엔에이(DNA)는 표준 방법 [23]에 따라 전혈(whole blood)에서 준비하거나, Richards 등 [24]의 절차에 따라 구강 세포(buccal cells)에서 추출했다.

In addition to our mtDNA data sets, mtDNA haplogroup data for 2862 individuals, mtDNA HVS-I sequences data for 1868 individuals, Y chromosome haplogroup data for 1697 individuals and Y chromosome STR data (ten Y-STR loci: DYS19, DYS389I, DYS389b, DYS390, DYS391, DYS392, DYS393, DYS437, DYS438 and DYS439) for 2716 individuals were retrieved from the literature [19,20,25–40] to elucidate the genetic relationship between Koreans and other East Asian populations (details in Supplementary Table S1 and Figure 1). For mtDNA haplogroup analysis, some sub-haplogroups were clustered into major haplogroups according to their phylogenetic affiliations (Supplementary Table S2). Similarly, Y chromosome haplogroups from reference data were reclassified into a common set of 13 Y-chromosomal (sub)haplogroups that captured most of the phylogenetic information to allow population comparisons (Supplementary Table S3).

연구자들의 미토콘드리아 디엔에이(mtDNA, 엄마의 유전자) 데이터 세트 외에도, 개인 2862명의 mtDNA 유전자형 그룹 데이터, 개인 1868명의 mtDNA 고변이 구역 I(HVS-I) 서열 데이터, 개인 1697명의 와이 염색체(Y chromosome, 아빠의 유전자) 유전자형 그룹 데이터, 그리고 개인 2716명의 와이 염색체 단연쇄 반복(STR) 데이터(10개 유전자좌)를 문헌 [19,20,25–40]에서 검색하여 한국인과 다른 동아시아 집단 간의 유전적 관계를 명확히 했다(자세한 내용은 보충 표 S1과 그림 1 참조). mtDNA 유전자형 그룹 분석을 위해, 일부 하위 유전자형 그룹은 계통 발생학적 소속에 따라 주요 유전자형 그룹으로 분류했다(보충 표 S2 참조). 유사하게, 참고 자료의 와이 염색체 유전자형 그룹은 집단 비교를 허용하기 위해 대부분의 계통 발생 정보를 포착하는 13개의 와이 염색체 (하위)유전자형 그룹의 공통 세트로 재분류했다(보충 표 S3 참조).

그림 1. 연구된 아시아 집단의 지리적 위치. (A) mtDNA 유전자형 그룹. (B) mtDNA 고변이 구역 I(HVS-I) 서열. (C) Y-chromosome 유전자형 그룹. (D) Y-chromosome 단연쇄 반복(STRs). Wen 등 [27]. Li 등 [36].

피시알(PCR) 증폭 (PCR amplification)

PCR amplification of the HVS-I and HVS-II of mtDNA control region was performed using two primer sets as described by Yao et al. [19]: HVS-I, L15996/H16498 (nucleotide positions, 15975–15996/16517–16498); HVS-II, L29/H408 (nucleotide positions, 8–29/429–408). Primers were designed for amplifying multiple fragments that contain haplogroup diagnostic polymorphisms in the coding regions [19,20,41]. Each set of segments was amplified in a 50 ul reaction containing 25 ng of genomic DNA, 10 pM of each primer, 0.2 mM of dNTPs, 2.0 mM MgCl2, 5 mM KCl, 10 mM TRIS-HCl (pH 8.3) and 1.5 U AmpliTaq DNA polymerase (Perkin-Elmer, CA, USA). The PCR amplification was carried out using a GeneAmp® PCR system 9700 thermal cycler (Applied Biosystems, CA, USA) under the conditions described in Table 1.

미토콘드리아 디엔에이(mtDNA) 조절 영역의 고변이 구역(HVS-I 및 HVS-II)의 피시알(PCR, 디엔에이 증폭 기술) 증폭은 Yao 등 [19]이 설명한 대로 두 개의 프라이머 세트를 사용하여 수행했다. HVS-I는 L15996/H16498 (뉴클레오티드 위치, 15975–15996/16517–16498), HVS-II는 L29/H408 (뉴클레오티드 위치, 8–29/429–408)을 사용했다. 코딩 영역에서 유전자형 그룹 진단 다형성(haplogroup diagnostic polymorphisms)을 포함하는 여러 조각을 증폭하기 위해 프라이머를 설계했다 [19,20,41]. 각 조각 세트는 25 ng의 게놈 디엔에이(DNA), 각 프라이머 10 pM, dNTPs 0.2 mM, MgCl2 2.0 mM, KCl 5 mM, TRIS-HCl 10 mM (pH 8.3), 그리고 AmpliTaq 디엔에이(DNA) 중합효소 1.5 U (Perkin-Elmer, CA, 미국(美國))를 포함하는 50 ul 반응에서 증폭했다. 피시알(PCR) 증폭은 GeneAmp® PCR system 9700 열 순환기(thermal cycler) (Applied Biosystems, CA, 미국(美國))를 사용하여 표 1에 설명된 조건 하에서 수행했다.

표 1. mtDNA 증폭, 염기서열 분석 및 제한 효소 길이 다형성(RFLP) 분석을 위한 프라이머.

피시알(PCR) 조건은 변성(denaturation)을 위해 94°C에서 5분간; 증폭(amplification)을 위해 94°C에서 45초, 표에 제시된 어닐링 온도(annealing temperature)에서 45초, 그리고 72°C에서 1분 동안 총 35회 반복했다. 마지막으로 72°C에서 5분간 배양했다.

mtDNA 염기서열 분석 및 RFLP 유전자형 분석 (mtDNA sequencing and genotyping of RFLP)

After PCR amplification, each PCR product was purified using the Wizard® PCR Preps DNA Purification System (Promega, WI, USA) and then sequenced by cycle sequencing using either a MegaBase 1000 sequencer (Amersham Bioscience, USA) or an ABI PRISMTM 310 Genetic Analyzer (Applied Biosystems, CA, USA) with DYEnamic ET Dye Terminator (Amersham Bioscience, USA) or BigDyeTM Terminator (PE Biosystems, USA), respectively. DNA sequences of the PCR amplicons were determined from both forward and reverse sequence data using the original primer pairs. The sequences from nucleotide position (np) 16024 to 16365 in HVS-I and from 73 to 340 in HVS-II were determined, since ambiguous electropherograms for 20–30 nucleotides near the primers were frequently observed.

피시알(PCR) 증폭 후, 각 피시알(PCR) 산물은 Wizard® PCR Preps DNA Purification System (Promega, WI, 미국(美國))을 사용하여 정제한 다음, 각각 MegaBase 1000 시퀀서 (Amersham Bioscience, 미국(美國)) 또는 ABI PRISMTM 310 Genetic Analyzer (Applied Biosystems, CA, 미국(美國))를 사용하여 사이클 시퀀싱(cycle sequencing)으로 염기서열을 분석했다. 피시알(PCR) 증폭 산물의 디엔에이(DNA) 서열은 원래의 프라이머 쌍을 사용하여 순방향 및 역방향 서열 데이터 모두로부터 결정했다. 고변이 구역(HVS-I)에서 뉴클레오티드 위치(np) 16024부터 16365까지, 고변이 구역(HVS-II)에서 73부터 340까지의 서열을 결정했는데, 이는 프라이머 근처의 20–30개 뉴클레오티드에 대한 모호한 전기영동 분석 결과(electropherograms)가 자주 관찰되었기 때문이다.

The intergenic COII/tRNALys 9-bp deletion was analyzed as described in Jin et al. [42]. In addition, several amplified segments, mainly in the mtDNA coding regions, were analyzed by RFLP typing and additional sequencing, as listed in Table 1.

유전자 사이 공간(intergenic) COII/tRNALys 9-bp 결실은 Jin 등 [42]에서 설명한 대로 분석했다. 또한, 주로 mtDNA 코딩 영역에 있는 여러 증폭된 조각들은 제한 효소 길이 다형성(RFLP) 유전자형 분석 및 추가 염기서열 분석을 통해 분석했으며, 이는 표 1에 나열했다.

염기서열 정렬 및 유전자형 그룹 분석 (Sequence alignment and haplogroup analyses)

Sequences were aligned and compared with the revised Cambridge Reference Sequence (rCRS) [43] using the Sequencher program ver. 2000 (Gene Codes corporation, MI, USA). The results were converted into a Microsoft Excel table (Microsoft Corporation, CA, USA). The mtDNAs were classified into the (sub-)haplogroups based on HVS-I/II motifs of haplogroup specific-sequences as well as coding regions as described in recent surveys [19,20,25,44,45]. The HVS-I motif searching and haplogroup-directed comparison with closely related sequences from other databases led us to tentatively assign each mtDNA to a haplogroup. To further characterize the mtDNA lineage tested, we compared their HVS-II motif to verify the predicted haplogroup status of each mtDNA. In general, more than 95% of mtDNA lineages can faithfully be classified to specific haplogroups using HVS-I/II motifs without extra information from coding region sequences [44]. However, in the remaining cases, their (sub-haplogroups were characterized using sequence information from some coding region sites (Table 1). After each mtDNA was assigned to the most-derived named haplogroup, the haplogroup distribution frequencies in each of seven populations were estimated. For quality assurance purposes, we performed quasi-median network analysis [46,47]. The HVS-I (np 16024–16365 np) and HVS-II (np 74–340) sequence of 445 individuals of this study have been submitted to GenBank (Accession Numbers, FJ493775–FJ494664).

서열은 Sequencher 프로그램 ver. 2000 (Gene Codes corporation, MI, 미국(美國))을 사용하여 개정된 케임브리지(Cambridge) 참조 서열(rCRS) [43]과 정렬하고 비교했다. 결과는 Microsoft Excel 표 (Microsoft Corporation, CA, 미국(美國))로 변환했다. mtDNA는 최근 조사 [19,20,25,44,45]에서 설명된 대로 코딩 영역뿐만 아니라 유전자형 그룹 특이적 서열의 고변이 구역(HVS-I/II) 모티프를 기반으로 (하위)유전자형 그룹으로 분류했다. 고변이 구역(HVS-I) 모티프 검색과 다른 데이터베이스의 밀접하게 관련된 서열과의 유전자형 그룹 지향 비교를 통해 각 mtDNA를 잠정적으로 유전자형 그룹에 할당했다. 테스트된 mtDNA 혈통을 추가로 특성화하기 위해, 각 mtDNA의 예측된 유전자형 그룹 상태를 확인하기 위해 그들의 고변이 구역(HVS-II) 모티프를 비교했다. 일반적으로, mtDNA 혈통의 95% 이상은 코딩 영역 서열의 추가 정보 없이도 고변이 구역(HVS-I/II) 모티프를 사용하여 특정 유전자형 그룹으로 충실하게 분류할 수 있다 [44]. 그러나 나머지 경우에서는 일부 코딩 영역 위치의 서열 정보를 사용하여 (하위)유전자형 그룹을 특성화했다 (표 1 참조). 각 mtDNA가 가장 파생된 명명된 유전자형 그룹에 할당된 후, 7개 집단 각각의 유전자형 그룹 분포 빈도를 추정했다. 품질 보증 목적으로, 준-중앙값 네트워크 분석(quasi-median network analysis)을 수행했다 [46,47]. 이 연구의 445명 개인의 고변이 구역(HVS-I, np 16024–16365 np) 및 고변이 구역(HVS-II, np 74–340) 서열은 GenBank에 제출되었다(접근 번호, FJ493775–FJ494664).

데이터 분석 (Data analyses)

The genetic differentiation between different population samples and its statistical significance were assessed via FST (mtDNA HG and HVS-I/II and Y-SNPs) and RST (Y-STRS) values. The population genetic structure of the ethnic and/or regional groups was analyzed through the analysis of molecular variance (AMOVA) approach [48]. The calculations of diversity indices, FST, RST and AMOVA were performed using the Arlequin 2.000 package [49]. Population pairwise FST and RST values were visualized by multidimensional scaling (MDS) plot analyses using SPSS 12.0 software.

상이한 집단 샘플 간의 유전적 분화(차이) 및 그 통계적 유의성은 FST 값(mtDNA 유전자형 그룹 및 고변이 구역 I/II 및 와이 염색체 단일 염기 다형성)과 RST 값(와이 염색체 단연쇄 반복)을 통해 평가했다. 민족 및/또는 지역 집단의 집단 유전적 구조는 분자 분산 분석(AMOVA, 집단 간 유전적 차이 분석) 접근법을 통해 분석했다 [48]. 다양성 지수, FST, RST, 그리고 AMOVA의 계산은 알르퀸(Arlequin) 2.000 패키지 [49]를 사용하여 수행했다. 집단 쌍별 FST 및 RST 값은 SPSS 12.0 소프트웨어를 사용한 다차원 척도법(MDS) 플롯(유전적 거리 시각화) 분석에 의해 시각화했다.

Haplogroup-specific median-joining networks [50] for Y chromosome data were constructed using the NETWORK 4.2 program (www.fluxus-technology.com). Such networks were initially highly reticulated, and we reduced reticulations by first weighting the loci according to the inverse of their variance in the dataset used [51] and subsequently constructing a reduced-median network [52] to form the input of the median-joining network [53].

와이 염색체 데이터에 대한 유전자형 그룹 특이적 중앙값 결합 네트워크(median-joining networks) [50]는 NETWORK 4.2 프로그램(www.fluxus-technology.com)을 사용하여 구축했다. 이러한 네트워크는 처음에는 고도로 망상형(reticulated)이었으며, 연구자들은 먼저 사용된 데이터 세트에서 분산의 역수에 따라 유전자좌에 가중치를 부여하는 방식 [51]을 적용한 다음, 축소 중앙값 네트워크(reduced-median network) [52]를 구성하여 중앙값 결합 네트워크 [53]의 입력이 되도록 망상 구조를 줄였다.

The admixture proportions of northeast Asian and the southeast Asian parental populations in the Korean population were estimated for mtDNA and the Y chromosome using the Admix 2.0 software [54].

한국 집단에서 동북아시아 및 동남아시아 부모 집단(조상 집단)의 혼합 비율(admixture proportions, 조상 유전자 비율)은 Admix 2.0 소프트웨어 [54]를 사용하여 mtDNA와 와이 염색체에 대해 추정했다.

 

결과 및 논의 (Results and Discussion)

Almost all of the mtDNA lineages analyzed here could be assigned to the East Asian-specific (sub)haplogroups described recently [19,20,25,44,45], with the exception of two individuals belonging to the European mtDNA haplogroups T (Manchurian) and U5a (Mongolian) (Table 2). The gene diversity (H), nucleotide diversity (πn), and mean number of pairwise differences of the population samples are listed in Table 3. All seven populations displayed high levels of genetic diversity (H>0.99), suggesting a relatively large population size and heterogeneity of each mtDNA pool. The haplogroup frequencies observed in each population are summarized in Table 2. Based on these haplogroup assignments, the Koreans share lineages with both the southern and the northern haplogroup complexes of East Asia. We first attempted to quantitate these contributions by a detailed consideration of the distribution of each lineage.

분석된 거의 모든 미토콘드리아 디엔에이(mtDNA) 혈통은 최근에 설명된 동아시아 특이적 (하위)유전자형 그룹에 할당될 수 있었으며 [19,20,25,44,45], 유럽 mtDNA 유전자형 그룹 T (만주인(滿洲人))와 U5a (몽골인(蒙古人))에 속하는 두 개인은 예외였다 (표 2 참조). 집단 표본의 유전자 다양성 (H), 뉴클레오티드 다양성 (πn), 그리고 쌍별 차이의 평균 수는 표 3에 나열했다. 7개 집단 모두 높은 수준의 유전적 다양성 (H>0.99)을 보였으며, 이는 비교적 큰 집단 크기와 각 mtDNA 유전자 풀의 이질성을 시사한다. 각 집단에서 관찰된 유전자형 그룹 빈도는 표 2에 요약했다. 이러한 유전자형 그룹 할당을 기반으로, 한국인은 동아시아의 남부 및 북부 유전자형 그룹 복합체 모두와 혈통을 공유한다. 연구자들은 먼저 각 혈통의 분포를 상세히 고려하여 이러한 기여도를 정량화하려고 시도했다.

표 2. 동아시아 7개 집단의 mtDNA 유전자형 그룹 빈도 분포.

표 3. 동아시아 7개 집단의 mtDNA 다양성 지수.

고변이 구역 I(HVS-I): np 16024–16365; 고변이 구역 II(HVS-II): np 73–340.

The highest (23.8%) frequency in the Korean mtDNA pool was observed for haplogroup D4, which is widespread in northern East Asia and especially in the Korean-Chinese (21.6%), and Manchurians (20.0%). In total, haplogroup D lineages including the subhaplogroups (D4, D4a, D4b, D5, and D5a) accounted for 32.4% of the Korean mtDNA pool. In addition, the Koreans present moderate frequencies of (sub) haplogroup A (8.1%) and (sub)haplogroup G (10.3%) lineages, mostly prevalent in northeast Asia and southeast Siberia [20,55-57]. Other Siberian and Mongolian-prevalent haplogroups from the C, Y and Z lineages make up less than 4% of the Korean mtDNA pool. Haplogroups A5a and Y2 are found almost exclusively in Korea but were present at extremely low frequencies. In total, these northern haplogroups account for ~60% of the mtDNA gene pool of the Koreans. In addition, southeast Asian-prevalent mtDNA lineages of (sub)haplogroups B (14.6%), M7 (10.3%), and F (9.7) are also found at moderate frequencies in the Korean population (Table 2). These findings suggest that more than 30% of the Korean mtDNA pool is attributable to maternal lineages with a more southern origin. We also found the haplogroup M7a1 exclusively in the Korean population. This result is consistent with previous reports that haplogroup M7a is restricted to Japan and south Korea [18,20]. Thus, the distribution pattern of mtDNA haplogroups leads us to consider that the peopling of Korea is likely to have involved multiple sources.

한국인 mtDNA 풀에서 가장 높은 빈도(23.8%)는 유전자형 그룹 D4에서 관찰되었는데, 이는 북부 동아시아, 특히 한국계 중국인(中國人)(21.6%)과 만주인(滿洲人)(20.0%)에게 널리 퍼져 있다. 전체적으로, 하위 유전자형 그룹(D4, D4a, D4b, D5, D5a)을 포함한 유전자형 그룹 D 혈통은 한국인 mtDNA 풀의 32.4%를 차지했다. 또한, 한국인은 주로 동북아시아와 동남 시베리아(西伯利亞)에서 널리 퍼져 있는 (하위)유전자형 그룹 A (8.1%)와 (하위)유전자형 그룹 G (10.3%) 혈통의 중간 빈도를 나타냈다 [20,55-57]. 다른 시베리아(西伯利亞) 및 몽골(蒙古) 우세 유전자형 그룹인 C, Y, Z 혈통은 한국인 mtDNA 풀의 4% 미만을 구성한다. 유전자형 그룹 A5a와 Y2는 거의 전적으로 한국에서만 발견되지만, 극히 낮은 빈도로 존재했다. 전체적으로, 이러한 북부 유전자형 그룹은 한국인 mtDNA 유전자 풀의 약 60%를 차지한다. 또한, 동남아시아에서 우세한 (하위)유전자형 그룹 B (14.6%), M7 (10.3%), F (9.7)의 mtDNA 혈통도 한국 집단에서 중간 빈도로 발견된다 (표 2 참조). 이러한 발견은 한국인 mtDNA 풀의 30% 이상이 더 남부 기원의 모계 혈통(maternal lineages)에 기인함을 시사한다. 연구자들은 또한 유전자형 그룹 M7a1이 한국 집단에서만 독점적으로 발견된다는 것을 확인했다. 이 결과는 유전자형 그룹 M7a가 일본(日本)과 남한에 국한된다는 이전 보고서들과 일치한다 [18,20]. 따라서 mtDNA 유전자형 그룹의 분포 패턴은 한국의 집단 형성이 여러 기원을 포함했을 가능성이 높다고 간주하게 한다.

We then investigated the mtDNA and Y-chromosomal relationships between the East Asian populations, using both the new and published data. In these analyses mtDNA haplogroups, mtDNA HVS-I sequences, Y-SNPs and Y-STRs were compared (Supplementary Tables S1, S2, S3). Pairwise FST (mtDNA haplogroup, mtDNA HVS-I sequences and Y-SNPs) and RST (Y-STRS) values between East Asian populations were calculated (Supplementary Table S1). The FST distances of mtDNA markers (mtDNA haplogroups and HVR-I sequences) of Korean populations showed close relationships with Manchurians, Japanese, Mongolians and northern Han Chinese but not with southern Asians (Supplementary Tables S4 and S5; Figure 2A, B). In the MDS plots, the Korean samples lay entirely within the cluster of northern populations.

그런 다음, 연구자들은 새로운 데이터와 발표된 데이터를 모두 사용하여 동아시아 집단 간의 mtDNA 및 와이 염색체 관계를 조사했다. 이러한 분석에서 mtDNA 유전자형 그룹, mtDNA 고변이 구역 I 서열, 와이 염색체 단일 염기 다형성(Y-SNPs) 및 와이 염색체 단연쇄 반복(Y-STRs)을 비교했다 (보충 표 S1, S2, S3 참조). 동아시아 집단 간의 쌍별 FST (mtDNA 유전자형 그룹, mtDNA HVS-I 서열 및 Y-SNPs) 및 RST (Y-STRS) 값을 계산했다 (보충 표 S1 참조). 한국인 집단의 mtDNA 표지자(FST 거리, mtDNA 유전자형 그룹 및 고변이 구역 I 서열)는 만주인(滿洲人), 일본인(日本人), 몽골인(蒙古人) 및 북부 한(漢) 중국인(中國人)과 밀접한 관계를 보였지만, 남부 아시아인과는 그렇지 않았다 (보충 표 S4 및 S5; 그림 2A, B 참조). 다차원 척도법(MDS) 플롯(유전적 거리 시각화)에서, 한국인 샘플은 전적으로 북부 집단 클러스터 내에 위치했다.

그림 2. (A) mtDNA 유전자형 그룹의 FST 거리 (stress =0.21), (B) mtDNA 고변이 구역 I(HVS-I) 서열의 FST 거리 (stress =0.19), (C) Y-chromosome 유전자형 그룹의 FST 거리 (stress =0.21), (D) Y-chromosome 단연쇄 반복(STRs)의 FST 거리 (stress =0.19)를 기반으로 한 다차원 척도법(MDS) 플롯. (닫힌 마름모: 북아시아인; 열린 마름모: 남아시아인). Wen 등 [27]. Li 등 [36].

In contrast, the results of Y chromosome analyses (based on Y-SNPs and Y-STRS) of Korean populations revealed closer relationships with both northeast and southeast Asian populations (Supplementary Tables S6 and S7; Figure 2C, D). Like the mtDNA distances, Y-chromosomal distances from Manchurian, Japanese and northern Han Chinese populations were usually not significantly greater than zero, but some distances from southern Han populations (e.g. Yunnan Han, Y haplogroups; Meixian Han, Y-STRs) or other southern populations (e.g. Vietnamese, Y haplogroups) were also not significantly above zero (Supplementary Tables S6 and S7), as noted previously [13]. In the MDS plots, the Korean samples lay at the border between the northern and southern clusters, rather than within the northern cluster (Figure 2C, D). In order to investigate Y-chromosomal relationships in more detail, we visualized STR haplotypes within a common predominantly northern haplogroup (C*) and southern haplogroup (O3) using networks [50] constructed with the seven Y-STRs common to all datasets (Figure 3). These networks did not show striking geographical structure, so we calculated, for each Korean haplotype, the distance to the closest northern and southern haplotype. In both haplogroups, the mean distance to the southern haplotypes was lower than to the northern haplotypes (C* Korean-north 5.0 steps, Korean-south 4.5 steps; O3 Korean-north 3.5 steps, Korean-south 2.2 steps). This finding is particularly striking for haplogroup C* because it is far more prevalent in the north (Figure 3A).

이와 대조적으로, 한국인 집단의 와이 염색체 분석 결과(Y-SNPs 및 Y-STRS 기반)는 동북아시아와 동남아시아 집단 모두와 더 가까운 관계를 나타냈다 (보충 표 S6 및 S7; 그림 2C, D 참조). mtDNA 거리와 마찬가지로, 만주인(滿洲人), 일본인(日本人), 북부 한(漢) 중국인(中國人) 집단으로부터의 와이 염색체 거리는 보통 0보다 유의하게 크지 않았지만, 이전 [13]에 언급된 바와 같이 남부 한(漢)족 집단(예: 운남(雲南) 한(漢)족, Y 유전자형 그룹; 메이시엔(Meixian) 한(漢)족, Y-STRs) 또는 기타 남부 집단(예: 베트남인(越南人), Y 유전자형 그룹)으로부터의 일부 거리도 0보다 유의하게 크지 않았다 (보충 표 S6 및 S7 참조). MDS 플롯에서, 한국인 샘플은 북부 클러스터 내에 있기보다는 북부 및 남부 클러스터 사이의 경계에 위치했다 (그림 2C, D 참조). 와이 염색체 관계를 더 자세히 조사하기 위해, 연구자들은 모든 데이터 세트에 공통적인 7개의 Y-STRs로 구축된 네트워크 [50]를 사용하여 공통적으로 주로 북부에 분포하는 유전자형 그룹 (C*)과 남부에 분포하는 유전자형 그룹 (O3) 내의 단연쇄 반복(STR) 유전자형을 시각화했다 (그림 3 참조). 이 네트워크들은 눈에 띄는 지리적 구조를 보여주지 않았기 때문에, 연구자들은 각 한국인 유전자형에 대해 가장 가까운 북부 및 남부 유전자형까지의 거리를 계산했다. 두 유전자형 그룹 모두에서 남부 유전자형까지의 평균 거리가 북부 유전자형까지의 평균 거리보다 낮았다 (C* 한국인-북부 5.0 단계, 한국인-남부 4.5 단계; O3 한국인-북부 3.5 단계, 한국인-남부 2.2 단계). 이 발견은 유전자형 그룹 C*가 북부에서 훨씬 더 우세하기 때문에 특히 눈에 띈다 (그림 3A 참조).

그림 3. 동아시아인의 중앙값 결합 네트워크(Median-joining network). (A) 유전자형 그룹 C* 내의 7개 Y-STRS 변이 네트워크. (B) 유전자형 그룹 O3 내의 7개 Y-STRs 네트워크. 원 면적은 유전자형 빈도에 비례한다. 선은 유전자형 간의 돌연변이 차이를 나타낸다. 네트워크는 다음 색상에 해당한다: 보라색 – 극북 아시아 집단 (다우르(Daur), 에벤키(Ewenki), 한(漢)족(신강(新疆)), 내몽골인, 오로첸(Oroqen), 외몽골인, 위구르(維吾爾)(이리(伊犁)), 위구르(維吾爾)(우루무치(烏魯木齊)) 및 시버(錫伯)); 파란색 – 한국인; 흰색 – 극남 아시아 집단 (부이족(布依族), 한(漢)족(광동(廣東)), 한(漢)족(사천(四川)), 한(漢)족(운남(雲南)), 하니족(哈尼族), 인도네시아인(印度尼西亞人), 리족(黎族), 필리핀인(菲律賓人), 서족(畲族), 태국인, 베트남인(越南人), 야오족(瑤族)(바마(巴馬)) 및 야오족(瑤族)(련남(連南))).

The genetic differences between the Koreans and other East Asians were examined by AMOVA (Table 4). When samples were grouped into northeast Asians and southeast Asians (excluding Koreans), a highly significant difference was found between the two groups with all markers. Thus there is significant genetic differentiation within the region, and we could then compare each group separately with the Koreans. With mtDNA, Koreans were not significantly different from either group when HVRI sequences were compared, although they were distinct from the southeast Asians in the haplogroup comparisons. With the Y chromosomes, they were again not distinct from either group when haplogroup comparisons were made, but were distinct from the southeast Asians in the STR-based comparison (Table 4).

한국인과 다른 동아시아인 사이의 유전적 차이는 분자 분산 분석(AMOVA)에 의해 조사했다 (표 4 참조). 샘플을 동북아시아인과 동남아시아인(한국인 제외)으로 그룹화했을 때, 모든 표지자에서 두 그룹 사이에 매우 유의미한 차이가 발견되었다. 따라서 이 지역 내에는 상당한 유전적 분화가 있으며, 연구자들은 각 그룹을 한국인과 개별적으로 비교했다. mtDNA의 경우, 고변이 구역 I(HVRI) 서열을 비교했을 때는 한국인이 두 그룹 중 어느 그룹과도 유의미하게 다르지 않았지만, 유전자형 그룹 비교에서는 동남아시아인과는 구별되었다. 와이 염색체의 경우, 유전자형 그룹 비교를 했을 때는 다시 두 그룹 중 어느 그룹과도 구별되지 않았지만, STR 기반 비교에서는 동남아시아인과는 구별되었다 (표 4 참조).

표 4. 분자 분산 분석(AMOVA) 결과. P 값은 10,000회 치환(permutations)을 통해 얻었다.

P 값은 10,000회 치환(permutations)을 통해 얻었다.

Our study documents the genetic relationships of the Koreans with their neighboring populations in unprecedented detail. Two major findings emerge. First, the Koreans are overall more similar to northeast Asians than to southeast Asians. This conclusion would be expected from the general correlation between genetic variation and geography observed for human populations, and is supported here by an examination of individual mtDNA haplogroups (Table 2), genetic distances between populations derived from mtDNA or Y-chromosomal data (Figure 2), and the apportionment of genetic diversity between different groups of populations (Table 4). Second, the conclusions from mtDNA and Y-chromosomal analyses differ. Sex-biased admixture is common in human expansions such as that of Bantu-speaking farmers in Africa [58], the spread of the Han ethnic group in China [59] or the post-Columbian peopling of the Americas [60]. The effects in Korea are more subtle, but show a larger male than female contribution from southern East Asia to the population of Korea, most clearly revealed by the admixture estimates, where a 35% contribution from the south was estimated for mtDNA, compared with a 83% contribution for the Y chromosome (Table 5).

이 연구는 한국인과 주변 집단과의 유전적 관계를 전례 없이 상세하게 기록했다. 두 가지 주요 결과가 도출되었다. 첫째, 한국인은 전반적으로 동남아시아인보다 동북아시아인과 더 유사하다. 이 결론은 인간 집단에서 관찰되는 유전적 변이와 지리 사이의 일반적인 상관관계로부터 예상될 수 있으며, 개별 mtDNA 유전자형 그룹(표 2), mtDNA 또는 와이 염색체 데이터에서 파생된 집단 간의 유전적 거리(그림 2), 그리고 상이한 집단 그룹 간의 유전적 다양성 분할(표 4)의 검토를 통해 여기서 지지된다. 둘째, mtDNA 분석과 와이 염색체 분석의 결론이 다르다. 성별 편향 혼합(Sex-biased admixture)은 아프리카(阿弗利加)의 반투어(Bantu)-사용 농부들의 확산 [58], 중국(中國)의 한(漢)족 확산 [59] 또는 콜럼버스(Columbus) 이후 아메리카(America)의 집단 형성 [60]과 같은 인간 확산에서 흔히 볼 수 있다. 한국에서의 영향은 더 미묘하지만, 한국 집단에 대한 남부 동아시아로부터의 기여가 여성보다 남성에게 더 크다는 것을 보여주며, 이는 혼합 추정치(Admixture estimates)에서 가장 명확히 드러났다. mtDNA의 경우 남부로부터 35%의 기여가 추정된 반면, 와이 염색체의 경우 83%의 기여가 추정되었다 (표 5 참조).

표 5. 한국인 집단의 동북아시아인 및 동남아시아인 혼합 추정치(Admixture estimates). SD, 표준 편차.

SD, 표준 편차(Standard Deviation).

The predominant genetic relationship with northern East Asians is consistent with other lines of evidence. Xue et al. [31] reported that the northern East Asian populations started to expand in number before the last glacial maximum at 21-18 KYA, while the southern populations all started to expand after it, but then grew faster, and they suggested that the northern populations expanded earlier because they could exploit the abundant megafauna of the “Mammoth Steppe,” while the southern populations could increase in number only when a warmer and more stable climate led to more plentiful plant resources such as tubers. By this criterion, the Koreans, expanding at about 30 KYA [31] also resemble other northern populations. Historical evidence suggests that the Ancient Chosun, the first state-level society, was established in the region of southern Manchuria and later moved into the Pyongyang area of the northwestern Korean Peninsula. Based on archeological and anthropological data, the early Korean population possibly had an origin in the northern regions of the Altai-Sayan and Baikal regions of Southeast Siberia [7,8,61].

북부 동아시아인과의 우세한 유전적 관계는 다른 증거들과 일치한다. Xue 등 [31]은 북부 동아시아 집단이 약 21–18 KYA의 마지막 최대 빙하기 이전에 수적으로 팽창하기 시작했고, 남부 집단은 그 이후에 팽창했지만 더 빠르게 성장했다고 보고했다. 그들은 북부 집단이 “매머드 스텝(Mammoth Steppe)”의 풍부한 거대 동물군을 이용할 수 있었기 때문에 더 일찍 팽창했고, 남부 집단은 더 따뜻하고 안정적인 기후가 구근(tubers)과 같은 더 풍부한 식물 자원으로 이어졌을 때만 수적으로 증가할 수 있었다고 제안했다. 이 기준으로 볼 때, 약 30 KYA [31]에 팽창한 한국인도 다른 북부 집단과 유사하다. 역사적 증거는 고조선(古朝鮮)이 남부 만주(滿洲) 지역에 세워졌고 나중에 한국 북서부의 평양(平壤) 지역으로 이동했음을 시사한다. 고고학적 및 인류학적 데이터에 따르면, 초기 한국 인구는 동남 시베리아(西伯利亞)의 알타이-사얀(Altai-Sayan) 및 바이칼(Baikal) 지역의 북부 지역에 기원을 두었을 가능성이 있다 [7,8,61].

What could be the origin of the male-biased southern contribution to Korean gene pool illustrated, for example, by haplogroups O-M122 (42.2%) and O-SRY465 (20.1%) [29]. Recent molecular genetic analyses and the geographical distribution of haplogroup O-M122 lineages, found widely throughout East Asia at high frequencies (especially in southern populations and China), have suggested a link between these Y-chromosome expansions and the spread of rice agriculture in East Asia [62-64]. In general, Y-chromosomes might be spread via a process of demic diffusion during the early agricultural expansion period [65,66]. If this interpretation were substantiated, the spatial pattern of Y-haplogroup O would imply a genetic contribution to Korea through the spread of male-mediated agriculture. Large-scale genetic analyses thus begin to reveal some of the complexities of the peopling of Korea, and further studies of individual autosomal loci or genomewide genotyping and sequencing are expected to provide further insights.

유전자형 그룹 O-M122 (42.2%) 및 O-SRY465 (20.1%) [29] 등으로 예시된, 한국인 유전자 풀에 대한 남성 편향적인 남부 기여의 기원은 무엇일까 ? 최근의 분자 유전학적 분석과 동아시아 전역에서 높은 빈도로(특히 남부 집단과 중국(中國)에서) 발견되는 유전자형 그룹 O-M122 혈통의 지리적 분포는 이러한 와이 염색체 확산과 동아시아의 벼농사 확산 사이의 연관성을 시사했다 [62-64]. 일반적으로, 와이 염색체는 초기 농업 확산 기간 동안 인구 확산(demic diffusion) 과정을 통해 퍼졌을 수 있다 [65,66]. 만약 이 해석이 입증된다면, 와이 유전자형 그룹 O의 공간적 패턴은 남성 매개 농업의 확산을 통한 한국으로의 유전적 기여를 의미할 것이다. 따라서 대규모 유전 분석은 한국 집단 형성의 일부 복잡성을 밝혀내기 시작했으며, 개별 상염색체 유전자좌 또는 게놈 전체 유전자형 분석 및 염기서열 분석에 대한 추가 연구가 더 깊은 통찰력을 제공할 것으로 기대된다.

 

 

보충 정보 (Supporting Information)

Table S1 Asian populations studied.
표 S1 연구된 아시아 집단.
Found at: doi:10.1371/journal.pone.0004210.s001 (0.05 MB XLS)

Table S2 mtDNA-haplogroup distributions in East Asian populations.
표 S2 동아시아 집단의 미토콘드리아 디엔에이(mtDNA) 유전자형 그룹 분포.
Found at: doi:10.1371/journal.pone.0004210.s002 (0.05 MB XLS)

Table S3 Y-haplogroup distribution in East Asian populations.
표 S3 동아시아 집단의 와이 염색체 유전자형 그룹 분포.
Found at: doi:10.1371/journal.pone.0004210.s003 (0.03 MB XLS)

Table S4 FST distances of mtDNA haplogroups in east Asian populations (non-significant values are underlined). aPresent work; bKivisild et al. [20]; cYao et al. [19]; dLee et al. [30]; eWen et al. [27]; fKong et al. [25]; gLi et al. [36].
표 S4 동아시아 집단의 미토콘드리아 디엔에이(mtDNA) 유전자형 그룹의FST 거리 (비유의미한 값은 밑줄로 표시했다). a본 연구; bKivisild 등 [20]; cYao 등 [19]; dLee 등 [30]; eWen 등 [27]; fKong 등 [25]; gLi 등 [36].
Found at: doi:10.1371/journal.pone.0004210.s004 (0.22 MB XLS

Table S5 FST values of mtDNA HVR-I Sequences in east Asian populations (non-significant values are underlined). aPresent work; bMaruyama et al. [26]; cKivisild et al. [20]; dKong et al. [25]; eYao et al. [19]; fZhang et al. [28]; gLi et al. [36]; hPowell et al. [37].
표 S5 동아시아 집단의 미토콘드리아 디엔에이(mtDNA) 고변이 구역 I(HVR-I) 서열의 FST 값 (비유의미한 값은 밑줄로 표시했다). a본 연구; bMaruyama 등 [26]; cKivisild 등 [20]; dKong 등 [25]; eYao 등 [19]; fZhang 등 [28]; gLi 등 [36]; hPowell 등 [37].
Found at: doi:10.1371/journal.pone.0004210.s005 (0.07 MB XLS

Table S6 FST distances of Y chromosome haplogroups in east Asian popoulations (non-significant values are underlined). aHong et al. [29]; bXue et al. [31].
표 S6 동아시아 집단의 와이 염색체 유전자형 그룹 FST 거리 (비유의미한 값은 밑줄로 표시했다). aHong 등 [29]; bXue 등 [31].
Found at: doi:10.1371/journal.pone.0004210.s006 (0.05 MB XLS)

Table S7 RST distances in east Asian populations using ten Y chromsome STRs (non-significant values are underlined). aHara et al. [34]; bHuang et al. [40]; cHwang et al. [35]; dYan et al. [38]; eZhang et al. [33]; fZhang et al. [39]; gYong et al. [32]; hXue et al. [31].
표 S7 10개의 와이 염색체 단연쇄 반복(Y chromsome STRs)을 사용한 동아시아 집단의 RST 거리 (비유의미한 값은 밑줄로 표시했다). aHara 등 [34]; bHuang 등 [40]; cHwang 등 [35]; dYan 등 [38]; eZhang 등 [33]; fZhang 등 [39]; gYong 등 [32]; hXue 등 [31].

 

감사의 말 (Acknowledgments)

We would like to thank H.J. Bandelt for crucial comments and advice on the mtDNA study. We are grateful to all volunteers for providing DNA samples. We also thank K.D. Kwak and S.B. Hong for technical assistance.

연구자들은 미토콘드리아 디엔에이(mtDNA) 연구에 대한 중요한 의견과 조언을 해준 H.J. Bandelt에게 감사한다. 디엔에이(DNA) 샘플을 제공해준 모든 자원자들에게 감사한다. 또한, 기술 지원에 대해 K.D. Kwak과 S.B. Hong에게도 감사한다.

저자 기여 (Author Contributions)

Conceived and designed the experiments: HIJ CTS WK. Performed the experiments: HJJ. Analyzed the data: HJJ CTS WK. Contributed reagents/materials/analysis tools: WK. Wrote the paper: HJJ CTS WK.

실험을 구상하고 설계한 사람: HJJ, CTS, WK. 실험을 수행한 사람: HJJ. 데이터를 분석한 사람: HJJ, CTS, WK. 시약/재료/분석 도구를 기여한 사람: WK. 논문을 작성한 사람: HJJ, CTS, WK.

 

참고문헌 (References)

  1. Cavalli-Sforza, L.L., Menozzi, P., & Piazza, A. (1994) The History and Geography of Human Genes. Princeton: Princeton University Press.
  2. Turner, C.G. (1990) Major features of sundadonty and sinodonty, including suggestions about East Asian microevolution, population history and late Pleistocene relationships with Australian aboriginals. Am J Phys Anthropol 82: 295–317.
  3. Chu, J.Y., Huang, W., Kuang, S.Q., Wang, J.M., Xu, J.J., et al. (1998) Genetic relationship of populations in China. Proc Natl Acad Sci USA 95: 11763–11768.
  4. Su, B., Xiao, J., Underhill, P., Deka, R., Zhang, W., et al. (1999) Y-chromosome evidence for a northward migration of modern humans into eastern Asia during the last Ice Age. Am J Hum Genet 65: 1718–1724.
  5. Nei, M., & Roychoudhury, A.K. (1993) Evolutionary relationships of human populations on a global scale. Mol Biol Evol 10: 927–943.
  6. Karafet, T., Xu, L., Du, R., Wang, W., Feng, S., et al. (2001) Paternal population history of east Asia: sources, patterns, and microevolutionary processes. Am J Hum Genet 69: 615–628.
  7. Kim, K. (1970) People and language. In: Korea Its People and Cultures. Seoul: Hakwon-sa Ltd.
  8. Choi, M.L., & Rhee, S.N. (2001) Korean archaeology for the 21st century: from prehistory to State formation. Seoul J Kor Studies 14: 117–147.
  9. Goedde, H.W., Paik, Y.K., Lee, C.C., Benkmann, H.G., Kriese, L., et al. (1987) Red cell and serum protein polymorphisms in three population groups of south Korea. Gene Geogr 1: 177–188.
  10. Saha, N., & Tay, J.S.H. (1992) Origin of the Koreans: a population genetic study. Am J Phys Anthropol 88: 27–36.
  11. Hong, S.S., Suh, J.A., Chae, J.J., Goh, S.H., Kim, Y.S., et al. (1993) Frequency distribution of alleles at D15S80 and apo-B 3 VNTR loci in Korean population. Mol Cells 3: 457–463.
  12. Kim, W., Shin, D.J., Harihara, S., & Kim, Y.J. (2000) Y chromosomal DNA variation in East Asian populations and its potential for inferring the peopling of Korea. J Hum Genet 45: 76–83.
  13. Jin, H.J., Kwak, K.D., Hammer, M.F., Nakahori, Y., Shinka, T., et al. (2003) Y-chromosomal DNA haplogroups and their implications for the dual origins of the Koreans. Hum Genet 114: 27–35.
  14. Giles, R.E., Blanc, H., Cann, H.M., & Wallace, D.C. (1980) Maternal inheritance of human mitochondrial DNA. Proc Natl Acad Sci USA 77: 6715–6719.
  15. Wallace, D.C., Brown, M.D., & Lott, M.T. (1999) Mitochondrial DNA variation in human evolution and disease. Gene 238: 211–230.
  16. Cavalli-Sforza, L.L., & Feldman, M.W. (2003) The application of molecular genetic approaches to the study of human evolution. Nat Genet 33: 266–275.
  17. Jobling, M.A., & Tyler-Smith, C. (2003) The human Y chromosome: an evolutionary marker comes of age. Nat Rev Genet 4: 598–612.
  18. Underhill, P.A., & Kivisild, T. (2007) Use of Y chromosome and mitochondrial DNA population structure in tracing human migrations. Annu Rev Genet 41: 539–564.
  19. Yao, Y.G., Kong, Q.P., Bandelt, H.J., Kivisild, T., & Zhang, Y.P. (2002) Phylogeographic differentiation of mitochondrial DNA in Han Chinese. Am J Hum Genet 70: 635–651.
  20. Kivisild, T., Tolk, H.V., Parik, J., Wang, Y., Papiha, S.S., et al. (2002) The emerging limbs and twigs of the East Asian mtDNA tree. Mol Biol Evol 19: 1737–1751.
  21. Tanaka, M., Cabrera, V.M., González, A.M., Larruga, J.M., Takeyasu, T., et al. (2004) Mitochondrial genome variation in eastern Asia and the peopling of Japan. Genome Res 14: 1832–1850.
  22. Kwak, K.D., Jin, H.J., Shin, D.J., Kim, J.M., Roewer, L., et al. (2005) Y-chromosomal STR haplotypes and their applications to forensic and population studies in east Asia. Int J Legal Med 119: 195–201.
  23. Sambrook, J., Fritsch, E.F., & Maniatis, T. (1989) Molecular Cloning: a Laboratory Manual, 2nd edn. New York: Cold Spring Harbor Laboratory Press.
  24. Richards, B., Skoletsky, J., Shuber, A.P., Balfour, R., Stern, R.C., et al. (1993) Multiplex PCR amplification from the CFTR gene using DNA prepared from buccal brushes/swabs. Hum Mol Genet 2: 159–163.
  25. Kong, Q.P., Yao, Y.G., Lâu, M., Shen, S.P., Chen, C., et al. (2003) Mitochondrial DNA sequence polymorphisms of five ethnic populations from northern China. Hum Genet 113: 391–405.
  26. Maruyama, S., Minaguchi, K., & Saitou, N. (2003) Sequence polymorphisms of the mitochondrial DNA control region and phylogenetic analysis of mtDNA lineages in the Japanese population. Int J Legal Med 117: 218–225.
  27. Wen, B., Li, H., Gao, S., Mao, X., Gao, Y., Li, F., et al. (2005) Genetic structure of Hmong-Mien speaking populations in East Asia as revealed by mtDNA lineages. Mol Biol Evol 22: 725–734.
  28. Zhang, Y.J., Xu, Q.S., Zheng, Z.J., Lin, H.Y., & Lee, J.B. (2005) Haplotype diversity in mitochondrial DNA hypervariable region I, II and III in northeast China Han. Forensic Sci Int 149: 267–269.
  29. Hong, S.B., Jin, H.J., Kwak, K.D., & Kim, W. (2006) Y-chromosome Haplogroup O3-M122 Variation in East Asia and Implications for the Peopling of Korea. Korean J Genetics 28: 1–8.
  30. Lee, H.Y., Yoo, J.E., Park, M.J., Chung, U., & Shin, K.J. (2006) Mitochondrial DNA control region sequences in Koreans: identification of useful variable sites and phylogenetic analysis for mtDNA data quality control. Int J Legal Med 120: 5–14.
  31. Xue, Y., Zerjal, T., Bao, W., Zhu, S., & Shu, Q. (2006) Male demography in East Asia: a north-south contrast in human population expansion times. Genetics 172: 2431–2439.
  32. Yong, R.Y., Lee, L.K., & Yap, E.P. (2006) Y-chromosome STR haplotype diversity in three ethnic populations in Singapore. Forensic Sci Int 159: 244–257.
  33. Zhang, Q., Yan, J., Tang, H., Jiao, Z., & Liu, Y. (2006) Genetic polymorphisms of 17 Y-STRs haplotypes in Tibetan ethnic minority group of China. Leg Med (Tokyo) 8: 300–305.
  34. Hara, M., Kido, A., Takada, A., & Adachi, N. (2007) Genetic data for 16 Y-chromosomal STR loci in Japanese. Leg Med (Tokyo) 9: 161–170.
  35. Hwang, J.H., Lee, H., Lee, Y.A., Han, M.S., Kim, W., et al. (2007) Haplotypes for 12 Y-chromosomal STR loci in a Korean population (the central region). Forensic Sci Int 168: 73–84.
  36. Li, H., Cai, X., Winograd-Cort, E.R., Wen, B., Cheng, X., et al. (2007) Mitochondrial DNA diversity and population differentiation in southern East Asia. Am J Phys Anthropol 134: 481–488.
  37. Powell, G.T., Yang, H., Tyler-Smith, C., & Xue, Y. (2007) The population history of the Xibe in northern China: a comparison of autosomal, mtDNA and Y-chromosomal analyses of migration and gene flow. FSI Genetics 1: 115–119.
  38. Yan, J., Tang, H., Liu, Y., Jing, Y., Jiao, Z., et al. (2007) Genetic polymorphisms of 17 Y-STRs haplotypes in Chinese Han population residing in Shandong province of China. Leg Med (Tokyo) 9: 196–202.
  39. Zhang, Y., Zhang, H., Cui, Y., Cui, H., & Xu, Q. (2007) Population genetics for Y-chromosomal STRs haplotypes of Chinese Korean ethnic group in northeastern China. Forensic Sci Int 173: 197–203.
  40. Huang, T.Y., Hsu, Y.T., Li, J.M., Chung, J.H., & Shun, C.T. (2008) Polymorphism of 17 Y-STR loci in Taiwan population. Forensic Sci Int 174: 249–254.
  41. Derenko, M.V., Grzybowski, T., Malyarchuk, B.A., Dambueva, I.K., Denisova, G.A., et al. (2003) Diversity of mitochondrial DNA lineages in South Siberia. Ann Hum Genet 67: 391–411.
  42. Jin, H.J., Choi, J.W., Shin, D.J., Kim, J.M., & Kim, W. (1999) Distribution of length variation of the mtDNA 9-bp motif in the intergenic COII/tRNA region in East Asian populations. Korean J Biol Sci 3: 393–397.
  43. Andrews, R.M., Kubacka, I., Chinnery, P.F., Lightowlers, R.N., Turnbull, D.M., et al. (1999) Reanalysis and revision of the Cambridge reference sequence for human mitochondrial DNA. Nat Genet 23: 147.
  44. Yao, Y.G., Kong, Q.P., Wang, C.Y., Zhu, C.L., & Zhang, Y.P. (2004) Different matrilineal contributions to genetic structure of ethnic groups in the silk road region in China. Mol Biol Eval 21: 2265–2280.
  45. Torroni, A., Achilli, A., Macaulay, V., Richards, M., & Bandelt, H.J. (2006) Harvesting the fruit of the human mtDNA tree. Trends Genet 22: 339–345.
  46. Bandelt, H.J., Quintana-Murci, L., Salas, A., & Macaulay, V. (2002) The fingerprint of phantom mutations in mitochondrial DNA data. Am J Hum Genet 71: 1150–1160.
  47. Brandstätter, A., Klein, R., Duftner, N., Wiegand, P., Parson, W., et al. (2006) Application of a quasi-median network analysis for the visualization of character conflicts to a population sample of mitochondrial DNA control region sequences from southern Germany (Ulm). Int J Legal Med 120: 310–314.
  48. Excoffier, L., Smouse, P.E., & Quattro, J.M. (1992) Analysis of molecular variance inferred from metric distances among DNA haplotypes: application to human mitochondrial DNA restriction data. Genetics 131: 479–491.
  49. Schneider, S., Roessli, D., & Excoffier, L. (2000) Arlequin: a softwere for population genetics data analysis, Ver. 2.000, Genetics and Biometry Lab, Department of Anthropology, University of Geneva.
  50. Bandelt, H.J., Forster, P., & Röhl, A. (1999) Median-joining networks for inferring intraspecific phylogenies. Mol Biol Evol 16: 37–48.
  51. Qamar, R., Ayub, Q., Mohyuddin, A., Helgason, A., Mazhar, K., et al. (2002) Y-chromosomal DNA variation in Pakistan. Am J Hum Genet 70: 1107–1124.
  52. Bandelt, H.J., Forster, P., Sykes, B.C., & Richards, M.B. (1995) Mitochondrial portraits of human populations using median networks. Genetics 141: 743–753.
  53. Zalloua, P.A., Xue, Y., Khalife, J., Makhoul, N., Debiane, L., et al. (2008) Y-chromosomal diversity in Lebanon is structured by recent historical events. Am J Hum Genet 82: 873–882.
  54. Dupanloup, I., & Bertorelle, G. (2001) Inferring admixture proportions from molecular data: expansion to any number of parental populations. Mol Biol. Evol 18: 672–675.
  55. Yao, Y.G., Nie, L., Harpending, H., Fu, Y.X., Yuan, Z.G., et al. (2002) Genetic relationship of Chinese ethnic populations revealed by mtDNA sequence diversity. Am J Phys Anthropol 118: 63–76.
  56. Derenko, M.V., Lankina, A.V., Malyarchuk, B.A., Zakharov, I.A., Tsedev, Ts., et al. (2004) Restriction polymorphism of mitochondrial DNA in Koreans and Mongolians. Russian J Genet 40: 1562–1570.
  57. Starikovskaya, E.B., Sukernik, R.I., Derbeneva, O.A., Volodko, N.V., Ruiz-Pesini, E., et al. (2005) Mitochondrial DNA diversity in indigenous populations of the southern extent of Siberia, and the origins of Native American haplogroups. Ann Hum Genet 69: 67–89.
  58. Quintana-Murci, L., Quach, H., Harmant, C., Luca, F., Massonnet, B., et al. (2008) Maternal traces of deep common ancestry and asymmetric gene flow between. Pygmy hunter-gatherers and Bantu-speaking farmers, Proc Natl Acad Sci USA 105: 1596–1601.
  59. Wen, B., Li, H., Lu, D., Song, X., Zhang, F., et al. (2004) Genetic evidence supports demic diffusion of Han culture. Nature 431: 302–305.
  60. Marrero, A.R., Bravi, C., Stuart, S., Long, J.C., Pereira das Neves Leite, F., et al. (2007) Pre- and post-Columbian gene and cultural continuity: the case of the Gaucho from southern Brazil. Hum Hered 64: 160–171.
  61. Han, Y.H. (1995) Altai and the Korean Peninsula from the Perspective of Archaeological Remains. Seoul: Korea National Museum.
  62. Wells, S. (2002) The Journey of Man: A Genetic Odyssey. Princeton: Princeton University Press.
  63. Underhill, P.A. (2003) Inferring human history: clues from Y-chromosome haplotypes. Cold Spring Harb Symp Quant Biol 68: 487–493.
  64. Shi, H., Dong, Y.L., Wen, B., Xiao, C.J., Underhill, P.A., et al. (2005) Y-chromosome evidence of southern origin of the East Asian-specific haplogroup O3-M122. Am J Hum Genet 77: 408–419.
  65. Hammer, M.F., Karafet, T.M., Park, H., Omoto, K., Harihara, S., et al. (2006) Dual origins of the Japanese: common ground for hunter-gatherer and farmer Y chromosomes. J Hum Genet 51: 47–58.
  66. Sokal, R.R., & Thompson, B.A. (1998) Spatial genetic structure of human populations in Japan. Hum Biol 70: 1–22.