출처:
Y-Chromosome Evidence of Southern Origin of the East Asian-Specific Haplogroup O3-M122
동아시아 사람들만 가진 O3-M122 유전자 그룹이 남쪽에서 기원했다는 Y염색체 증거
홍시(Hong Shi),1,2,6 용리동(Yong-li Dong),3 보원(Bo Wen),4 춘걸효(Chun-Jie Xiao),3 피터 A. 언더힐 (Peter A. Underhill),5 패동심(Pei-dong Shen),5 라나짓 차크라보르티 (Ranajit Chakraborty),7 금력(Li Jin),4,7 병원(Bing Su)1,2,7
- 1 Key Laboratory of Cellular and Molecular Evolution, Kunming Institute of Zoology
곤명동물연구소(昆明動物硏究所) 세포·분자 진화 중점 실험실(重點實驗室) - 2 Kunming Primate Research Center, Chinese Academy of Sciences
중국과학원(中國科學院) 곤명 영장류 연구 센터 - 3 Key Laboratory of Bio-resources Conservation and Utilization and Human Genetics Center, Yunnan University, Kunming, China
운남대학교(雲南大學) 생물 자원 보존 및 활용 중점 실험실 및 인간 유전학 센터, 곤명(昆明), 중국 - 4 State Key Laboratory of Genetic Engineering and Center for Anthropological Studies, School of Life Sciences, Fudan University, Shanghai
복단대학교(復旦大學) 생명과학대학 유전 공학 국가 중점 실험실 및 인류학 연구 센터, 상해(上海) - 5 Department of Genetics, Stanford University, Stanford, CA
스탠퍼드 대학교(Stanford University) 유전학과, 스탠퍼드, 캘리포니아 - 6 Graduate School of Chinese Academy of Science, Beijing
중국과학원(中國科學院) 대학원, 북경(北京) - 7 Center for Genome Information, University of Cincinnati, Cincinnati
신시내티 대학교(University of Cincinnati) 게놈 정보 센터, 신시내티
[논문요약] O3-M122 유전자가 들려주는 동아시아인의 역사
| 전문 용어 | 용어 해설 |
| Y염색체 | 아버지의 유전자 (남성 혈통 추적) |
| 반수체형 (Haplogroup) | 유전자 그룹 |
| SNP | 느린 변화 표지 (계통 구분) |
| STR | 빠른 변화 표지 (다양성, 나이 측정) |
| 다형성 (Polymorphism) | 유전적 다양성 (기원지 추정 기준) |
| 다차원 척도법 (MDS) | 유전자 거리 지도 |
1. 연구의 목표와 배경
- 연구 문제: 현대 인류가 동아시아에 정착한 초기 경로에 대해서는 북쪽 기원설과 남쪽 기원설이 대립했다.
- 핵심 유전자: 동아시아인의 Y염색체에서 가장 흔한 유전자 그룹은 O3-M122이다. 이 계통은 동아시아 남성에게 평균3%의 높은 빈도로 나타나며, 특히 한족에게서 매우 지배적이다 (북부 한족 52.06%, 남부 한족 53.72%).

-
- 참고 (그림 1): O3-M122 계통은 M175 계통 아래의 O 유전자 그룹에 속한다.
2. 샘플링 및 유전자 분포 현황 (그림 3, 표 2 반영)

- 샘플링 지역 (그림 3): 연구진은 양자강을 경계로 북부 동아시아 (NEAS)와 남부 동아시아 (SEAS)를 나누고, 특히 중국 남서부의 다양한 어족(티베트-버마어, 다이어, 흐몽-미엔어, 오스트로아시아어 등)에 걸쳐 40개 인구 집단에서 2,332명의 샘플을 수집했다. 이는 중국 소수 민족의 약 80%가 거주하는 지역이다.

- O3-M122 전체 분포 (그림 2): O3-M122 유전자형의 빈도 분포 지도를 통해, 이 그룹이 동아시아 및 주변 대륙 인구에서 어떻게 퍼져 있는지 시각적으로 확인했다.

- O3-M122 하위 그룹 분포 (표 2):
- O3-M122 아래 12개의 하위 유전자형 중 7개를 관찰했다.
- 가장 지배적인 하위 그룹은 O3-M134, O3-M7, O3-M324이다.
- 특이하게 O3-M7 계통은 남부 인구에서만 관찰되었다.
- O3a1과 O3a2 같은 일부 희귀 유전자형은 캄보디아나 산동(山東) 한족 등 특정 개인에게서만 관찰되었다.

- 지리적 분포 (그림 4): 주요 O3-M122 하위 유전자 그룹의 분포는 남부와 북부 인구 사이에 뚜렷한 차이를 보이지 않고 대부분 공유되었지만, O3-M7은 남부 지역에만 집중되어 있었다.
3. 핵심 증거 및 결론
3.1. 다양성 분석 (남부 기원설 지지)
- 다양성 (STR 자료): 남부 동아시아 (SEAS)의 O3-M122 유전자형이 북부 동아시아 (NEAS)보다 더 다양하게 나타났다.

- MDS 분석 (그림 5): SEAS가 NEAS보다 유전적으로 더 다양함을 확인했다.

- 유전자 네트워크 (그림 6): 최근 혼합된 인구를 제외하고 분석한 결과, O3-M122의 주요 유전자형이 순수한 남부 인구 집단에서 발생했음이 명확해져 남부 기원설을 강력히 입증한다.
3.2. 이동 시기 (표 3)

- O3-M122 하위 그룹들의 출현 시기는 약 25,000년에서 30,000년 전으로 추정되며, 이는 동아시아 현생 인류의 초기 화석 기록과 일치한다.
3.3. 남북 유전적 차이의 원인 (표 1)

- 현재의 남북 유전적 차이는 초기 북쪽 이동 시의 창시자 효과와 더불어, 북부 인구 (NEAS)에 유럽/중앙아시아 계통 유전자(M45, M89 등)가 최근에 유입되어 유전적 다양성을 높였기 때문으로 해석된다. 외부 유전자를 제거하면 SEAS가 NEAS의 조상이라는 결론이 뒷받침된다.
| 지역별 주요 동아시아 Y 염색체 유전자 그룹 분포 (표 1 일부 발췌) | M122 (O3) | M95 (O2) | M119 (O1) | 총계 (동아시아 특유) |
| 북부 한족 (NEAS) | 52.06% | 0.72% | 4.36% | 57.14% |
| 남부 한족 (SEAS) | 53.72% | 6.17% | 15.34% | 75.23% |
| 다이 (Daic) (SEAS) | 29.78% | 40.45% | 10.67% | 80.90% |
최종 결론: O3-M122 유전자 그룹은 남쪽에서 기원했으며, 초기 북쪽 이동은 25,000년~30,000년 전에 일어났다는 가설을 강력하게 지지한다.
[논문번역]
The prehistoric peopling of East Asia by modern humans remains controversial with respect to early population migrations. Here, we present a systematic sampling and genetic screening of an East Asian-specific Y-chromosome haplogroup (O3-M122) in 2,332 individuals from diverse East Asian populat1ions. Our results indicate t2hat the O3-M122 lineage is dominant in East Asian populations, with an average frequency of 44.3%. The microsatellite data show that the O3-M122 haplotypes in southern East Asia are more diverse than those in northern East Asia, suggesting a southern origin of the O3-M122 mutation. It was estimated that the early northward migration of the O3-M122 lineages in East Asia occurred ~25,000-30,000 years ago, consistent with the fossil records of modern humans in East Asia.
현생 인류가 동아시아에 정착한 선사시대 초기 이동 경로는 여전히 논란거리이다. 우리는 동아시아의 다양한 인구 집단 출신 2,332명의 Y염색체에서 동아시아 특유의 유전자 그룹(O3-M122)을 체계적으로 조사했다. 연구 결과, O3-M122 계통은 동아시아 인구 집단에서 평균 44.3%의 빈도로 가장 우세한(지배적인) 유전자 그룹으로 나타났다. 미세부수체(유전자 변이의 다양성 측정) 자료를 보면, 남부 동아시아의 O3-M122 유전자가 북부 동아시아의 유전자보다 더 다양했다. 이는 O3-M122 유전자 변이가 남쪽에서 시작되었음을 시사한다. 이 O3-M122 그룹이 동아시아에서 북쪽으로 이동하기 시작한 것은 약 25,000년에서 30,000년 전으로 추정되며, 이는 동아시아 현생 인류의 화석 기록과도 일치한다.
목차
서론
The Y chromosome is a powerful tool for reconstruction of human population history (Jobling and Tyler-Smith 2003). The geographic distribution of genetic variations on the Y chromosome-which contains information about the subsequent colonization, differentiations, and migrations overlaid on recent population ranges-provides clues about prehistoric migrations (Underhill et al. 2001). The combination of biallelic (SNPs, low mutation rate) and microsatellite (STRs, high mutation rate) markers located at the nonrecombinant region of the Y chromosome have been widely used to infer early human history (Kayser et al. 2000; Nachman and Crowell 2000; Underhill et al. 2001; Y Chromosome Consortium 2002; Jobling and Tyler-Smith 2003; Dupuy et al. 2004). It was also shown that the estimates of divergence time that were based on Y-chromosome STR (Y-STR) variations under the background of Y-chromosome SNPs are more accurate than the STR-only estimates (Ramakrishnan and Mountain 2004). This strategy has been used recently in tracing and dating prehistoric migrations of European populations (Di Giacomo et al. 2004; Rootsi et al. 2004; Semino et al. 2004).
Y염색체는 인류 집단의 역사를 다시 구성하는 데 아주 중요한 도구이다 (Jobling and Tyler-Smith 2003). Y염색체의 유전자 변이가 지리적으로 어떻게 퍼져 있는지 보면, 인류가 나중에 어디에 정착했고, 어떻게 나뉘고 이동했는지에 대한 정보가 담겨 있어 선사시대 이동 경로를 알 수 있다 (Underhill et al. 2001). Y염색체의 유전 정보를 섞지 않는 부분에 있는 이대립유전자(SNPs, 돌연변이 속도가 느린 유전자 표지)와 미세부수체(STRs, 돌연변이 속도가 빠른 유전자 표지)를 함께 사용하는 방법은 초기 인류 역사를 추측하는 데 널리 쓰여 왔다 (Kayser et al. 2000; Nachman and Crowell 2000; Underhill et al. 2001; Y Chromosome Consortium 2002; Jobling and Tyler-Smith 2003; Dupuy et al. 2004). 또한 Y염색체 SNP를 기준으로 Y염색체 STR(Y-STR)의 변이를 이용해 유전자 그룹이 나눠진 시점(분화 시점)을 추정하는 것이 STR만 이용하는 것보다 더 정확하다는 것이 밝혀졌다 (Ramakrishnan and Mountain 2004). 이 방식은 최근 유럽 인구 집단의 선사시대 이동 경로를 추적하고 시기를 측정하는 데 사용되었다 (Di Giacomo et al. 2004; Rootsi et al. 2004; Semino et al. 2004).
With a large number of indigenous populations and a complex human-inhabitation history, the peopling of East Asia remains unclear with respect to patterns of the early population migrations. The major dispute among researchers is rooted in different interpretations of early migration history that are based on the observed genetic divergence between northern (NEAS) and southern (SEAS) East Asian populations (Zhao et al. 1986; Weng and Yan 1989; Chu et al. 1998; Du et al. 1998; Piazza 1998; Su et al. 1999, 2000a, 2000b; Ding et al. 2000; Jin and Su 2000; Capelli et al. 2001; Karafet et al. 2001). Our previous study on Y-chromosome variations indicated that SEAS are more polymorphic than are NEAS (Su et al. 1999; Jin and Su 2000). However, using a similar set of Y-chromosome biallelic markers, Karafet et al. (2001) argued that there was a lack of genetic divergence between SEAS and NEAS and therefore disapproved of the hypothesis of early northward migration in East Asia. Data from mtDNA also indicated discrepancy on this issue. Two previous mtDNA studies supported the southern origin of modern humans in East Asia (Ballinger et al. 1992; Yao et al. 2002), whereas another study proposed that the genetic divergence between SEAS and NEAS might be due only to isolation by distance and that, therefore, a northern origin is still a possible explanation (Ding et al. 2000).
동아시아는 토착 인구 집단이 많고 인류 거주 역사가 복잡하여, 초기 인구 이동 패턴에 대한 정착 과정이 아직 확실하지 않다. 연구자들 간의 가장 큰 논쟁은 북부 동아시아(NEAS)와 남부 동아시아(SEAS) 인구 집단 사이에서 보이는 유전적 차이(분기)를 초기 이주 역사와 관련하여 다르게 해석하는 데서 시작된다 (Zhao et al. 1986; Weng and Yan 1989; Chu et al. 1998; Du et al. 1998; Piazza 1998; Su et al. 1999, 2000a, 2000b; Ding et al. 2000; Jin and Su 2000; Capelli et al. 2001; Karafet et al. 2001). 우리의 이전 Y염색체 변이 연구는 SEAS가 NEAS보다 유전자적으로 더 다양하다는 것을 보여주었다 (Su et al. 1999; Jin and Su 2000). 하지만 비슷한 Y염색체 유전자 표지를 사용한 Karafet et al. (2001)은 SEAS와 NEAS 사이에 유전적 차이가 거의 없다고 주장하며, 동아시아의 초기 북쪽 이동 가설에 반대했다. 미토콘드리아 DNA(mtDNA) 자료 역시 이 문제에 대해 서로 다른 결과를 보였다. 이전 두 mtDNA 연구는 동아시아 현생 인류의 남쪽 기원을 지지했지만 (Ballinger et al. 1992; Yao et al. 2002), 다른 연구는 SEAS와 NEAS 사이의 유전적 차이가 단순히 지리적 거리 때문에 생긴 고립 때문일 수 있으며, 따라서 북쪽 기원도 여전히 가능한 설명이라고 제안했다 (Ding et al. 2000).
It should be noted that when we discuss the origin and migration of human populations, a time period-which part of the human-population history is under scrutiny-should be clearly defined. Recent population movement and admixture could wipe out or significantly diminish the original genetic signatures of early population movements. Therefore, to extract information for modern human origin and early population movements that happened before the Neolithic period, population-specific markers, such as SNP markers on the Y chromosome, become useful for the study of regional population movements (Jobling and Tyler-Smith 2003). At the same time, recent gene flow between distantly related populations can also be identified and removed in an analysis based on population specificity. Hence, in this sense, extreme caution should be exercised in selection of genetic markers in the study of the origin and early migrations of a continental population, because genetic variations introduced through recent gene flow could create false interpretations, as in two previous studies (Ding et al. 2000; Karafet et al. 2001). The same logic also applies to the selection of populations; ethnic populations with long histories of inhabitation in a region are always preferred for inferring early population histories.
인류 집단의 기원과 이동을 논할 때는 우리가 인류 역사의 어느 시기를 조사하는지 시간대를 명확히 해야 한다. 최근의 인구 이동과 섞임(혼합)은 초기 인구 이동의 본래 유전자 특징을 지우거나 크게 줄일 수 있다. 따라서 신석기 시대 이전에 일어난 현생 인류의 기원과 초기 이동에 대한 정보를 얻으려면, Y염색체의 SNP 표지자처럼 특정 인구 집단에만 나타나는 표지자가 지역 인구 이동 연구에 유용하다 (Jobling and Tyler-Smith 2003). 동시에, 멀리 떨어진 관련 집단 간의 최근 유전자 흐름도 인구 특이성을 기반으로 하는 분석에서 파악하고 제거할 수 있다. 그러므로 이러한 관점에서 대륙 인구 집단의 기원과 초기 이동을 연구할 때 유전자 표지자를 선택할 때 매우 신중해야 한다. 왜냐하면 최근의 유전자 흐름을 통해 들어온 유전적 변이가 이전의 두 연구에서처럼 (Ding et al. 2000; Karafet et al. 2001) 잘못된 해석을 낳을 수 있기 때문이다. 이 논리는 연구 대상 인구 집단을 선택할 때도 적용된다. 한 지역에서 오래 거주한 역사를 가진 민족 집단이 초기 인구 역사를 추론하는 데 항상 더 선호된다.
In East Asian populations, there are three regionally distributed (East Asian-specific) Y-chromosome haplogroups under the M175 lineage (fig. 1)-O3-M122, O2-M95, and O1-M119-together accounting for 57% of the Y chromosomes in East Asian populations (table 1). The O3-M122 has the highest frequency (41.8% on average) (fig. 2) in East Asians, especially in Han Chinese (52.06% in northern Han and 53.72% in southern Han) (table 1), and it is absent outside East Asia. Previous studies have shown that O2-M95 and O1-M119 are prevalent in SEAS and probably originated in the south (Su et al. 1999, 2000a; Wen et al. 2004a, 2004b) (table 1). Therefore, tracing the origin of O3-M122 became critical for a full understanding of the origin and early migrations of modern East Asians.
동아시아 인구 집단에는 M175 계통 아래 지역적으로 분포하는 (동아시아 특유의) Y염색체 유전자 그룹(Haplogroup) 세 가지가 있다 (그림 1) : O3-M122, O2-M95, O1-M119이다. 이들은 동아시아 인구 집단 Y염색체의 총 57%를 차지한다 (표 1). O3-M122는 동아시아인에서 가장 높은 빈도(평균 41.8%)를 보이며 (그림 2) , 특히 한족(漢族)에서는 더 높다 (북부 한족 52.06%, 남부 한족 53.72%) (표 1). 이 유전자 그룹은 동아시아 밖에서는 발견되지 않는다. 이전 연구들은 O2-M95와 O1-M119가 남부 동아시아(SEAS)에서 널리 퍼져 있으며 아마도 남쪽에서 기원했을 가능성이 높다는 것을 보여주었다 (Su et al. 1999, 2000a; Wen et al. 2004a, 2004b) (표 1). 따라서 O3-M122의 기원을 추적하는 것은 현대 동아시아인의 기원과 초기 이동을 완전히 이해하는 데 아주 중요한 작업이 되었다.

그림 1. O3-M122 단일염기다형성(SNP)과 유전자형(haplotype)의 계통발생학적 관계

그림 2. 동아시아 및 다른 대륙 인구 집단에서의 O3-M122 유전자형의 빈도 분포. 사용된 자료는 이미 발표된 연구들(Su et al. 1999, 2000a, 2000b; Qian et al. 2000; Semino et al. 2000; Underhill et al. 2000; Karafet et al. 2001; Lell et al. 2002; Jin et al. 2003; Wen et al. 2004a)에서 가져왔다.

표 1. 전 세계 인구 집단에서 동아시아 특유의 Y염색체 유전자 그룹의 분포.
a 사용된 유전자형(haplotype) 빈도 자료는 이미 발표된 연구들(Su et al. 1999, 2000a, 2000b; Semino et al. 2000; Underhill et al. 2000; Karafet et al. 2001; Wells et al. 2001; Lell et al. 2002; Jin et al. 2003; Wen et al. 2004a)에서 가져왔다.
In the present study, through extensive sampling of East Asian populations and genotyping of Y-chromosome markers (SNPs and STRs) that define an East Asian-specific Y-chromosome haplogroup-O3-M122-we intended to delineate the origin of the O3-M122 haplogroup, to shed more light on the prehistoric migration of modern humans in East Asia.
본 연구에서는 동아시아 인구 집단에서 폭넓게 샘플을 수집하고, 동아시아 특유의 Y염색체 유전자 그룹인 O3-M122를 규정하는 Y염색체 표지자(SNP와 STR)의 유전자형을 분석하여, O3-M122 유전자 그룹의 기원을 명확히 밝혀내고 동아시아 현생 인류의 선사시대 이동에 대한 더 많은 정보를 제공하고자 했다.
재료 및 방법
샘플
In the present study, 2,332 unrelated male samples were collected from the sites shown in figure 3, including 40 populations in East Asia. The criteria for population selection were based on the distribution of the O3-M122 haplogroups. Most of the populations sampled were from southern and southwestern China, where ~80% of the Chinese ethnic populations live; most of them have inhabitation histories longer than 3,000 years (Wang 1994). Most of the northern ethnic populations in China, (e.g., Hui, Uygur, and Mongolian) were recently established (<1,000 years ago), with extensive admixture with Caucasian and Central Asian populations (CAS) (Wang 1994); therefore, those populations were not included in this study.
본 연구에서는 동아시아의 40개 인구 집단을 포함하여 그림 3에 표시된 지역에서 혈연관계가 없는 남성 샘플 2,332개를 모았다 . 인구 집단을 선택하는 기준은 O3-M122 유전자 그룹의 분포를 바탕으로 했다. 샘플로 사용된 인구 집단 대부분은 중국 민족 집단의 약 80%가 살고 있는 중국 남부 및 남서부 지역에서 왔는데, 이들 대부분은 3,000년 이상의 거주 역사를 가지고 있다 (Wang 1994). 중국의 북부 민족 집단(예: 회족(回族, Hui), 위구르족(Uygur), 몽골족(Mongolian)) 대부분은 1,000년보다 짧은 기간 전에 새로 생겨난 집단이며, 코카서스인이나 중앙아시아 인구 집단(CAS)과 많이 섞여 있다 (Wang 1994). 따라서 이들 인구 집단은 이번 연구에 포함하지 않았다.

그림 3. 동아시아의 어족/하위 어족의 지리적 분포와 본 연구의 샘플링 위치 (Wang 1994). 인구 집단 표시는 표 2의 내용과 일치한다.

표 2. 연구된 동아시아 인구 집단에서 O3-M122 유전자형의 분포.
참고—샘플링 지역의 지리적 위치는 그림 3에 표시되어 있다. 총 854개의 샘플이 SNP와 STR 자료 모두의 완전한 세트를 생성했다. 따라서 일부 인구 집단에서 하위 계통의 합계는 확보된 전체 O3-M122 샘플 수보다 작다.
The study populations were defined as “SEAS” and “NEAS” on the basis of their geographic locations. The Yangtze River was used as the geographic border to separate the SEAS and NEAS. In the SEAS, there are 14 Tibeto-Burman-speaking populations with a recorded history of migration from northern China ~3,000 years ago (Wang 1994). The three Altai-speaking populations in Yunnan (southwestern China) were recent immigrants from northern China, <1,000 years ago (Wang 1994). The data about other populations were obtained from previous studies (Su et al. 1999, 2000a, 2000b; Qian et al. 2000; Semino et al. 2000; Underhill et al. 2000; Karafet et al. 2001; Lell et al. 2002; Jin et al. 2003; Wen et al. 2004a).
연구 대상 인구 집단은 지리적 위치에 따라 “남부 동아시아(SEAS)”와 “북부 동아시아(NEAS)”로 나누었다. 양자강(長江)을 이 SEAS와 NEAS를 나누는 지리적 경계로 사용했다. SEAS에는 약 3,000년 전에 북중국에서 이주해 왔다는 기록을 가진 티베트-버마어(Tibeto-Burman)를 사용하는 14개 인구 집단이 있다 (Wang 1994). 운남(雲南)(중국 남서부)에 있는 세 알타이어(Altai)를 사용하는 인구 집단은 1,000년보다 짧은 기간 전에 북중국에서 최근에 이주해 온 사람들이었다 (Wang 1994). 나머지 다른 인구 집단에 대한 자료는 이전 연구들에서 얻었다 (Su et al. 1999, 2000a, 2000b; Qian et al. 2000; Semino et al. 2000; Underhill et al. 2000; Karafet et al. 2001; Lell et al. 2002; Jin et al. 2003; Wen et al. 2004a).
Y염색체 표지자 및 유전자형 분석
We typed 15 Y-chromosome SNPs-including M122, M119, and M95-that represent the three major East Asian-specific lineages, and M134, M117, M162, M7, M113, M159, M121, M164 (Underhill et al. 2001; Y Chromosome Consortium 2002), M324, M300, M333 (P. Shen, A. E. Hirsh, T. Kivisild, B. Do, S. Song, R. Sung, V. Chou, H. Tang, L. Zhivotovsky, P. A. Underhill, L. L. Cavalli-Sforza, M. W. Feldman, P. J. Oefner, unpublished data), and DYS257 (Hammer et al. 1998), which are derived SNPs under the background of M122. The haplotypes were named according to the Y Chromosome Consortium (2002). Both PCR-RFLP and sequencing were used for genotyping (Su et al. 2000b). The phylogenetic relationship of the Y-SNPs is shown in figure 1. We initially typed M122, M119, and M95 in the 2,332 samples, in which 1,032 O3-M122 lineages were observed and were subjected to further typing of the other 12 SNPs and 8 STRs (DYS19/394, DYS388, DYS389 I, DYS389 II, DYS390, DYS391, DYS392, and DYS393). Among them, 854 samples generated complete sets of allele counting for all the SNPs and STRs (see detailed listing in our PDF supplement [online only]).
우리는 동아시아 특유의 세 가지 주요 유전자 계통을 대표하는 M122, M119, M95를 포함하여 15개의 Y염색체 SNP 표지자들을 분석했다. 또한 M122의 배경 아래에서 파생된 SNP인 M134, M117, M162, M7, M113, M159, M121, M164 (Underhill et al. 2001; Y Chromosome Consortium 2002), M324, M300, M333 (미발표 자료), 그리고 DYS257 (Hammer et al. 1998)의 유전자형도 분석했다. 유전자형 그룹(Haplotype)의 이름은 Y 염색체 컨소시엄(Y Chromosome Consortium, 2002)의 방식에 따랐다. 유전자형 분석에는 PCR-RFLP 방식과 염기서열 분석 방식이 모두 사용되었다 (Su et al. 2000b). 이 Y-SNP들의 계통발생학적 관계(유전자 간의 관계)는 그림 1에 나와 있다 . 우리는 2,332개의 샘플에서 우선 M122, M119, M95의 유전자형을 검사했고, 그중 1,032개의 O3-M122 계통이 관찰되었다. 이 1,032개 샘플에 대해 나머지 12개의 SNP와 8개의 STR(DYS19/394, DYS388, DYS389 I, DYS389 II, DYS390, DYS391, DYS392, DYS393)에 대한 추가 유전자형 분석을 진행했다. 이들 중 854개의 샘플만이 모든 SNP와 STR에 대한 대립유전자 수(allele counting)를 완전히 파악할 수 있었다 (자세한 목록은 온라인 PDF 보충 자료를 참조하라는 내용이었다).
데이터 분석
The Y-chromosome SNP data were used to analyze the frequency distribution of the markers across the geographic regions by generation of contour maps (Golden Software Surfer 7.0). The multidimensional scaling (MDS) was used to analyze the relationship among populations with Arlequin 2.0 (Rst genetic distance matrix) (Schneider et al. 1998) and SPSS11.0 (MDS plot) software, with use of the SNP data.
Y염색체 SNP 자료는 등고선 지도를 만드는 프로그램(Golden Software Surfer 7.0)을 사용해 지리적 영역에 따른 유전자 표지자의 빈도 분포를 분석하는 데 사용되었다. 다차원 척도법(MDS)은 SNP 자료를 이용해 알르캥 2.0 (Arlequin 2.0) 소프트웨어(Rst 유전 거리 행렬) (Schneider et al. 1998)와 SPSS11.0 소프트웨어를 통해 인구 집단 간의 관계를 분석하는 데 사용되었다.
The divergence times between the subclades of O3-M122 were estimated using the STR data by use of the SNP-STR coalescence method (Zhivotovsky 2001; Rootsi et al. 2004; Semino et al. 2004). The average mutation rate of the Y-STRs used was 0.00069 (Zhivotovsky et al. 2004). We also performed AMOVA analysis using the STR data with Arlequin 2.0 software to dissect population structure. The networks of the Y-STR haplotypes of major O3-M122 subhaplogroups were constructed using the program NETWORK4.1.0.6 (Fluxus). With use of the Arlequin 2.0 program (Schneider et al. 1998), we recalculated the gene diversity of SEAS and NEAS on the basis of the data reported by Karafet et al. (2001), and the NEAS with known history of recent admixture were removed from the calculation.
O3-M122 하위 계통들 사이의 분화 시점은 SNP-STR 합류법을 사용하여 STR 자료로 추정되었다 (Zhivotovsky 2001; Rootsi et al. 2004; Semino et al. 2004). 사용된 Y-STR의 평균 돌연변이율은 0.00069이었다 (Zhivotovsky et al. 2004). 또한 알르캥 2.0 소프트웨어로 STR 자료를 사용해 분자 분산 분석(AMOVA analysis)을 실시하여 인구 집단의 구조를 자세히 분석했다. 주요 O3-M122 하위 유전자 그룹의 Y-STR 유전자형 네트워크는 NETWORK4.1.0.6 프로그램(Fluxus)을 사용하여 만들었다. 알르캥 2.0 프로그램(Schneider et al. 1998)을 사용해 Karafet et al. (2001)이 보고한 자료를 기반으로 SEAS와 NEAS의 유전자 다양성을 다시 계산했으며, 최근에 다른 인구와 섞였다는 역사가 알려진 NEAS는 이 계산에서 제외했다.
결과
Among the 2,332 samples typed, 1,032 (44.3%) were O3-M122, which is consistent with previous reports of the dominant occurrence of M122 in East Asian populations (table 1) (Su et al. 1999, 2000a, 2000b; Karafet et al. 2001). There are 12 haplotypes within the O3-M122 haplogroup (fig. 1). We observed seven of the1m; their distribution is shown in table 2. The dominant O3-M122 subhaplogroups are O3-M134 (which includes O3a5a2 and O3a5b), O3-M7 (which includes O3a4b), and O3-M324 (which includes O3a*). Haplotype O3a1 (defined by M121 and DYS257) was observed only in two individuals (one from Shandong Han in northern China and the other from Cambodia). Haplotype O3a2 (defined by M164) was observed only in one Cambodian. We did not observe O3a3 (M159), O3a4a (M113), O3a5a1 (M162), O3a6 (M300), or O3a7 (M333), which were originally identified in SEAS samples in the initial screening panel of both SEAS and NEAS (Shen et al. 2000; Underhill et al. 2000; P. Shen, A. E. Hirsh, T. Kivisild, B. Do, S. Song, R. Sung, V. Chou, H. Tang, L. Zhivotovsky, P. A. Underhill, L. L. Cavalli-Sforza, M. W. Feldman, P. J. Oefner, unpublished data).
분석한 2,332개의 샘플 중 1,032개(44.3%)가 O3-M122 유전자 그룹으로 나타났다. 이는 M122가 동아시아 인구 집단에서 지배적으로 발견된다는 이전 보고와 일치한다 (표 1) (Su et al. 1999, 2000a, 2000b; Karafet et al. 2001). O3-M122 유전자 그룹 안에는 12개의 하위 유전자형(haplotype)이 있다 (그림 1). 우리는 그중 7개를 관찰했고, 이들의 분포는 표 2에 나와 있다. 가장 흔하게 나타나는 O3-M122의 하위 유전자 그룹은 O3-M134(O3a5a2와 O3a5b 포함), O3-M7(O3a4b 포함), 그리고 O3-M324(O3a* 포함)이다. O3a1 유전자형(M121과 DYS257로 정의됨)은 단 두 명의 개인(북중국 산동(山東) 한족 한 명, 캄보디아인 한 명)에게서만 관찰되었다. O3a2 유전자형(M164로 정의됨)은 캄보디아인 한 명에게서만 관찰되었다. 우리는 O3a3(M159), O3a4a(M113), O3a5a1(M162), O3a6(M300), 또는 O3a7(M333)은 관찰하지 못했는데, 이들은 원래 남부 동아시아(SEAS)와 북부 동아시아(NEAS) 모두를 대상으로 한 초기 검사에서 SEAS 샘플에서 확인되었던 것들이다 (Shen et al. 2000; Underhill et al. 2000; 미발표 자료).
The contour maps in figure 4 demonstrate the geographic distribution of the major O3-M122 subhaplogroups in East Asia. In general, the distribution of the O3-M122 haplotypes did not show distinctive divergence between southern and northern populations, with all the major subhaplogroups shared between them-except for O3-M7, which was observed only in the southern populations and therefore indicates a recent common ancestry of the O3-M122 lineage in East Asia. Using the STR data, we calculated the gene diversities; no significant differences were observed between SEAS and NEAS or among different language groups (data not shown). The AMOVA analysis did not show significant between-group divergence either (data not shown). However, the MDS analysis showed that the NEAS are closely related by clustering together, whereas the SEAS showed relatively loose connections with larger variance, indicating that SEAS are genetically more polymorphic than are NEAS (fig. 5).
그림 4에 있는 등고선 지도(Contour map)는 동아시아 주요 O3-M122 하위 유전자 그룹의 지리적 분포를 보여준다 . 일반적으로 O3-M122 유전자형의 분포는 남부 인구와 북부 인구 사이에 뚜렷한 차이(분기)를 보이지 않았으며, 주요 하위 유전자 그룹 대부분이 양쪽 모두에서 공유되었다. 다만 O3-M7은 남부 인구에서만 관찰되었는데, 이는 동아시아 O3-M122 계통의 조상이 비교적 최근에 공통되었음을 시사한다. STR 자료를 사용해 유전자 다양성(gene diversity)을 계산한 결과, SEAS와 NEAS 사이 또는 다른 언어 그룹들 사이에서 눈에 띄는 차이는 관찰되지 않았다 (자료 미제시). 분자 분산 분석(AMOVA analysis) 역시 집단 간에 의미 있는 차이를 보이지 않았다 (자료 미제시). 하지만 다차원 척도법(MDS) 분석에서는 NEAS가 서로 가까이 모여 밀접하게 관련되어 있는 반면, SEAS는 상대적으로 느슨하게 연결되어 더 넓게 퍼져 있었다. 이는 SEAS가 NEAS보다 유전적으로 더 다양함을 나타낸다 (그림 5) .

그림 4. Y 유전자형의 빈도 분포를 나타내는 등고선 지도 (주요 하위 그룹의 분포 밀도 포함). O3-M122, O3a-M324, O3a5-M134, O3a4-M7의 등고선 지도를 만드는 데 사용된 자료는 이미 발표된 연구들과 본 연구의 자료를 함께 사용했다. O3a*와 O3a5a2 (M117)의 등고선 지도를 만드는 데 사용된 자료는 본 연구의 자료이다.

그림 5. 연구된 40개 인구 집단의 O3-M122 SNP 유전자형 분포를 기반으로 한 다차원 척도법(MDS) 분석 지도
It should be noted that the difference in genetic variance between NEAS and SEAS could be due to the sampling-density discrepancy. However, our previous studies showed that northern Han populations are relatively homogenous, with similar Y-chromosome haplotype distributions (Ke et al. 2001a, 2001b). In addition, the four northern Han populations sampled in the present study covered different geographic regions in northern China. Therefore, the genetic variance observed probably reflected the true genetic background of the northern populations in China. In the MDS map, the Hmong-Mien populations were clustered closely with Han populations, which reflects the recorded history of admixture (Wang 1994).
NEAS와 SEAS 사이의 유전적 다양성 차이는 샘플링 밀도의 불일치 때문일 수 있다는 점을 유의해야 한다. 하지만 우리의 이전 연구들은 북부 한족(漢族) 인구 집단이 비교적 동질적이며 비슷한 Y염색체 유전자형 분포를 보였다는 것을 보여주었다 (Ke et al. 2001a, 2001b). 게다가 본 연구에서 샘플링된 네 개의 북부 한족 집단은 북중국의 서로 다른 지리적 지역을 포함하고 있었다. 따라서 관찰된 유전적 다양성은 중국 북부 인구 집단의 실제 유전적 배경을 반영했을 가능성이 높다. MDS 지도에서 흐몽-미엔(Hmong-Mien) 인구 집단은 한족 인구 집단과 가깝게 모여 있었는데, 이는 기록된 역사 속의 혼합(섞임) 역사를 반영한다 (Wang 1994).
Assuming the O3-M122 lineage has a common origin in East Asia, we next sought to answer the question of where this lineage originally occurred. We conducted a detailed analysis by constructing a network of both the SNP and STR haplotype data. Figure 6A shows that there was a lot of similar STR evolution after the emergence of O3-M122, and many shared STR haplotypes were observed between northern and southern populations, again confirmation of the recent common ancestry of the M122 lineage in East Asia. It has been well documented that the Tibeto-Burman populations living in southwestern China were originally, during the late Neolithic period, from the north, but they have been under extensive influence from the southern ethnic groups, including Daic- and Austro-Asiatic-speaking populations (Wang 1994; Wen et al. 2004b). In addition, the Hmong-Mien populations have a recorded history of admixture with Han populations, although they are often considered southern populations (Wang 1994; Wen et al. 2005). The southern Han populations were recent northern immigrants because of the expansion of Han culture in the past several thousand years (Wang 1994).
O3-M122 계통이 동아시아에서 공통의 기원을 가졌다고 가정하고, 우리는 다음으로 이 계통이 원래 어디서 발생했는지에 대한 질문에 답하고자 했다. 우리는 SNP와 STR 유전자형 자료 모두를 사용해 유전자 네트워크를 만들어 상세한 분석을 수행했다. 그림 6A는 O3-M122가 출현한 후에 비슷한 STR 진화가 많이 일어났으며, 북부와 남부 인구 집단 사이에 공유되는 STR 유전자형이 많이 관찰되었음을 보여준다. 이는 M122 계통이 동아시아에서 비교적 최근에 공통 조상을 가졌음을 다시 한번 확인해 준다. 중국 남서부에 거주하는 티베트-버마(Tibeto-Burman) 인구 집단은 원래 신석기 시대 후기에 북쪽에서 왔지만, 따이(Daic)어와 오스트로아시아(Austro-Asiatic)어를 사용하는 남부 민족 집단으로부터 광범위한 영향을 받아왔다는 것이 잘 기록되어 있다 (Wang 1994; Wen et al. 2004b). 또한 흐몽-미엔(Hmong-Mien) 인구 집단은 남부 인구로 간주되지만, 한족(漢族) 인구 집단과 섞인 역사가 기록되어 있다 (Wang 1994; Wen et al. 2005). 남부 한족 인구 집단 역시 지난 수천 년 동안 한(漢) 문화가 확장되면서 최근에 북쪽에서 이주해 온 사람들이었다 (Wang 1994).

그림 6. Y SNP를 배경으로 한 Y STR 유전자형의 네트워크
A: 모든 인구 집단을 사용하여 만든 네트워크이다. 파란색으로 표시된 집단은 북부 한족이다. 빨간색으로 표시된 집단은 남부 인구 집단(따이, 흐몽-미엔, 오스트로아시아)이다. 초록색으로 표시된 집단은 남부 한족과 티베트-버마족이다.
B: 최근 인구 혼합의 영향을 제거하기 위해 남부 한족, 알타이, 티베트-버마, 흐몽-미엔 인구 집단을 제외하고 만든 네트워크이다. 파란색은 북부 한족을 나타낸다. 빨간색은 따이와 오스트로아시아 인구 집단을 나타낸다.
점의 크기는 유전자형 빈도에 비례하며, 여러 색깔을 가진 점은 여러 인구 집단이 공유하는 유전자형을 나타낸다.
To remove the influence of relatively recent population admixture, we constructed the STR network excluding the Tibeto-Burman, Altaic, Hmong-Mien, and southern Han populations. The rebuilt network (fig. 6B) shows that most of the major STR haplotypes occurred in southern populations (Daic and Austro-Asiatic). We argue that both the MDS analysis and the STR network support a southern origin of the O3-M122 lineage in East Asia (fig. 6B).
비교적 최근의 인구 혼합(섞임) 영향을 제거하기 위해, 우리는 티베트-버마, 알타이, 흐몽-미엔, 남부 한족 인구 집단을 제외하고 STR 네트워크를 다시 만들었다. 새로 구축된 네트워크(그림 6B) 는 주요 STR 유전자형 대부분이 남부 인구 집단(따이와 오스트로아시아)에서 발생했음을 보여준다. 우리는 다차원 척도법(MDS) 분석과 STR 네트워크 모두 O3-M122 계통의 동아시아 남부 기원을 지지한다고 주장한다 (그림 6B).
It should be noted that the lack of genetic divergence, in view of the gene diversity between the southern and northern O3-M122 lineages, indicates that the O3-M122 lineages were probably dominant in the population involved in the initial northward migration; therefore, no obvious bottleneck occurred for the O3-M122 lineage, in contrast with the skewed distribution of the O2-M95 and O1-M119 lineages (Su et al. 1999; Wen et al. 2004b). However, recent gene flows due to the expansion of Han culture could also have contributed partly to the homogeneity of the O3-M122 lineage, although Daic and Austro-Asiatic populations had much less influence from Han populations than did the Tibeto-Burman and Hmong-Mien populations (Wang 1994; Su et al. 2000b; Wen et al. 2004b).
남부와 북부 O3-M122 계통 사이의 유전자 다양성 측면에서 유전적 분화가 부족하다는 점은 O3-M122 계통이 초기 북쪽 이동에 관련된 인구 집단에서 지배적이었을 가능성을 시사한다. 따라서 O2-M95 및 O1-M119 계통의 치우친 분포와 달리 (Su et al. 1999; Wen et al. 2004b), O3-M122 계통에는 눈에 띄는 인구 병목 현상(bottleneck)이 발생하지 않았을 것이다. 하지만 한(漢) 문화의 확장으로 인한 최근의 유전자 흐름 역시 O3-M122 계통의 동질성에 부분적으로 기여했을 수 있다. 이는 티베트-버마 및 흐몽-미엔 인구 집단에 비해 따이 및 오스트로아시아 인구 집단이 한족으로부터 훨씬 적은 영향을 받았다는 기록과 일치한다 (Wang 1994; Su et al. 2000b; Wen et al. 2004b).
On the basis of the STR data, we estimated the ages of the major O3-M122 subhaplogroups by use of the coalescence method developed by Zhivotovsky (2001). Table 3 lists the age estimations; all the subhaplogroups have a history older than the Neolithic time, with a range of 25,000-30,000 years ago.
STR 자료를 바탕으로, 우리는 Zhivotovsky (2001)가 개발한 합류법(coalescence method)을 사용하여 주요 O3-M122 하위 유전자 그룹의 나이(출현 시기)를 추정했다. 표 3은 그 나이 추정치를 보여준다. 모든 하위 유전자 그룹은 25,000년에서 30,000년 전의 범위로, 신석기 시대보다 더 오래된 역사를 가지고 있다.

표 3. Y 미세부수체(STR) 자료를 사용하여 추정한 O3-M122 하위 계통들의 분화 시기.
참고—분화 시기는 TD 방법(Zhivotovsky 2001; Zhivotovsky et al. 2004)에 따라 추정했다. 상한선은 초기 분산 V0가 0이라고 가정하여 결정했다 (Rootsi et al. 2004). 하한선은 V0가 Va와 같다고 가정하여 결정했으며, Va는 조상 인구 집단 내의 분산 값이다.
논의
As we described above, the distribution of the O3-M122 haplotypes in East Asian populations supports a southern origin. The age estimation is consistent with the fossil records unearthed in East Asia, where no modern human fossils aged >40,000 years have been found (Wu et al. 1995; Su et al. 1999; Jin and Su 2000). Interestingly, all the O3-M122 sublineages seem to diverge during a relatively short period of time (25,000-30,000 years ago), an implication that an ancient population expansion in southern East Asia might have occurred that could have triggered the initial northward migration. Hence, we argue that the time of the initial northward migration should be close to the estimated divergence times of the O3-M122 sublineages, a hypothesis that is also supported by the earliest fossil records of modern humans unearthed in northern China (27,000-39,000 years ago) (Wu et al. 1995; Jin and Su 2000).
위에서 설명했듯이, 동아시아 인구 집단에서 O3-M122 유전자형이 분포하는 양상은 남쪽 기원을 지지한다. 유전자 그룹의 출현 시기 추정치는 동아시아에서 40,000년보다 오래된 현생 인류 화석이 발견되지 않았다는 화석 기록과 일치한다 (Wu et al. 1995; Su et al. 1999; Jin and Su 2000). 흥미롭게도, 모든 O3-M122 하위 계통들이 비교적 짧은 기간(25,000년~30,000년 전) 동안에 분화한 것으로 보인다. 이는 남부 동아시아에서 고대 인구 집단의 급격한 팽창이 있었고, 이것이 초기 북쪽 이동을 촉발했을 수 있음을 시사한다. 따라서 우리는 초기 북쪽 이동 시기가 O3-M122 하위 계통들의 분화 시기 추정치와 비슷할 것으로 주장하며, 이 가설은 북중국에서 발굴된 현생 인류의 가장 오래된 화석 기록(27,000년~39,000년 전)에 의해서도 뒷받침된다 (Wu et al. 1995; Jin and Su 2000).
Ding et al. (2000) point out that the southern areas are heavily populated, whereas the northern areas are sparsely populated. Consequently, between-region migration accompanied by high rates of genetic drift and lineage loss in northern groups could account for an asymmetry in lineage composition, which indicates that a northern origin could not be ruled out (Ding et al. 2000). However, in the work by Ding et al. (2000), the southern populations studied are the Tibeto-Burman populations, whose recorded history of recent northern origin, therefore, would blur the south-north divergence that was observed in multiple genetic systems (Zhao et al. 1986; Weng and Yan 1989; Chu et al. 1998; Du et al. 1998; Piazza 1998; Su et al. 1999, 2000a, 2000b; Ding et al. 2000; Jin and Su 2000; Capelli et al. 2001; Karafet et al. 2001). On the other hand, in the past 5,000 years, the major population migration in East Asia is from north to south, because of the expansion of Han culture (Cavalli-Sforza et al. 1994; Wang 1994), which was demonstrated by our recent study (Wen et al. 2004a). When we discuss the earliest migration of modern humans in East Asia before the Neolithic time, our data on O3-M122 polymorphisms revealed that southern populations are probably the ancestral populations. Data from the other two major East Asian-specific haplogroups (O1-M119 and O2-M95) also supported a southern origin of northern populations. These two lineages are prevalent in SEAS (table 1) but rare in NEAS (Wen et al. 2004b).
Ding et al. (2000)은 남쪽 지역은 인구 밀도가 높고 북쪽 지역은 인구 밀도가 낮다고 지적한다. 따라서 북부 그룹에서 높은 빈도로 일어나는 유전자 부동(genetic drift)과 유전자 계통 상실을 동반한 지역 간의 이동이 유전자 계통 구성의 불균형을 설명할 수 있으며, 이는 북쪽 기원 가능성을 배제할 수 없음을 나타낸다 (Ding et al. 2000). 그러나 Ding et al. (2000)의 연구에서 연구된 남부 인구 집단은 티베트-버마(Tibeto-Burman) 인구 집단인데, 이들은 최근에 북쪽에서 기원했다는 기록된 역사를 가지고 있으므로, 여러 유전 시스템에서 관찰된 남북 간의 유전적 차이(분화)를 모호하게 만들 수 있다 (Zhao et al. 1986; Weng and Yan 1989; Chu et al. 1998; Du et al. 1998; Piazza 1998; Su et al. 1999, 2000a, 2000b; Ding et al. 2000; Jin and Su 2000; Capelli et al. 2001; Karafet et al. 2001). 반면에, 지난 5,000년 동안 동아시아의 주요 인구 이동은 한(漢) 문화의 확장으로 인해 북쪽에서 남쪽으로 이루어졌으며 (Cavalli-Sforza et al. 1994; Wang 1994), 이는 우리의 최근 연구에서도 입증되었다 (Wen et al. 2004a). 우리가 신석기 시대 이전의 동아시아 현생 인류의 가장 이른 이동을 논할 때, O3-M122 유전자 다양성에 대한 우리의 자료는 남부 인구 집단이 아마도 조상 인구일 가능성이 높다는 것을 보여주었다. 다른 두 주요 동아시아 특유의 유전자 그룹(O1-M119와 O2-M95)의 자료 역시 북부 인구 집단의 남쪽 기원을 지지했다. 이 두 계통은 남부 동아시아(SEAS)에서 널리 퍼져 있지만 (표 1), 북부 동아시아(NEAS)에서는 드물게 나타난다 (Wen et al. 2004b).
Karafet et al. (2001) found that the CAS, the NEAS, and the SEAS shared some Y haplotypes, and NEAS were more polymorphic than SEAS. However, when we looked into the detailed haplotype distribution described by Karafet et al. (2001), we found that 9 of the 28 haplogroups observed are derived from M175, which comprise 30.5% (230/754) and 79.1% (398/503) of the Y chromosomes of northern and southern East Asian males studied, respectively. It has been shown that M175 is specific to East Asians (Underhill et al. 2000, 2001). Although SEAS were found to have fewer haplogroups than NEAS, the pattern is the opposite within the M175 lineage (haplogroups 28-36 in the study by Karafet et al. [2001]), where SEAS are more polymorphic than NEAS. In SEAS, the haplogroups derived from M175 show higher gene diversity than for NEAS (0.86 vs. 0.67), and their distribution in the NEAS is highly skewed (table 1 in the study by Karafet et al. 2001).
Karafet et al. (2001)은 중앙아시아 인구 집단(CAS), NEAS, SEAS가 일부 Y 유전자형을 공유하고 있으며, NEAS가 SEAS보다 유전적으로 더 다양하다는 것을 발견했다. 그러나 우리가 Karafet et al. (2001)이 제시한 상세한 유전자형 분포를 살펴보니, 관찰된 28개의 유전자 그룹 중 9개가 M175에서 파생된 것이었다. 이 유전자형들은 연구된 북부 및 남부 동아시아 남성의 Y 염색체에서 각각 30.5% (754개 중 230개)와 79.1% (503개 중 398개)를 차지했다. M175는 동아시아인에게 고유하다는 것이 입증되었다 (Underhill et al. 2000, 2001). SEAS가 NEAS보다 유전자 그룹의 수가 적은 것으로 나타났지만, M175 계통 내에서는 그 양상이 반대였다 (Karafet et al. [2001] 연구의 유전자 그룹 28번~36번). 즉, SEAS가 NEAS보다 더 다양했다. SEAS에서는 M175에서 파생된 유전자 그룹이 NEAS보다 높은 유전자 다양성(0.86 대 0.67)을 보였으며, NEAS에서의 분포는 매우 치우쳐 있었다 (Karafet et al. 2001 연구의 표 1).
On the other hand, it would be misleading to interpret data from populations with a known history of recent population admixture (<1,000 years ago [Wang 1994]). For example, Hui and Uygurs, studied by Karafet et al. (2001), are recently established NEAS with various degrees of admixture with CAS. Mongolians have constant genetic exchange with CAS and North Asian (Siberian) populations. Consequently, the claimed larger number of Y-chromosome haplogroups observed in NEAS by Karafet et al. (2001) is in fact a false impression due to recent population admixture. This pattern was clearly reflected by frequent occurrence of haplogroups derived from M45 (haplogroups 37-45, European specific) (Semino et al. 2000) and M89 (haplogroups 20-24, highly prevalent in Europe, the Middle East, Central Asia, and the Indian subcontinent [Semino et al. 2000; Ramana et al. 2001; Wells et al. 2001]) lineages in NEAS, whereas they are almost absent in SEAS (Su et al. 1999). When the genetic influence of recent gene flow-that is, the M45 and M89 haplogroups are removed from the analysis, the distribution of East Asian-specific haplogroups in the study by Karafet et al. (2001) indicates that SEAS are ancestral to NEAS.
반면에, 최근 인구 혼합(1,000년 미만 [Wang 1994]) 역사가 알려진 인구 집단의 자료를 해석하는 것은 잘못된 정보를 줄 수 있다. 예를 들어, Karafet et al. (2001)이 연구한 회족(回族, Hui)과 위구르족(Uygur)은 최근에 형성된 NEAS이며, 중앙아시아 인구 집단(CAS)과 다양한 정도로 섞여 있다. 몽골족(Mongolian) 역시 CAS와 북아시아(Siberian) 인구 집단과 꾸준히 유전자를 교환해 왔다. 결과적으로 Karafet et al. (2001)이 NEAS에서 더 많은 Y염색체 유전자 그룹을 관찰했다고 주장한 것은 사실 최근 인구 혼합 때문에 생긴 잘못된 인상이다. 이러한 양상은 유럽 특유의 유전자 그룹인 M45에서 파생된 유전자 그룹(37번~45번) (Semino et al. 2000)과 유럽, 중동, 중앙아시아, 인도 아대륙에서 매우 흔한 M89 계통에서 파생된 유전자 그룹(20번~24번) (Semino et al. 2000; Ramana et al. 2001; Wells et al. 2001)이 NEAS에서는 빈번하게 나타나는 반면, SEAS에서는 거의 나타나지 않는다는 점에서 명확히 드러났다 (Su et al. 1999). 최근의 유전자 흐름, 즉 M45와 M89 유전자 그룹의 유전적 영향을 분석에서 제거하면, Karafet et al. (2001) 연구에서 동아시아 특유의 유전자 그룹 분포는 SEAS가 NEAS의 조상임을 시사한다.
On the basis of the published data and data presented in the present study, we propose that there might be two major reasons that led to the current genetic divergence between SEAS and NEAS. The first is due to the initial founder effect of the early northward migration and subsequent geographic isolation, reflected by the distribution of the O1-M119 and O2-M95 lineages (Su et al. 1999; Wen et al. 2004b). The second is probably due to the relatively recent population admixture in NEAS that introduced Caucasian and Central/Northern Asian Y chromosomes (Jin and Su 2000; Karafet et al. 2001).
발표된 자료와 본 연구에서 제시된 자료를 바탕으로, SEAS와 NEAS 사이의 현재 유전적 차이가 발생한 주요 원인은 크게 두 가지일 수 있다고 제안한다. 첫 번째는 O1-M119와 O2-M95 계통의 분포에서 나타나듯이, 초기 북쪽 이동 시 창시자 효과(founder effect)와 그에 따른 지리적 고립 때문이다 (Su et al. 1999; Wen et al. 2004b). 두 번째는 비교적 최근에 NEAS에서 일어난 인구 혼합으로 인해 코카서스 및 중앙/북아시아 Y 염색체가 유입되었기 때문일 것이다 (Jin and Su 2000; Karafet et al. 2001).
In summary, our data about the East Asian-specific haplogroup O3-M122 indicates a southern origin of the O3-M122 lineage, therefore supporting the hypothesized southern origin of modern humans in East Asia. The initial prehistoric northward migration was estimated at 25,000-30,000 years ago.
요약하면, 동아시아 특유의 유전자 그룹 O3-M122에 대한 우리의 자료는 O3-M122 계통이 남쪽에서 기원했음을 보여주며, 따라서 동아시아 현생 인류의 남쪽 기원 가설을 지지한다. 초기 선사시대의 북쪽 이동은 25,000년~30,000년 전으로 추정된다.
감사의 글
We are thankful to the technical help of Xiao-na Fan and Yi-Chuan Yu. This study was supported by grants from the Chinese Academy of Sciences (KSCX2-SW-121), the National Natural Science Foundation of China (30370755 and 30440018), the Natural Science Foundation of Yunnan Province of China, and the National 973 Project of China (2006CB701506).
우리는 Xiao-na Fan과 Yi-Chuan Yu의 기술적인 도움에 감사한다. 이 연구는 중국과학원(中國科學院, Chinese Academy of Sciences) (KSCX2-SW-121), 중국국가자연과학기금(National Natural Science Foundation of China) (30370755 및 30440018), 중국 운남성(雲南省) 자연과학기금(Natural Science Foundation of Yunnan Province of China), 그리고 중국 국가 973 프로젝트(National 973 Project of China) (2006CB701506)의 연구비 지원을 받았다.
웹 자료
The URL for data presented herein is as follows:
Fluxus, https://www.fluxus-engineering.com/
참고문헌
Ballinger SW, Schurr TG, Torroni A, Gan YY, Hodge JA, Hassan K, Chen KH, Wallace DC (1992) Southeast Asian mitochondrial DNA analysis reveals genetic continuity of ancient Mongoloid migrations. Genetics 130:139-152
Capelli C, Wilson JF, Richards M, Stumpf MPH, Gratrix F, Oppenheimer S, Underhill P, Pascali VL, Ko T-M, Goldstein DB (2001) A predominantly indigenous paternal heritage for the Austronesian-speaking peoples of insular Southeast Asia and Oceania. Am J Hum Genet 68:432-443
Cavalli-Sforza LL, Menozzi P, Piazza A (1994) The history and geography of human genes. Princeton University Press, Princeton
Chu JY, Huang W, Kuang SQ, Wang JM, Xu JJ, Chu ZT, Yang ZQ, Lin KQ, Li P, Wu M, Geng ZC, Tan CC, Du RF, Jin L (1998) Genetic relationship of populations in China. Proc Natl Acad Sci USA 95:11763-11768
Di Giacomo F, Luca F, Popa LO, Akar N, Anagnou N, Banyko J, Brdicka R, et al (2004) Y chromosomal haplogroup J as a signature of the post-Neolithic colonization of Europe. Hum Genet 115:357-371
Ding YC, Wooding S, Harpending HC, Chi HC, Li HP, Fu YX, Pang JF, Yao YG, Yu JG, Moyzis R, Zhang Y (2000) Population structure and history in East Asia. Proc Natl Acad Sci USA 97:14003-14006
Du RF, Xiao CJ, Cavalli-Sforza LL (1998) Genetic distances between Chinese groups calculated on gene frequencies of 38 loci. Sci China Series C 83-89
Dupuy BM, Stenersen M, Egeland T, Olaisen B (2004) Y-chromosomal microsatellite mutation rates: differences in mutation rate between and within loci. Hum Mutat 23:117-124 Hammer MF, Karafet T, Rasanayagam A, Wood ET, Altheide TK, Jenkins T, Griffiths RC, Templeton AR, Zegura SL (1998) Out of Africa and back again: nested cladistic analysis of human Y chromosome variation. Mol Biol Evol 15:427-441
Jin HJ, Kwak KD, Hammer MF, Nakahori Y, Shinka T, Lee JW, Jin F, Jia X, Tyler-Smith C, Kim W (2003) Y-chromosomal DNA haplogroups and their implications for the dual origins of the Koreans. Hum Genet 114:27-35
Jin L, Su B (2000) Natives or immigrants: modern human origin in East Asia. Nat Rev Genet 1:126-133
Jobling MA, Tyler-Smith C (2003) The human Y chromosome: an evolutionary marker comes of age. Nat Rev Genet 4:598-612
Karafet T, Xu L, Du R, Wang W, Feng S, Wells RS, Redd AJ, Zegura SL, Hammer MF (2001) Paternal population history of East Asia: sources, patterns, and microevolutionary processes. Am J Hum Genet 69:615-628
Kayser M, Roewer L, Hedman M, Henke L, Henke J, Brauer S, Krüger C, Krawczak M, Nagy M, Dobosz T, Szibor R, de Knijff P, Stoneking M, Sajantila A (2000) Characteristics and frequency of germline mutations at microsatellite loci from the human Y chromosome, as revealed by direct observation in father/son pairs. Am J Hum Genet 66:1580-1588
Ke Y, Su B, Li H, Chen L, Qi C, Guo X, Huang W, Jin J, Lu D, Jin L. (2001a) Y chromosome evidence for no independent origin of modern human in China. Chinese Sci Bul 46:935-937
Ke Y, Su B, Xiao C, Chen H, Huang W, Chen Z, Chu J, Tan J, Jin L, Lu D (2001b) Y-chromosome haplotype distribution in Han Chinese populations and modern human origin in East Asians. Sci China Series C 44:225-232
Lell JT, Sukernik RI, Starikovskaya YB, Su B, Jin L, Schurr TG, Underhill PA, Wallace DC (2002) The dual origin and Siberian affinities of Native American Y chromosomes. Am J Hum Genet 70:192-206
Nachman MW, Crowell SL (2000) Estimate of the mutation rate per nucleotide in humans. Genetics 156:297-304
Piazza A (1998) Towards a genetic history of China. Nature 395:636-639
Qian Y, Qian B, Su B, Yu J, Ke Y, Chu Z, Shi L, Lu D, Chu J, Jin L (2000) Multiple origins of Tibetan Y chromosomes. Hum Genet 106:453-454
Ramakrishnan U, Mountain JL (2004) Precision and accuracy of divergence time estimates from STR and SNPSTR variation. Mol Biol Evol 21:1960-1971
Ramana GV, Su B, Jin L, Singh L, Wang N, Underhill P, Chakraborty R (2001) Y-chromosome SNP haplotypes suggest evidence of gene flow among caste, tribe, and the migrant Siddi populations of Andhra Pradesh, South India. Eur J Hum Genet 9:695-700
Rootsi S, Magri C, Kivisild T, Benuzzi G, Help H, Bermisheva M, Kutuev I, et al (2004) Phylogeography of Y-chromosome haplogroup I reveals distinct domains of prehistoric gene flow in Europe. Am J Hum Genet 75:128-137
Schneider S, Kueffer JM, Roessli D, Excoffier L (1998) Arlequin: a software for population genetic analysis, Genetics and Biometry Laboratory, University of Geneva, Geneva Semino O, Magri C, Benuzzi G, Lin AA, Al-Zahery N, Battaglia V, Maccioni L, Triantaphyllidis C, Shen P, Oefner PJ, Zhivotovsky LA, King R, Torroni A, Cavalli-Sforza LL, Underhill PA, Santachiara-Benerecetti AS (2004) Origin, diffusion, and differentiation of Y-chromosome haplogroups E and J: inferences on the neolithization of Europe and later migratory events in the Mediterranean area. Am J Hum Genet 74:1023-1034
Semino O, Passarino G, Oefner PJ, Lin AA, Arbuzova S, Beckman LE, De Benedictis G, Francalacci P, Kouvatsi A, Limborska S, Marcikiae M, Mika A, Mika B, Primorac D, Santachiara-Benerecetti AS, Cavalli-Sforza LL, Underhill PA (2000) The genetic legacy of Paleolithic Homo sapiens sapiens in extant Europeans: a Y chromosome perspective. Science 290:1155-1159
Shen P, Wang F, Underhill PA, Franco C, Yang WH, Roxas A, Sung R, Lin AA, Hyman RW, Vollrath D, Davis RW, Cavalli-Sforza LL, Oefner PJ (2000) Population genetic implications from sequence variation in four Y chromosome genes. Proc Natl Acad Sci USA 97:7354-7359
Su B, Jin L, Underhill P, Martinson J, Saha N, McGarvey ST, Shriver MD, Chu J, Oefner P, Chakraborty R, Deka R (2000a) Polynesian origins: insights from the Y chromosome. Proc Natl Acad Sci USA 97:8225-8228
Su B, Xiao C, Deka R, Seielstad MT, Kangwanpong D, Xiao J, Lu D, Underhill P, Cavalli-Sforza L, Chakraborty R, Jin L (2000b) Y chromosome haplotypes reveal prehistorical migrations to the Himalayas. Hum Genet 107:582-590
Su B, Xiao J, Underhill P, Deka R, Zhang W, Akey J, Huang W, Shen D, Lu D, Luo J, Chu J, Tan J, Shen P, Davis R, Cavalli-Sforza L., Chakraborty R, Xiong M, Du R, Oefner P, Chen Z, Jin L (1999) Y-chromosome evidence for a northward migration of modern humans into Eastern Asia during the last Ice Age. Am J Hum Genet 65:1718-1724
Underhill PA, Passarino G, Lin AA, Shen P, Mirazon Lahr M, Foley RA, Oefner PJ, Cavalli-Sforza LL (2001) The phylogeography of Y chromosome binary haplotypes and the origins of modern human populations. Ann Hum Genet 65: 43-62
Underhill PA, Shen P, Lin AA, Jin L, Passarino G, Yang WH, Kauffman E, Bonne-Tamir B, Bertranpetit J, Francalacci P, Ibrahim M, Jenkins T, Kidd JR, Mehdi SQ, Seielstad MT, Wells RS, Piazza A, Davis RW, Feldman MW, Cavalli-Sforza LL, Oefner PJ (2000) Y chromosome sequence variation and the history of human populations. Nat Genet 26:358-361
Wang ZH (1994) [History of nationalities in China.] China Social Science Press, Beijing
Wells RS, Yuldasheva N, Ruzibakiev R, Underhill PA, Evseeva I, Blue-Smith J, Jin L, et al (2001) The Eurasian heartland: a continental perspective on Y-chromosome diversity. Proc Natl Acad Sci USA 98:10244-10249
Wen B, Li H, Gao S, Mao X, Gao Y, Li F, Zhang F, He Y, Dong Y, Zhang Y, Huang W, Jin J, Xiao C, Lu D, Chakraborty R, Su B, Deka R, Jin L (2005) Genetic structure of Hmong-Mien speaking populations in East Asia as revealed by mtDNA lineages. Mol Biol Evol 22:725-734
Wen B, Li H, Lu D, Song X, Zhang F, He Y, Li F, Gao Y, Mao X, Zhang L, Qian J, Tan J, Jin J, Huang W, Deka R, Su B, Chakraborty R, Jin L (2004a) Genetic evidence supports demic diffusion of Han culture. Nature 431:302-305
Wen B, Xie X, Gao S, Li H, Shi H, Song X, Qian T, Xiao C, Jin J, Su B, Lu D, Chakraborty R, Jin L (2004b) Analyses of genetic structure of Tibeto-Burman populations reveals sex-biased admixture in southern Tibeto-Burmans. Am J Hum Genet 74:856-865
Weng ZL, Yan YD (1989) [Analysis of the genetic structure of human populations in China.] Acta Anthropol Sin 8:261-268
Wu HC, Poirier FE, Wu XZ (1995) Human evolution in China: a metric description of the fossils and a review of the sites. Oxford University Press, Oxford, United Kingdom
Yao Y-G, Kong Q-P, Bandelt H-J, Kivisild T, Zhang Y-P (2002) Phylogeographic differentiation of mitochondrial DNA in Han Chinese. Am J Hum Genet 70:635-651
Y Chromosome Consortium (2002) A nomenclature system for the tree of human Y-chromosomal binary haplogroups. Genome Res 12:339-348
Zhao TM, Zhang GL, Zhu YM, Zheng SQ, Lui DY, Chen Q, Zhang X (1986) [The distribution of immunoglobulin Gm allotypes in forty Chinese populations.] Acta Anthropol Sin 6:1-8
Zhivotovsky LA (2001) Estimating divergence time with the use of microsatellite genetic distances: impacts of population growth and gene flow. Mol Biol Evol 18:700-709
Zhivotovsky LA, Underhill PA, Cinnioğlu C, Kayser M, Morar B, Kivisild T, Scozzari R, Cruciani F, Destro-Bisol G, Spedini G, Chambers GK, Herrera RJ, Yong KK, Gresham D, Tournev I, Feldman MW, Kalaydjieva L (2004) The effective mutation rate at Y chromosome short tandem repeats, with application to human population-divergence time. Am J Hum Genet 74:50-61