인용회수: 531 [2024.12.18.현재]
[관련논문]
지난 2000년 동안 중국에서는 남쪽으로의 주요 인구 이동이 있었다[8,29–32]. 특히, 원(Wen) 등[7]은 이러한 이동이 성별 편향적이었으며, 주로 남성이 여성보다 훨씬 더 많이 관여했음을 보여주었다. 따라서 이러한 성별 편향적 유전자 흐름은 현재 인구의 유전 구조에 큰 영향을 미쳤으며, 본 연구에서 관찰된 모계와 부계 계통 간의 차별적인 구조를 초래했다.
[7] Wen B, Li H, Lu D et al: Genetic evidence supports demic diffusion of Han culture. Nature 2004; 431: 302 – 305.
[8] Yao YG, Nie L, Harpending H, Fu YX, Yuan ZG, Zhang YP: Genetic relationship of Chinese ethnic populations revealed by mtDNA sequence diversity. Am J Phys Anthropol 2002; 118: 63 – 76.
[29] Du R, Yip VF: Ethnic Groups in China. Beijing: Science Press, 1993. (in Chinese).
[30] You Z: History of Yunnan Nationalities. Kunming: Yunnan University Press, 1994. (in Chinese).
[31] Wang ZH: History of Nationalities in China. Beijing: China Social Science Press, 1994. (in Chinese).
[32] Ge JX, Wu SD, Chao SJ: Zhongguo Yimin Shi (The Migration History of China). Fuzhou: Fujian People’s Publishing House, 1997. (in Chinese).
[핵심내용]
Genetic evidence supports demic diffusion of Han culture
유전적 증거는 한(漢) 문화가 인구 확산에 의해 전파된 것을 지지한다
Bo Wen1,2, Hui Li1, Daru Lu1, Xiufeng Song1, Feng Zhang1, Yungang He1, Feng Li1, Yang Gao1, Xianyun Mao1, Liang Zhang1, Ji Qian1, Jingze Tan1, Jianzhong Jin1, Wei Huang2, Ranjan Deka3, Bing Su1,3,4, Ranajit Chakraborty3 & Li Jin1,3
- State Key Laboratory of Genetic Engineering and Center for Anthropological Studies, School of Life Sciences and Morgan-Tan International Center for Life Sciences, Fudan University, Shanghai 200433, China
- Chinese National Human Genome Center, Shanghai 201203, China
- Center for Genome Information, Department of Environmental Health, University of Cincinnati, Cincinnati, Ohio 45267, USA
- Key Laboratory of Cellular and Molecular Evolution, Kunming Institute of Zoology, the Chinese Academy of Sciences, Kunming 650223, China
The spread of culture and language in human populations is explained by two alternative models: the demic diffusion model, which involves mass movement of people; and the cultural diffusion model, which refers to cultural impact between populations and involves limited genetic exchange between them1. The mechanism of the peopling of Europe has long been debated, a key issue being whether the diffusion of agriculture and language from the Near East was concomitant with a large movement of farmers1–3. Here we show, by systematically analysing Y-chromosome and mitochondrial DNA variation in Han populations, that the pattern of the southward expansion of Han culture is consistent with the demic diffusion model, and that males played a larger role than females in this expansion. The Han people, who all share the same culture and language, exceed 1.16 billion (2000 census), and are by far the largest ethnic group in the world. The expansion process of Han culture is thus of great interest to researchers in many fields.
인간 집단에서 문화와 언어의 확산은 두 가지 대안적 모델(two alternative models)로 설명된다. 하나는 대규모 인구 이동을 포함하는 인구 확산 모델(demic diffusion model)이고, 다른 하나는 집단 간의 문화적 영향을 의미하며 제한적인 유전적 교환만을 수반하는 문화 확산 모델(cultural diffusion model)이다[1]. 유럽 인구의 형성 메커니즘은 오랫동안 논쟁의 대상이 되어왔으며, 근동에서 농업과 언어의 확산이 대규모 농부 이동과 동시에 이루어졌는지가 핵심 쟁점이었다[1–3]. 본 연구에서는 한족 집단의 Y 염색체와 mtDNA 변이를 체계적으로 분석하여, 한족 문화의 남하 확산 패턴이 인구 확산 모델과 일치하며, 이 확산에서 남성이 여성보다 더 큰 역할을 했음을 보여준다. 한족은 동일한 문화와 언어를 공유하며, 전 세계에서 가장 큰 민족 집단으로, 2000년 인구 조사 기준으로 11억 6천만 명을 초과한다. 따라서 한족 문화의 확산 과정은 여러 학문 분야 연구자들에게 매우 큰 관심을 끌고 있다.
According to the historical records, the Hans were descended from the ancient Huaxia tribes of northern China, and the Han culture (that is, the language and its associated cultures) expanded into southern China—the region originally inhabited by the southern natives, including those speaking Daic, Austro-Asiatic and Hmong-Mien languages—in the past two millennia4,5. Studies on classical genetic markers and microsatellites show that the Han people, like East Asians, are divided into two genetically differentiated groups, northern Han and southern Han6,8, separated approximately by the Yangtze river9. Differences between these groups in terms of dialect and customs have also been noted10. Such observations seem to support a mechanism involving primarily cultural diffusion and assimilation (the cultural diffusion model) in Han expansion towards the south. However, the substantial sharing of Y-chromosome and mitochondrial lineages between the two groups11,12 and the historical records describing the expansion of Han people5 contradict the cultural diffusion model hypothesis of Han expansion. In this study, we aim to examine the alternative hypothesis; that is, that substantial population movements occurred during the expansion of Han culture (the demic diffusion model).
역사 기록에 따르면, 한족은 중국 북부의 고대 화하(華夏) 부족에서 기원했으며, 한족 문화(즉, 언어와 그와 관련된 문화)는 지난 2000년 동안 다이어족, 오스트로아시아족, 먀오-야오족 언어를 사용하는 남방 원주민들이 거주했던 남중국 지역으로 확산되었다고 한다[4,5]. 고전적 유전 표지와 마이크로새틀라이트에 대한 연구는 동아시아인처럼 한족도 북방 한족과 남방 한족이라는 두 가지 유전적으로 구분된 집단으로 나뉘며, 양자강을 경계로 대략적으로 구분된다고 보여준다[6,8,9]. 두 집단은 방언과 관습 면에서도 차이를 보인다고 알려져 있다[10]. 이러한 관찰은 한족의 남하 확산 과정이 주로 문화적 확산과 동화(문화 확산 모델)에 의해 이루어졌다는 메커니즘을 지지하는 것처럼 보인다. 그러나 두 집단 간 Y 염색체와 mtDNA 계통의 상당한 공유[11,12], 그리고 한족 확산에 대한 역사적 기록[5]은 한족 확산에 대한 문화 확산 모델 가설에 모순된다. 본 연구에서는 대규모 인구 이동이 한족 문화 확산 과정에서 발생했다는 대안 가설(인구 확산 모델)을 검토하고자 한다.
To test this hypothesis, we compared the genetic profiles of southern Hans with their two parental population groups: northern Hans and southern natives, which include the samples of Daic, Hmong-Mien and Austro-Asiatic speaking populations currently residing in China, and in some cases its neighbouring countries. Genetic variation in both the non-recombining region of the Y chromosome (NRY) and mitochondrial DNA (mtDNA)13–16 were surveyed in 28 Han populations from most of the provinces in China (see Fig. 1 and Supplementary Table 1 for details).
이 가설을 검증하기 위해, 우리는 남방 한족의 유전적 프로파일을 두 개의 부모 집단인 북방 한족과 남방 원주민 집단과 비교했다. 남방 원주민 집단에는 중국 및 일부 인접 국가에 현재 거주하는 따이어족, 먀오-야오족, 오스트로아시아족 언어를 사용하는 집단의 샘플이 포함된다. Y 염색체의 비재조합 영역(NRY)과 미토콘드리아 DNA(mtDNA)의 유전적 변이를 조사했으며[13–16], 중국 대부분의 성(省)에서 온 28개 한족 집단을 대상으로 연구를 진행했다(자세한 내용은 그림 1 및 보충 표 1 참조).

Figure 1. Geographic distribution of sampled populations. Shown are the three waves of north-to-south migrations according to historical record. The identifications of populations are given in Supplementary Table 1. Populations 1–14 are northern Hans, and 15–28 are southern Hans. The solid, dashed and dotted arrows refer to the first, second and third waves of migrations, respectively. The first wave involving 0.9 million (approximately one-sixth of the southern population at that time) occurred during the Western Jin Dynasty (AD 265–316); the second migration, more extensive than the first, took place during the Tang Dynasty (AD 618–907); and the third wave, including ,5 million immigrants, occurred during the Southern Song Dynasty (AD 1127–1279).
그림 1. 샘플링된 집단의 지리적 분포. 그림은 역사 기록에 따른 북방에서 남방으로의 세 차례 이주 물결을 보여준다. 집단의 명칭은 보충 표 1에 명시되어 있다. 집단 1–14는 북방 한족, 15–28은 남방 한족이다. 실선, 점선, 점점선은 각각 첫 번째, 두 번째, 세 번째 이주 물결을 나타낸다. 첫 번째 이주는 서진(西晉, AD 265–316) 시기에 약 90만 명(당시 남방 인구의 약 6분의 1)이 참여했으며, 두 번째 이주는 첫 번째보다 더 광범위하게 당(唐, AD 618–907) 시기에 이루어졌다. 세 번째 이주는 남송(南宋, AD 1127–1279) 시기에 약 500만 명의 이주민이 포함되었다.
On the paternal side, southern Hans and northern Hans share similar frequencies of Y-chromosome haplogroups (Supplementary Table 2), which are characterized by two haplogroups carrying the M122-C mutations (O3-M122 and O3e-M134) that are prevalent in almost all Han populations studied (mean and range: 53.8%, 37–71%; 54.2%, 35–74%, for northern and southern Hans, respectively). Haplogroups carrying M119-C (O1* and O1b) and/or M95-T (O2a* and O2a1) (following the nomenclature of the Y Chromosome Consortium) which are prevalent in southern natives, are more frequent in southern Hans (19%, 3–42%) than in northern Hans (5%, 1–10%). In addition, haplogroups O1b-M110, O2a1-M88 and O3d-M7, which are prevalent in southern natives17, were only observed in some southern Hans (4% on average), but not in northern Hans. Therefore, the contribution of southern natives in southern Hans is limited, if we assume that the frequency distribution of Y lineages in southern natives represents that before the expansion of Han culture that started 2,000 yr ago5. The results of analysis of molecular variance (AMOVA) further indicate that northern Hans and southern Hans are not significantly different in their Y haplogroups (F ST ¼ 0.006, P . 0.05), demonstrating that southern Hans bear a high resemblance to northern Hans in their male lineages.
부계 측면에서, 남방 한족과 북방 한족은 Y 염색체 하플로그룹의 빈도가 유사하다(보충 표 2). 이는 거의 모든 한족 집단에서 흔히 관찰되는 M122-C 돌연변이를 가진 두 개의 하플로그룹(O3-M122와 O3e-M134)에 의해 특징지어진다(북방 한족의 평균 및 범위: 53.8%, 37–71%; 남방 한족의 평균 및 범위: 54.2%, 35–74%). 남방 원주민 집단에서 흔히 발견되는 M119-C(O1*와 O1b) 및/또는 M95-T(O2a*와 O2a1)를 포함한 하플로그룹은 남방 한족(19%, 3–42%)에서 북방 한족(5%, 1–10%)보다 더 높은 빈도를 보인다. 또한 남방 원주민에서 흔히 발견되는 하플로그룹(O1b-M110, O2a1-M88, O3d-M7)은 일부 남방 한족(평균 4%)에서만 관찰되었으며, 북방 한족에서는 전혀 관찰되지 않았다. 따라서, 한족 문화가 약 2,000년 전에 확산되기 이전의 남방 원주민 Y 염색체 계통 분포가 현재와 동일하다고 가정한다면, 남방 원주민의 남방 한족에 대한 기여는 제한적이다. 분자 분산 분석(AMOVA) 결과는 북방 한족과 남방 한족이 Y 염색체 하플로그룹에서 유의미한 차이를 보이지 않음을 추가로 보여준다(FST=0.006, P>0.05). 이는 남방 한족이 부계 계통에서 북방 한족과 높은 유사성을 지니고 있음을 입증한다.
On the maternal side, however, the mtDNA haplogroup distribution showed substantial differentiation between northern Hans and southern Hans (Supplementary Table 3). The overall frequencies of the northern East Asian-dominating haplogroups (A, C, D, G, M8a, Yand Z) are much higher in northern Hans (55%, 49–64%) than are those in southern Hans (36%, 19–52%). In contrast, the frequency of the haplogroups that are dominant lineages (B, F, R9a, R9b and N9a) in southern natives12,14,18 is much higher in southern (55%, 36–72%) than it is in northern Hans (33%, 18–42%). Northern and southern Hans are significantly different in their mtDNA lineages (F ST ¼ 0.006, P, 1025). Although the F ST values between northern and southern Hans are similar for mtDNA and the Y chromosome, F ST accounts for 56% of the total among-population variation for mtDNA but only accounts for 18% for the Y chromosome.
모계 측면에서는 mtDNA 하플로그룹 분포가 북방 한족과 남방 한족 사이에서 상당한 차이를 보였다(보충 표 3). 북동아시아에서 우세한 하플로그룹(A, C, D, G, M8a, Y, Z)의 전체 빈도는 북방 한족(55%, 49–64%)이 남방 한족(36%, 19–52%)보다 훨씬 높다. 반대로, 남방 원주민에서 우세한 계통(B, F, R9a, R9b, N9a)을 포함한 하플로그룹의 빈도는 남방 한족(55%, 36–72%)에서 북방 한족(33%, 18–42%)보다 훨씬 높다[12,14,18]. 북방 한족과 남방 한족은 mtDNA 계통에서 유의미한 차이를 보인다(FST=0.006, P<10⁻⁵). mtDNA와 Y 염색체의 FST 값은 유사하지만, FST는 mtDNA의 집단 간 총 변이의 56%를 설명하는 반면, Y 염색체에서는 18%만을 설명한다.
A principal component analysis is consistent with the observation based on the distribution of the haplogroups in Han populations. For the NRY, almost all Han populations cluster together in the upper right-hand part of Fig. 2a. Northern Hans and southern natives are separated by the second principal component (PC2) and southern Hans’ PC2 values lie between northern Hans and southern natives but are much closer to northern Hans (northern Han, 0.58 ^ 0.01; southern Han, 0.46 ^ 0.03; southern native, 20.32 ^ 0.05), implying that the southern Hans are paternally similar to northern Hans, with limited influence from southern natives. In contrast, for mtDNA, northern Hans and southern natives are distinctly separated by PC2 (Fig. 2b), and southern Hans are located between them but are closer to southern natives (northern Han, 0.56 ^ 0.02; southern Han, 0.09 ^ 0.06; southern native, 20.23 ^ 0.04), indicating a much more substantial admixture in southern Hans’ female gene pool than in its male counterpart.
주성분 분석 결과는 한족 집단의 하플로그룹 분포에 기반한 관찰과 일치한다. NRY(Y 염색체 비재조합 영역)의 경우, 거의 모든 한족 집단이 그림 2a의 오른쪽 상단에 함께 군집을 이루고 있다. 북방 한족과 남방 원주민은 두 번째 주성분(PC2)에 의해 구분되며, 남방 한족의 PC2 값은 북방 한족과 남방 원주민 사이에 위치하지만 북방 한족에 훨씬 더 가깝다(북방 한족: 0.58 ± 0.01, 남방 한족: 0.46 ± 0.03, 남방 원주민: -0.32 ± 0.05). 이는 남방 한족이 부계 측면에서 북방 한족과 유사하며, 남방 원주민의 영향은 제한적임을 시사한다. 반면, mtDNA의 경우, 북방 한족과 남방 원주민은 PC2에서 뚜렷하게 분리되며(그림 2b), 남방 한족은 그들 사이에 위치하지만 남방 원주민에 더 가까운 것으로 나타났다(북방 한족: 0.56 ± 0.02, 남방 한족: 0.09 ± 0.06, 남방 원주민: -0.23 ± 0.04). 이는 남방 한족의 여성 유전자 풀에서 남성 유전자 풀보다 훨씬 더 많은 혼합이 있었음을 나타낸다.

Figure 2. Principal component plot. a, b, Plots are of Y-chromosome (a) and mtDNA (b) haplogroup frequency. Population groups: H-M, Hmong-Mien; DAC, Daic; A-A, Austro-Asiatic; SH, southern Han; NH, northern Han.
그림 2. 주성분 분석 그래프. (a, b) 각각 Y-염색체 (a) 및 mtDNA (b) 하플로그룹 빈도를 나타낸다. 인구 집단 그룹: H-M, 묘-야오족; DAC, 다이족; A-A, 오스트로아시아틱족; SH, 남방 한족; NH, 북방 한족.
The relative contribution of the two parental populations (northern Hans and southern natives) in southern Hans was estimated by two different statistics19,20, which are less biased than other statistics for single-locus data21 (Table 1).
남방 한족에서 두 부모 집단(북방 한족과 남방 원주민)의 상대적 기여도는 단일 유전자좌 데이터에 대한 다른 통계보다 편향이 적은 두 가지 통계 방법으로 추정되었다[19,20,21](표 1 참조).
Table 1. Northern Han admixture proportion in southern Hans
표 1. 남방 한족 내 북방 한족 혼합 비율
M BE and M RH refer to the statistics described in refs 20 and 19, respectively. The standard error of M BE was obtained by bootstrap with 1,000 replications. The proportions of contribution from northern Hans were estimated using northern Hans and southern natives as the parental populations of the southern Hans. It was assumed that the allele frequency in the southern natives remained unchanged before and after the admixture, which started about 2,000 yr ago, and the genetic exchange between northern Hans and southern natives has been limited. In fact, the gene flow from northern Hans to southern natives has been larger than that from southern natives to northern Hans; therefore, the level of admixture presented in this table is underestimated and is without proper adjustment. The demic expansion of Han would have been more pronounced than was observed in this study.
M BE와 M RH는 각각 문헌 [20]과 [19]에 설명된 통계를 나타낸다. M BE의 표준 오차는 1,000회 부트스트랩 복제를 통해 계산되었다. 남방 한족의 부모 집단으로 북방 한족과 남방 원주민을 사용하여 북방 한족의 기여 비율을 추정했다. 혼합은 약 2,000년 전에 시작되었으며, 남방 원주민 내 대립유전자 빈도가 혼합 전후로 변하지 않았고, 북방 한족과 남방 원주민 간의 유전자 교환이 제한적이었다고 가정했다. 실제로 북방 한족에서 남방 원주민으로의 유전자 흐름보다 남방 원주민에서 북방 한족으로의 유전자 흐름이 더 적었다. 따라서 이 표에 제시된 혼합 수준은 과소평가된 것이며 적절한 조정을 포함하지 않는다. 한족의 인구 확산은 본 연구에서 관찰된 것보다 더 뚜렷했을 것이다.
The estimations of the admixture coefficient (M, proportion of northern Han contribution) from the two methods are highly consistent (for the Y chromosome, r ¼ 0.922, P, 0.01; for mtDNA, r ¼ 0.970, P, 0.01). For the Y chromosome, all southern Hans showed a high proportion of northern Han contribution (M BE: 0.82 ^ 0.14, range from 0.54 to 1; M RH: 0.82 ^ 0.12, range from 0.61 to 0.97) (see refs 20 and 19 for definitions of M BE and M RH, respectively) indicating that males from the northern Hans are the primary contributor to the gene pool of the southern Hans. In contrast, northern Hans and southern natives contributed almost equally to the southern Hans’ mtDNA gene pool (M BE: 0.56 ^ 0.24 [0.15, 0.95]; M RH: 0.50 ^ 0.26 [0.07, 0.91]). The contribution of northern Hans to southern Hans is significantly higher in the paternal lineage than in the maternal lineage collectively (t-test, P, 0.01) or individually (11 out of 13 populations for M BE, and 13 out of 13 populations for M RH: P, 0.01, assuming a null binomial distribution with equal male and female contributions), indicating a strong sex-biased population admixture in southern Hans. The proportions of northern Han contribution (M) in southern Hans showed a clinal geographic pattern, which decreases from north to south. The Ms in southern Hans are positively correlated with latitude (r 2 ¼ 0.569, P, 0.01) for mtDNA, but are not significant for the Y chromosome (r 2 ¼ 0.072, P . 0.05), because the difference of Ms in the paternal lineage among southern Hans is too small to create a statistically significant trend.
두 방법을 사용한 혼합 계수(M, 북방 한족 기여 비율)의 추정치는 높은 일관성을 보였다(Y 염색체: r = 0.922, P < 0.01; mtDNA: r = 0.970, P < 0.01). Y 염색체의 경우, 모든 남방 한족에서 북방 한족의 기여도가 높게 나타났다(M_BE: 0.82 ± 0.14, 범위 0.54–1; M_RH: 0.82 ± 0.12, 범위 0.61–0.97). 이는 북방 한족 남성이 남방 한족 유전자 풀에 주요 기여자임을 시사한다. 반면, 남방 한족의 mtDNA 유전자 풀에서는 북방 한족과 남방 원주민이 거의 동일한 기여를 한 것으로 나타났다(M_BE: 0.56 ± 0.24 [0.15, 0.95]; M_RH: 0.50 ± 0.26 [0.07, 0.91]). 북방 한족의 남방 한족에 대한 기여는 부계 계통에서 모계 계통보다 유의미하게 높았다(집합적으로 t-검정, P < 0.01; 개별적으로 M_BE 기준 13개 집단 중 11개 집단, M_RH 기준 13개 집단 모두 P < 0.01; 남성과 여성의 기여가 동일하다는 이항분포 가정하). 이는 남방 한족에서 성별에 따른 강한 편향이 있는 인구 혼합이 있음을 나타낸다. 남방 한족에서 북방 한족 기여 비율(M)은 북쪽에서 남쪽으로 갈수록 감소하는 지리적 경향을 보였다. 남방 한족의 M은 mtDNA의 경우 위도와 양의 상관관계를 보였다(r² = 0.569, P < 0.01). 그러나 Y 염색체의 경우 기여도 차이가 통계적으로 유의미한 경향을 만들기에는 너무 작아 상관관계가 유의하지 않았다(r² = 0.072, P > 0.05).
We provide two lines of evidence supporting the demic diffusion hypothesis for the expansion of Han culture. First, almost all Han populations bear a high resemblance in Y-chromosome haplogroup distribution, and the result of principal component analysis indicated that almost all Han populations form a tight cluster in their Y chromosome. Second, the estimated contribution of northern Hans to southern Hans is substantial in both paternal and maternal lineages and a geographic cline exists for mtDNA. It is noteworthy that the expansion process was dominated by males, as is shown by a greater contribution to the Y-chromosome than the mtDNA from northern Hans to southern Hans. A sex-biased admixture pattern was also observed in Tibeto-Burman-speaking populations22.
우리는 한족 문화 확산에 대한 인구 확산 가설을 뒷받침하는 두 가지 증거를 제시한다. 첫째, 거의 모든 한족 집단이 Y 염색체 하플로그룹 분포에서 높은 유사성을 보이며, 주성분 분석 결과 또한 거의 모든 한족 집단이 Y 염색체에서 밀집된 군집을 형성함을 보여준다. 둘째, 북방 한족이 남방 한족에 기여한 비율은 부계와 모계 계통 모두에서 상당하며, mtDNA에 대해 지리적 경향(cline)이 존재한다. 특히, 북방 한족이 남방 한족에 미친 기여도가 mtDNA보다 Y 염색체에서 더 크다는 점에서, 확산 과정이 남성에 의해 주도되었음을 알 수 있다. 성별에 따른 혼합 패턴은 티베트-버마어 사용 집단에서도 관찰된 바 있다[22].
According to the historical records, there were continuous southward movements of Han people due to warfare and famine in the north, as illustrated by three waves of large-scale migrations (Fig. 1). Aside from these three waves, other smaller southward migrations also occurred during almost all periods in the past two millennia. Our genetic observation is thus in line with the historical accounts. The massive movement of the northern immigrants led to a change in genetic makeup in southern China, and resulted in the demographic expansion of Han people as well as their culture. Except for these massive population movements, gene flow between northern Hans, southern Hans and southern natives also contributed to the admixture which shaped the genetic profile of the extant populations.
역사 기록에 따르면, 북방에서의 전쟁과 기근으로 인해 한족의 지속적인 남하가 이루어졌으며, 이는 세 차례의 대규모 이주 물결로 나타난다(그림 1 참조). 이 세 차례의 이주 외에도, 지난 2000년 동안 거의 모든 시기에 걸쳐 소규모 남하 이주가 이루어졌다. 따라서 우리의 유전적 관찰은 이러한 역사적 기록과 일치한다. 북방 이주민들의 대규모 이동은 남중국의 유전적 구성을 변화시켰고, 한족과 그 문화의 인구 확산으로 이어졌다. 이 대규모 인구 이동 외에도, 북방 한족, 남방 한족, 남방 원주민 간의 유전자 흐름은 현재 인구의 유전적 프로파일을 형성하는 데 기여했다.
방법론 Methods
샘플 Samples
Blood samples of 871 unrelated anonymous individuals from 17 Han populations were collected across China. Genomic DNA was extracted by the phenol-chloroform method. By integrating the additional data obtained from the literatures on the Y chromosome and on mtDNA variation, the final sample sizes for analysis expanded to 1,289 individuals (23 Han populations) for the Y chromosome and 1,119 individuals (23 Han populations) for mtDNA. These samples encompass most of the provinces in China (Fig. 1 and Supplementary Table 1).
중국 전역의 17개 한족 집단에서 871명의 비혈연 익명의 개인으로부터 혈액 샘플을 수집했다. 게놈 DNA는 페놀-클로로포름 방법을 사용하여 추출했다. Y 염색체와 mtDNA 변이에 대한 문헌에서 추가 데이터를 통합함으로써, 최종 분석 샘플 수는 Y 염색체의 경우 23개 한족 집단에서 1,289명, mtDNA의 경우 23개 한족 집단에서 1,119명으로 확장되었다. 이 샘플은 중국 대부분의 성(省)을 포함한다(그림 1 및 보충 표 1 참조).
유전자 마커 Genetic markers
Thirteen bi-allelic Y-chromosome markers, YAP, M15, M130, M89, M9, M122, M134, M119, M110, M95, M88, M45 and M120 were typed by polymerase chain reaction- restriction-fragment length polymorphism methods11. These markers are highly informative in East Asians23 and define 13 haplogroups following the Y Chromosome Consortium nomenclature24. The HVS-1 of mtDNA and eight coding region variations, 9-bp deletion, 10397 AluI, 5176 AluI, 4831 HhaI, 13259 HincII, 663 HaeIII, 12406 HpaI and 9820 HinfI were sequenced and genotyped as in our previous report22. Both the HVS-1 motif and the coding region variations were used to infer haplogroups following the phylogeny of East Asian mtDNAs18.
13개의 이대립 Y 염색체 마커(YAP, M15, M130, M89, M9, M122, M134, M119, M110, M95, M88, M45, M120)는 중합효소 연쇄 반응-제한효소 절편 길이 다형성(PCR-RFLP) 방법으로 분석되었다[11]. 이 마커들은 동아시아에서 매우 유익한 정보를 제공하며[23], Y 염색체 컨소시엄의 명명법에 따라 13개의 하플로그룹을 정의한다[24]. mtDNA의 HVS-1과 9-bp 결실, 10397 AluI, 5176 AluI, 4831 HhaI, 13259 HincII, 663 HaeIII, 12406 HpaI, 9820 HinfI를 포함한 8개의 코딩 영역 변이를 서열 분석 및 유전자형 분석했다. 이는 이전 연구에서 보고된 방법을 따랐다[22]. HVS-1 모티프와 코딩 영역 변이를 모두 사용하여 동아시아 mtDNA 계통수를 기반으로 하플로그룹을 추론했다[18].
데이터 분석 Data analysis
Population relationship was investigated by principal component analysis, which was conducted using mtDNA and Y-chromosome haplogroup frequencies and SPSS10.0 software (SPSS Inc.). The genetic difference between northern and southern Hans was tested by AMOVA25, using ARLEQUIN software26. ADMIX 2.0 (ref. 27) and LEADMIX21 software were used to estimate the level of admixture of the northern Hans and southern natives in the southern Han populations, using two different statistics19–20. The selection of parental populations is critical for appropriate estimation of admixture proportion28,29 and we were careful to minimize bias by using large data sets across East Asia. In this analysis, the average haplogroup frequencies (for Y-chromosome or mtDNA markers, respectively) of northern Hans (arithmetic mean of 10 northern Hans) were taken for the northern parental population. The frequency of southern natives was estimated by the average of three groups including Austro-Asiatic (NRY, 6 populations; mtDNA, 5 populations), Daic (NRY, 22 populations; mtDNA, 11 populations) and Hmong-Mien (NRY, 18 populations; mtDNA, 14 populations). The geographic pattern of Han populations was revealed by the linear regression analysis of admixture proportion against the latitudes of samples1,3.
인구 간 관계는 mtDNA 및 Y 염색체 하플로그룹 빈도를 사용하여 주성분 분석(PCA)으로 조사했으며, SPSS10.0 소프트웨어(SPSS Inc.)를 사용하여 수행했다. 북방 한족과 남방 한족 간의 유전적 차이는 ARLEQUIN 소프트웨어[26]를 사용하여 분산 분석(AMOVA)[25]로 검정했다. ADMIX 2.0[27] 및 LEADMIX[21] 소프트웨어를 사용하여 두 가지 다른 통계[19-20]를 통해 남방 한족 집단에서 북방 한족과 남방 원주민의 혼합 수준을 추정했다. 혼합 비율을 적절히 추정하려면 부모 집단의 선택이 중요하며[28,29], 동아시아 전역에서 대규모 데이터 세트를 사용해 편향을 최소화하려고 했다. 이 분석에서는 북방 부모 집단으로 북방 한족 10개 집단의 산술 평균을 사용해 북방 한족의 평균 하플로그룹 빈도를 추정했다(Y 염색체 또는 mtDNA 마커에 대해 각각). 남방 원주민의 빈도는 오스트로아시아틱(NRY 6개 집단, mtDNA 5개 집단), 다이족(NRY 22개 집단, mtDNA 11개 집단), 묘-야오족(NRY 18개 집단, mtDNA 14개 집단) 세 그룹의 평균을 사용해 추정했다. 한족 집단의 지리적 패턴은 샘플 위도를 기준으로 혼합 비율에 대해 선형 회귀 분석을 통해 분석했다[1,3].
1. Cavalli-Sforza, L. L., Menozzi, P. & Piazza, A. The History and Geography of Human Genes (Princeton Univ. Press, Princeton, 1994).
2. Sokal, R., Oden, N. L. & Wilson, C. Genetic evidence for the spread of agriculture in Europe by demic diffusion. Nature 351, 143–145 (1991).
3. Chikhi, L. et al. Y genetic data support the Neolithic demic diffusion model. Proc. Natl Acad. Sci. USA 99, 11008–11013 (2002).
4. Fei, X. T. The Pattern of Diversity in Unity of the Chinese Nation (Central Univ. for Nationalities Press, Beijing, 1999).
5. Ge, J. X., Wu, S. D. & Chao, S. J. Zhongguo yimin shi (The Migration History of China) (Fujian People’s Publishing House, Fuzhou, China, 1997).
6. Zhao, T. M. & Lee, T. D. Gm and Km allotypes in 74 Chinese populations: a hypothesis of the origin of the Chinese nation. Hum. Genet. 83, 101–110 (1989).
7. Du, R. F., Xiao, C. J. & Cavalli-Sforza, L. L. Genetic distances calculated on gene frequencies of 38 loci. Sci. China 40, 613 (1997).
8. Chu, J. Y. et al. Genetic relationship of populations in China. Proc. Natl Acad. Sci. USA 95, 11763–11768 (1998).
9. Xiao, C. J. et al. Principal component analysis of gene frequencies of Chinese populations. Sci. China 43, 472–481 (2000).
10. Xu, Y. T. A brief study on the origin of Han nationality. J. Centr. Univ. Natl 30, 59–64 (2003).
11. Su, B. et al. Y chromosome haplotypes reveal prehistorical migrations to the Himalayas. Hum. Genet. 107, 582–590 (2000).
12. Yao, Y. G. et al. Phylogeographic differentiation of mitochondrial DNA in Han Chinese. Am. J. Hum. Genet. 70, 635–651 (2002).
13. Cavalli-Sforza, L. L. & Feldman, M. W. The application of molecular genetic approaches to the study of human evolution. Nature Genet. 33, 266–275 (2003).
14. Wallace, D. C., Brown, M. D. & Lott, M. T. Nucleotide mitochondrial DNA variation in human evolution and disease. Gene 238, 211–230 (1999).
15. Underhill, P. A. et al. Y chromosome sequence variation and the history of human populations. Nature Genet. 26, 358–361 (2000).
16. Jobling, M. A. & Tyler-Smith, C. The human Y chromosome: an evolutionary marker comes of age. Nature Rev. Genet. 4, 598–612 (2003).
17. Su, B. et al. Y-chromosome evidence for a northward migration of modern humans into eastern Asia during the last ice age. Am. J. Hum. Genet. 65, 1718–1724 (1999).
18. Kivisild, T. et al. The emerging limbs and twigs of the East Asian mtDNA tree. Mol. Biol. Evol. 19, 1737–1751 (2002).
19. Roberts, D. F. & Hiorns, R. W. Methods of analysis of the genetic composition of a hybrid population. Hum. Biol. 37, 38–43 (1965).
20. Bertorelle, G. & Excoffier, L. Inferring admixture proportions from molecular data. Mol. Biol. Evol. 15, 1298–1311 (1998).
21. Wang, J. Maximum-likelihood estimation of admixture proportions from genetic data. Genetics 164, 747–765 (2003).
22. Wen, B. et al. Analyses of genetic structure of Tibeto-Burman populations revealed a gender-biased admixture in southern Tibeto-Burmans. Am. J. Hum. Genet. 74, 856–865 (2004).
23. Jin, L. & Su, B. Natives or immigrants: modern human origin in East Asia. Nature Rev. Genet. 1, 126–133 (2000).
24. The Y Chromosome Consortium, A nomenclature system for the tree of human Y-chromosomal binary haplogroups. Genome Res. 12, 339–348 (2002).
25. Excoffier, L., Smouse, P. E. & Quattro, J. M. Analysis of molecular variance inferred from metric distances among DNA haplotypes: application to human mitochondrial DNA restriction data. Genetics 131, 479–491 (1992).
26. Schneider, S., et al. Arlequin: Ver. 2.000. A software for population genetic analysis. (Genetics and Biometry Laboratory, Univ. of Geneva, Geneva, 2000).
27. Dupanloup, I. & Bertorelle, G. Inferring admixture proportions from molecular data: extension to any number of parental populations. Mol. Biol. Evol. 18, 672–675 (2001).
28. Chakraborty, R. Gene admixture in human populations: Models and predictions. Yb. Phys. Anthropol. 29, 1–43 (1986).
29. Sans, M. et al. Unequal contributions of male and female gene pools from parental populations in the African descendants of the city of Melo, Uruguay. Am. J. Phys. Anthropol. 118, 33–44 (2002).