출처:

Chen, P. et al. (2019) ‘Population genetic analysis of modern and ancient DNA reveals the origin and population history of the northern Han Chinese’, Frontiers in Genetics, 10, 1045.

 

Population Genetic Analysis of Modern and Ancient DNA Variations Yields New Insights Into the Formation, Genetic Structure, and Phylogenetic Relationship of Northern Han Chinese

DNA, 북방 한족(北方漢族)의 기원과 유전적 비밀을 풀다

Pengyu Chen1,2†, Jian Wu1,2†, Li Luo1,2†, Hongyan Gao1,2, Mengge Wang³, Xing Zou³, Yingxiang Li⁴, Gang Chen4, Haibo Luo², Limei Yu⁵, Yanyan Han⁶, Fuquan Jia7* and Guanglin He3*

진붕우(陳鵬宇)1,2†, 오건(吳堅)1,2†, 라리(羅麗)1,2†, 고홍연(高洪雁)1,2, 왕몽격(王夢鴿)³, 추성(鄒星)³, 이영상(李穎翔)⁴, 진강(陳剛)4, 라해파(羅海波)², 유려미(余麗梅)⁵, 한연연(韓艳艳)⁶, 가복전(賈富寬)⁷* 및 하광림(何光林)³*

¹ Center of Forensic Expertise, Affiliated Hospital of Zunyi Medical University, Zunyi, China, ² Department of Forensic Medicine, Zunyi Medical University, Zunyi, China, ³ Institute of Forensic Medicine, West China School of Basic Medical Sciences & Forensic Medicine, Sichuan University, Chengdu, China, ⁴ Department of Bioinformatics, WeGene, Shenzhen, China, ⁵ Key Laboratory of Cell Engineering in Guizhou Province, Affiliated Hospital of Zunyi Medical University, Zunyi, China, ⁶ Department of Nutrition and Food Hygiene, School of Public Health, Zunyi Medical University, Zunyi, China, ⁷ Department of Forensic Medicine, Inner Mongolia Medical University, Hohhot, China

¹ 준의의과대학(遵義醫科大學) 부속병원 법의학 전문 센터, 준의(遵義), 중국, ² 준의의과대학(遵義醫科大學) 법의학과, 준의(遵義), 중국, ³ 사천대학(四川大學) 서화기초의학 및 법의학원 법의학 연구소, 성도(成都), 중국, ⁴ 위진(WeGene) 생물정보학과, 심천(深圳), 중국, ⁵ 준의의과대학(遵義醫科大學) 부속병원 귀주성(貴州省) 세포공학중점실험실, 준의(遵義), 중국, ⁶ 준의의과대학(遵義醫科大學) 공중보건대학 영양 및 식품위생학과, 준의(遵義), 중국, ⁷ 내몽골의과대학(內蒙古醫科大學) 법의학과, 호화호특(呼和浩特), 중국

 

[리뷰] 중화 쇼비니즘 경사도 평가: 5/10

6. Chen, P. et al. (2019) ‘Population genetic analysis of modern and ancient DNA reveals the origin and population history of the northern Han Chinese’, Frontiers in Genetics, 10, 1045.

(1) 연구 개요 저자의 주장

연구는 ‘북부 한족’형성과 유전적 구조를 규명하기 위해, 현대 북부 한족(산시성 3,089등)과 13고고학 유적지에서 발굴된 417명의 고대인 미토콘드리아 DNA 및 Y염색체 데이터를 종합하여 메타 분석을 수행했다. 저자들은 현대 북부 한족이 고대 티베트-버마어족 관련 집단과 알타이어족 계통이었을 가능성이 있는 지역 선-한족(pre-Sinitic) 집단 간의 혼합을 통해 신석기 시대에 이미 형성되기 시작했다고 결론 내린다.

(2) 편향성 분석 (중화 쇼비니즘 경사도: 6/10)

이 연구는 방대한 데이터를 종합했지만, 표본 선택의 편향과 분석의 틀 자체에 내재된 문제로 인해 의도치 않게 ‘화살’ 모델을 강화하는 결과를 낳았다.

  • 서사 프레이밍 (중간 편향성): ‘북부 한족의 형성’이라는 주제 자체가 여러 지역의 복잡하고 이질적인 역사를 단일한 거대 서사로 통합하려는 경향을 내포한다. 특히 분석의 중심축이 되는 현대 표본이 산시성 등 내륙 인구에 집중되어 있어 , 자연스럽게 ‘중원→주변’이라는 확산 구도가 암묵적인 기본값으로 설정되기 쉽다.
  • 모델 선택과 반례 취급 (높은 편향성): 분석에 포함된 417명의 고대인 표본은 주로 내륙 유적지에 집중되어 있으며, 타기도와 같이 ‘해양 회랑’의 독자성을 보여주는 결정적인 섬·연해 데이터가 포함되지 않았다. 만약 이 데이터가 포함되었다면, ‘문화 확산 = 인구 이동’이라는 단순한 등식이 무너지며, 북부 한족 형성 과정이 단일한 메커니즘으로 설명될 수 없음이 명확히 드러났을 것이다. 결정적 반례의 부재는 모델의 타당성을 심각하게 약화시킨다.
  • 지리·환경 제약 반영 (중간 편향성): 최종빙기 이후 독립적으로 작동한 ‘해양 회랑’을 별도의 분석 축으로 모델링하지 않았다. 모든 것을 내륙 중심의 남-북 축 상호작용으로만 해석함으로써, 해안선이라는 또 다른 중요한 교류 축을 간과했다.
  • 유전자–문화 결합 가정 (중간 편향성): 대규모 메타 분석 과정에서 ‘한족’이라는 현대의 문화적·언어적 집단과 과거의 유전적 집단을 동일시하려는 가정이 암묵적으로 내재되기 쉽다. 이는 유전자와 문화의 복잡한 관계를 단순화할 위험이 있다.

(3) 결론 재구성

이 연구의 결론은 “북부 한족의 형성”이라는 단일 서사에서 “내륙의 상호작용과 연해의 가교 역할이 교차하며 나타난 다중 회랑 현상”으로 재진술되어야 한다. 방법론적으로는 향후 분석에서 남방 연해계(Southern-Coastal) 조상 프록시를 명시적으로 포함하고, 타기도와 같은 도서 지역 표본에 대한 대체 모델(예: 중원계 기여도 0% 모델)과의 적합도 비교를 의무화하여 ‘해양 회랑’ 축의 독자성을 통계적으로 검증해야 한다.

 

[논문요약]

DNA로 풀어보는 북방 한족(北方漢族)의 기원

이 논문은 “세계 최대 민족인 한족(漢族), 특히 중국 북방의 한족은 과연 어디에서 왔을까?”라는 거대한 질문에 답하기 위해 최신 유전학 기술을 사용한 연구이다.

이 논문은 무엇을 연구했나?

연구팀은 현대 북방 한족의 유전적 뿌리를 찾고자 했다. 이를 위해 오늘날 북방 한족의 DNA가 다른 민족들, 그리고 특히 까마득한 옛날에 살았던 고대인들의 DNA와 얼마나 가깝거나 먼지를 분석했다. 이를 통해 북방 한족이라는 거대한 집단이 언제, 그리고 어떤 그룹들이 섞여서 만들어졌는지 그 형성 과정을 밝히고자 했다.

쉽게 알아보는 전문용어

  • DNA: 우리 몸의 모든 정보를 담고 있는 설계도이다. 사람마다, 민족마다 이 설계도에 미세한 차이가 있어서 혈통을 추적하는 데 사용된다.
  • 유전 변이 (STR, SNP): DNA 설계도에 나타나는 개인별, 집단별 차이점이다. 마치 같은 책이라도 오타(SNP)나 특정 문구의 반복 횟수(STR)가 다른 것과 같다. 이 차이점을 비교해 유전적 거리를 측정한다.
  • 계통 관계 (Phylogenetic Relationship): 유전 변이를 비교해서 민족 집단 간의 ‘가족 관계’를 그려보는 것이다. 유전적으로 비슷하면 가까운 친척, 다르면 먼 친척으로 보는 ‘민족의 족보’라고 할 수 있다.

어떻게 연구했나?

연구는 크게 세 단계로 진행되었다.

  1. 현대인 DNA 분석: 한족 문화의 발원지 중 하나로 꼽히는 산서성(山西省)에 사는 북방 한족 3,089명의 DNA를 채취해 분석했다.
  2. 데이터 비교: 이 DNA를 엄청난 양의 다른 데이터와 비교했다.
  • 중국 내 다른 민족 (티베트족, 위구르족 등)
  • 전 세계 50개 이상의 민족
  • 신석기, 청동기 시대의 고대인 유골 400여 구에서 뽑아낸 DNA

3.컴퓨터 분석: 복잡한 통계 프로그램(PCA, ADMIXTURE 등)을 사용해 이 모든 DNA 데이터를 분석하고 시각화했다.

쉽게 알아보는 분석법

PCA, MDS 분석: 수많은 유전 정보를 바탕으로 각 민족을 2차원 지도 위에 점으로 표시하는 방법이다. 유전적으로 가까우면 점들이 가깝게 모이고, 멀면 멀리 떨어진다. 이를 통해 민족 간의 유전적 거리를 한눈에 볼 수 있다.

 

무엇을 발견했나?

1. 북방 한족의 독자적 유전적 위치

먼저, 연구팀은 북방 한족이 유전적으로 어디에 위치하는지 확인했다.

그림 1은 북방 한족이 티베트족이나 위구르족과는 유전적으로 명확히 구분되는 독자적인 집단임을 보여준다.

더 나아가, 그림 2는 같은 한족 내에서도 북방과 남방 집단이 뚜렷한 유전적 차이를 보인다는 점을 명확히 한다.

전 세계 민족과 비교한 그림 4 역시 북방 한족이 다른 동아시아 민족들과 함께 묶이며 유럽이나 아프리카 집단과는 확연히 다르다는 것을 보여주어, 이들의 유전적 뿌리가 동아시아에 깊이 있음을 증명한다.

2. 북방 한족의 조상은 동아시아 고대인

연구의 핵심은 현대인의 DNA를 고대인의 DNA와 직접 비교한 것이다.

그림 3은 중국 내 여러 고고학 유적지에서 발굴된 고대인의 DNA와 현대 한족의 DNA를 비교한 결과로, 황하 유역에 살았던 고대 농경민이 현대 북방 한족의 직접적인 조상일 가능성이 매우 높음을 보여준다.

그림 10은 여기서 한 걸음 더 나아가 유라시아 대륙의 여러 고대인과 비교하는데, 북방 한족이 7,700년 전 동북아시아의 ‘데빌스게이트’ 수렵-채집인과도 강한 유전적 연결고리를 가졌음을 명확히 보여준다.

3. 북방 한족은 ‘두 조상’의 혼합으로 탄생

그렇다면 북방 한족을 형성한 조상 그룹은 구체적으로 누구일까? 연구팀은 북방 한족이 단일 혈통이 아닌, 서로 다른 두 고대 집단의 ‘혼합(Admixture)’으로 탄생했다는 결론을 내렸다.

그림 5는 각 민족의 ‘유전자 레시피’를 보여주는데, 북방 한족이 여러 고대 조상(다른 색깔)의 DNA를 복합적으로 물려받았음을 보여준다.

그림 6과 그림 7은 통계 분석을 통해 북방 한족이 다른 어떤 민족보다 중국 북부의 다른 민족이나 몽골인 등과 유전적으로 가깝다는 것을 수치로 증명하여, 혼합의 재료가 된 조상 그룹을 추정하게 한다.

이 ‘혼합’ 가설을 직접적으로 증명하는 것이 그림 8과 그림 9이다.

그림 8은 통계적으로 ‘남방계 농경민’과 ‘북방계 수렵-채집인’을 섞었을 때 현대 북방 한족이 만들어진다는 것을 계산으로 보여준다.

그림 9의 ‘유전적 이주-혼합 지도’는 인류 집단이 나뉜 후(나뭇가지), 다시 만나 유전자를 섞었음(색깔 화살표)을 시각적으로 명확히 보여준다.

이 모든 증거를 종합한 북방 한족의 ‘유전적 레시피’는 다음과 같다.

1. 북동쪽 수렵-채집인 그룹 (약 45%): 약 7,700년 전 아무르강(Amur River) 근처에 살았던 고대 수렵-채집인(‘데빌스게이트(DevilsGate)’인)과 관련된 혈통이다.

2. 남쪽 농경민 그룹 (약 55%): 황하 유역에서 농사를 짓던 고대 티베트-버마어족 계열의 농경민과 관련된 혈통이다.

결론: 북방 한족의 기원은?

“현대 북방 한족은 신석기 시대에 황하 유역의 고대 농경민(남쪽 계열)이 북동쪽의 고대 수렵-채집인(북쪽 계열)과 오랜 기간에 걸쳐 섞이면서 형성된 집단이다.”

즉, 북방 한족은 단일한 뿌리에서 나온 민족이 아니라, 아주 오래전부터 서로 다른 두 개의 큰 인류 그룹이 만나 유전적으로 혼합된 결과물이라는 것이다. 이러한 유전적 혼합 과정이 오늘날 세계에서 가장 큰 민족 집단을 탄생시킨 핵심 동력이었던 셈이다.

 

[논문번역]

Modern East Asians derived from the admixture of aborigines and incoming farmers expanding from Yellow and Yangtze River Basins. Distinct genetic differentiation and subsequent admixture between Northeast Asians and Southeast Asians subsequently evidenced by the mitochondrial DNA, Y-chromosomal variations, and autosomal SNPs. Recently, population geneticists have paid more attention to the genetic polymorphisms and background of southern-Han Chinese and southern native populations. The genetic legacy of northern-Han remains uncharacterized. Thus, we performed this comprehensive population genetic analyses of modern and ancient genetic variations aiming to yield new insight into the formation of modern Han, and the genetic ancestry and phylogenetic relationship of the northern-Han Chinese population. We first genotyped 25 forensic associated markers in 3,089 northern-Han Chinese individuals using the new-generation of the Huaxia Platinum System. And then we performed the first meta-analysis focused on the genetic affinity between Asian Neolithic-Iron Age ancients and modern northern-Han Chinese by combining mitochondrial variations in 417 ancient individuals from 13 different archeological sites and 812 modern individuals, as well as Y-chromosomal variations in 114 ancient individuals from 12 Neolithic Iron Age sites and 2,810 modern subjects. We finally genotyped 643,897 genome-wide nucleotide polymorphisms (SNPs) in 20 Shanxi Han individuals and combined with 1,927 modern humans and 40 Eurasian ancient genomes to explore the genetic structure and admixture of northern-Han Chinese. We addressed genetic legacy, population structure and phylogenetic relationship of northern- Han Chinese via various analyses. Our population genetic results from five different reference datasets indicated that Shanxi Han shares a closer phylogenetic relationship with northern-neighbors and southern ethnically close groups than with Uyghur and Tibetan. Genome-wide variations revealed that modern northern-Han derived their ancestry from Yakut-related population (25.2%) and She-related population (74.8%). Summarily, the genetic mixing that led to the emergence of a Han Chinese ethnicity occurred at a very early period, probably in Neolithic times, and this mixing involved an ancient Tibeto-Burman population and a local pre-Sinitic population, which may have been linguistically Altaic.

현대 동아시아인은 황하(黃河)와 양자강(揚子江) 유역에서 확장한 원주민과 이주 농경민의 혼합에서 유래했다. 이후 미토콘드리아 DNA, Y-염색체 변이, 상염색체 단일염기다형성(SNP)을 통해 동북아시아인과 동남아시아인 사이의 뚜렷한 유전적 분화와 후속적인 혼합이 입증되었다. 최근 집단 유전학자들은 남방 한족(南方漢族)과 남방 토착 인구의 유전적 다형성과 배경에 더 많은 관심을 기울여 왔다. 북방 한족(北方漢族)의 유전적 유산은 아직 규명되지 않았다. 따라서, 우리는 현대 한족(漢族)의 형성, 북방 한족(北方漢族)의 유전적 혈통 및 계통 관계에 대한 새로운 통찰을 얻기 위해 현대 및 고대 유전 변이에 대한 포괄적인 집단 유전학 분석을 수행했다. 우리는 먼저 신세대 화하백금시스템(Huaxia Platinum System)을 사용하여 3,089명의 북방 한족(北方漢族) 개인에게서 25개의 법의학 관련 마커를 유전자형 분석했다. 그 다음, 13개 다른 고고학 유적지에서 나온 417명의 고대인과 812명의 현대인의 미토콘드리아 변이, 그리고 12개 신석기 철기시대 유적지에서 나온 114명의 고대인과 2,810명의 현대인의 Y-염색체 변이를 결합하여, 아시아 신석기-철기시대 고대인과 현대 북방 한족(北方漢族) 사이의 유전적 친화도에 초점을 맞춘 최초의 메타분석을 수행했다. 마지막으로, 20명의 산서(山西) 한족(漢族) 개인에게서 643,897개의 게놈 전역 단일염기다형성(SNP)을 유전자형 분석하고, 이를 1,927명의 현대인 및 40개의 유라시아 고대 게놈과 결합하여 북방 한족(北方漢族)의 유전 구조와 혼합을 탐구했다. 우리는 다양한 분석을 통해 북방 한족(北方漢族)의 유전적 유산, 인구 구조 및 계통 관계를 다루었다. 5개의 다른 참조 데이터 세트로부터 얻은 우리의 집단 유전학 결과는, 산서(山西) 한족(漢族)이 위구르족(Uyghur) 및 티베트족(Tibetan)보다 북방의 이웃 집단 및 남방의 민족적으로 가까운 집단과 더 가까운 계통 관계를 공유함을 나타냈다. 게놈 전역 변이는 현대 북방 한족(北方漢族)이 야쿠트(Yakut) 관련 집단(25.2%)과 서족(She) 관련 집단(74.8%)으로부터 그들의 혈통을 물려받았음을 밝혔다. 요약하면, 한족(漢族)이라는 민족의 출현으로 이어진 유전적 혼합은 아마도 신석기 시대(新石器時代)인 매우 이른 시기에 일어났으며, 이 혼합에는 고대 티베트-버마어파(Tibeto-Burman) 계열 인구와 언어학적으로 알타이어족(Altaic)이었을 가능성이 있는 토착 전(前) 시니틱(pre-Sinitic) 인구가 관여했다.

Keywords: ancient DNA, genetic structure, phylogenetic relationship, Han Chinese, whole-genome variations
키워드: 고대 DNA, 유전 구조, 계통 관계, 한족(漢族), 전체 게놈 변이

 

목차

서론 INTRODUCTION

재료 및 방법 MATERIALS AND METHODS

Sample Collection, Ethics Statements and DNA Preparation
표본 수집, 윤리 성명 및 DNA 준비

PCR Amplification and STR Genotyping
PCR 증폭 및 STR 유전자형 분석

Datasets for Population Comparison and Statistical Analysis
집단 비교 및 통계 분석을 위한 데이터 세트

결과 RESULTS

Genetic Structure and Population Genetic Features of Northern-Han Chinese by Raw Microsatellite Data
원시 미소부수체 데이터에 의한 북방 한족(北方漢族)의 유전 구조 및 집단 유전학적 특징

Genetic Heterogeneity and Phylogenetic Relationships Among Worldwide and Nationwide Populations
전 세계 및 전국 인구 간의 유전적 이질성 및 계통 관계

Haplogroup-Based Meta-Analysis of Ancient and Modern Human Populations
고대 및 현대 인류 집단의 하플로그룹 기반 메타분석

High-Density Genetic Variations of Modern and Ancient Genomes Show Fine-Scale Population Structure of Northern Han
현대 및 고대 게놈의 고밀도 유전 변이는 북방 한족(北方漢族)의 미세 규모 인구 구조를 보여준다

토론 DISCUSSION

전망 PERSPECTIVE

참고문헌 REFERENCES

 

서론 INTRODUCTION

Han Chinese, with a total population size circa 1.4 billion, is the world’s largest ethnic group and dominant ethnicity in China and Singapore. The origin of the Han Chinese population, genetic relationship with adjacent groups and past migratory pattern and admixture history have gained considerable attention from scientists working in the anthropology, linguistics, history, population and forensic genetics (Zhao et al., 2011; Gao et al., 2015; Zhao et al., 2015b; Li et al., 2017; Nothnagel et al., 2017; Zhang et al., 2017b; Chiang et al., 2018). Archaeological and anthropological evidence showed that human occupation in East Asia has experienced archaic hominin extinction, genetic introgression between early anatomically modern human and Denisovan or Neanderthals, the transformation from hunting- gathering to agriculture, massive admixture and migratory history with ethnolinguistically diverse populations in the past 50-100 thousand years (Nielsen et al., 2017). Expansions of the maternally-inherited mitochondrial DNA (mtDNA) and paternally-inherited Y-chromosome haplogroup lineages indicated that ethnically different East Asians derived from southeastern groups and experienced south-to-north migrations driven by a variety of evolutionary mechanisms (Su et al., 1999; Yao et al., 2002). Besides, social practices, including subsistence strategies, residence patterns, and agricultural expansion, play an indispensable role in shaping the patterns of Chinese populations (Nielsen et al., 2017). Ancient mitochondrial and Y-chromosomal DNA studies in East Asian Neolithic Iron Age populations have drastically increased in past decades (Cui et al., 2010; Li et al., 2010; Li et al., 2011; Zhao et al., 2011; Wang et al., 2012; Cui et al., 2013; Zhao et al., 2014; Dong et al., 2015; Gao et al., 2015; Li et al., 2015; Zhao et al., 2015b; Li et al., 2017; Zhang et al., 2017b; Li et al., 2018), however, how the peopling and settlement history of Neolithic populations influence the origin, expansion, and migration of the Han Chinese population is still unclear.

한족(漢族)은 총인구 약 14억 명으로 세계에서 가장 큰 민족 집단이며 중국과 싱가포르(Singapore)의 지배적인 민족이다. 한족(漢族)의 기원, 인접 집단과의 유전적 관계, 과거 이주 패턴 및 혼합의 역사는 인류학, 언어학, 역사학, 집단 및 법의 유전학 분야 과학자들의 상당한 주목을 받아왔다(Zhao et al., 2011; Gao et al., 2015; Zhao et al., 2015b; Li et al., 2017; Nothnagel et al., 2017; Zhang et al., 2017b; Chiang et al., 2018). 고고학적, 인류학적 증거에 따르면, 동아시아에서의 인류 거주는 지난 5만~10만 년 동안 고대 인류의 멸종, 초기 해부학적 현생 인류와 데니소바인(Denisovan) 또는 네안데르탈인(Neanderthal) 간의 유전적 교류, 수렵-채집에서 농업으로의 전환, 민족언어학적으로 다양한 인구와의 대규모 혼합 및 이주 역사를 경험했다(Nielsen et al., 2017). 모계로 유전되는 미토콘드리아 DNA(mtDNA)와 부계로 유전되는 Y-염색체 하플로그룹 계통의 확장은, 민족적으로 다른 동아시아인이 동남쪽 집단에서 유래했으며 다양한 진화적 메커니즘에 의해 남쪽에서 북쪽으로의 이주를 경험했음을 나타냈다(Su et al., 1999; Yao et al., 2002). 게다가 생계 전략, 거주 패턴, 농업 확장과 같은 사회적 관습은 중국 인구의 패턴을 형성하는 데 필수적인 역할을 한다(Nielsen et al., 2017). 동아시아 신석기 철기시대 인구에 대한 고대 미토콘드리아 및 Y-염색체 DNA 연구는 지난 수십 년간 급격히 증가했지만(Cui et al., 2010; Li et al., 2010; Li et al., 2011; Zhao et al., 2011; Wang et al., 2012; Cui et al., 2013; Zhao et al., 2014; Dong et al., 2015; Gao et al., 2015; Li et al., 2015; Zhao et al., 2015b; Li et al., 2017; Zhang et al., 2017b; Li et al., 2018), 신석기 인구의 거주 및 정착 역사가 한족(漢族)의 기원, 확장, 이주에 어떻게 영향을 미쳤는지는 여전히 불분명하다.

Physical anthropological investigation of somatometric and nonmetric features revealed that a significant difference exists between northern-Han Chinese and southern-Han Chinese (Sanchez-Mazas et al., 2011).  Subsequently, Chu et al. (1998) found genetic evidence to support the distinction between southern and northern populations.  Phylogeographic or genetic differentiation between northern-Han and southern-Han have been also evidenced by Yao et al. (2002) using mitochondrial DNA, Wen et al. (2004) using combined testing Y-chromosome and mitochondrial DNA variations, and Chen et al. (2009) and Xu et al. (2009) using high-density genotype data. Our previous study has investigated the genetic polymorphisms, forensic features and genetic relationship of currently widely- used autosomal short tandem repeats (STRs) in the southern- Han Chinese residing in the Pearl River Delta (He et al., 2018d). Thus, reconstructing the forensic reference database, estimating the forensic allele frequency and parameters and dissecting the genetic relationship of this genetically diverse northern-Han Chinese population are very necessary and urgent.

신체 계측 및 비계측적 특징에 대한 체질 인류학적 조사는 북방 한족(北方漢族)과 남방 한족(南方漢族) 사이에 상당한 차이가 존재함을 밝혔다(Sanchez-Mazas et al., 2011). 이후, Chu 등(1998)은 남방과 북방 인구 간의 구분을 뒷받침하는 유전적 증거를 발견했다. 북방 한족(北方漢族)과 남방 한족(南方漢族) 사이의 계통지리학적 또는 유전적 분화는 Yao 등(2002)이 미토콘드리아 DNA를, Wen 등(2004)이 Y-염색체와 미토콘드리아 DNA 변이의 조합 테스트를, 그리고 Chen 등(2009)과 Xu 등(2009)이 고밀도 유전자형 데이터를 사용하여 입증했다. 우리의 이전 연구는 주장삼각주(珠江三角洲)에 거주하는 남방 한족(南方漢族)에서 현재 널리 사용되는 상염색체 단반복서열(STR)의 유전적 다형성, 법의학적 특징 및 유전적 관계를 조사했다(He et al., 2018d). 따라서, 유전적으로 다양한 이 북방 한족(北方漢族) 인구의 법의학 참조 데이터베이스를 재구성하고, 법의학적 대립유전자 빈도와 매개변수를 추정하며, 유전적 관계를 분석하는 것은 매우 필요하고 시급하다.

STR, also called as microsatellite, is one of the extraordinary mutated genetic markers, is widely existed human autosomal, X-chromosome and Y-chromosome genomes (Ge et al., 2014). This length polymorphism marker is generated by the slippage synthesis of simple sequence (2-8bp) (Schlotterer and Tautz, 1992). STRs located on the no-recombining region of Y-chromosome are the best candidates for forensic pedigree searches and identifying the perpetrator in the sexual crime or rape cases, and X-chromosomal STRs are best suitable for applications in the deficiency and incestuous cases (He et al., 2017d; Chen et al., 2018). Autosomal STR genotyping is the gold standard in the routine forensic cases. Nowadays, all organizations or countries optimized their accepted STR panels to improve the international collaboration, such as the expanded CODIS core loci, extended European standard set (ESS-extended). Huaxia Platinum System (Thermo Fisher Scientific) was integrated all twenty expanded CODIS core loci, additional STRs included in the Chinese National Database and two gender determination loci (He et al., 2018b). Single nucleotide polymorphisms (SNPs), with the number over 84.7 million in the human genome, are the best candidate to explore the detailed processes of human origin, migration, evolution, adaptation and admixture (Genomes Project et al., 2015). Although Y-chromosomal and X-chromosomal variations of the northern-Han Chinese population have been investigated and reported (He et al., 2017d; Chen et al., 2018). Autosomal STR allele distribution of this new-generation of the Huaxia Platinum Amplification System with regard to forensic statistical features has not previously been investigated. Besides, the population genetic structure and admixture history of northern-Han via high-density genetic markers are unclear. Thus, we genotyped and analyzed 23 autosomal STRs in 3,089 unrelated Han Chinese individuals and 643,897 SNPs in 20 Hans residing in Shanxi Province. Shanxi Province is between 34∘34′−40∘44′north latitude and 110∘14′−114∘33′east longitude, which stretches about a total area of 156,700 km² from the Yellow River in the west and south to the Taihang Mountain in the east and the Great Wall in the north.

미소부수체(microsatellite)라고도 불리는 단반복서열(STR)은 매우 변이가 심한 유전 표지 중 하나로, 인간의 상염색체, X-염색체, Y-염색체 게놈에 널리 존재한다(Ge et al., 2014). 이 길이 다형성 표지는 단순 서열(2-8bp)의 슬리피지 합성(slippage synthesis)에 의해 생성된다(Schlotterer and Tautz, 1992). Y-염색체의 비재조합 영역에 위치한 STR은 법의학적 가계 조사 및 성범죄나 강간 사건의 범인 식별에 가장 좋은 후보이며, X-염색체 STR은 친자 불일치 및 근친상간 사건에 적용하기에 가장 적합하다(He et al., 2017d; Chen et al., 2018). 상염색체 STR 유전자형 분석은 일상적인 법의학 사건에서 황금 표준이다. 오늘날 모든 기관이나 국가는 확장된 CODIS 핵심 유전자좌, 확장된 유럽 표준 세트(ESS-extended) 등 국제 협력을 향상시키기 위해 공인된 STR 패널을 최적화했다. 화하백금시스템(Huaxia Platinum System, 써모 피셔 사이언티픽)은 20개의 확장된 CODIS 핵심 유전자좌, 중국 국가 데이터베이스에 포함된 추가 STR, 그리고 두 개의 성별 결정 유전자좌를 모두 통합했다(He et al., 2018b). 인간 게놈에서 8,470만 개가 넘는 단일염기다형성(SNP)은 인간의 기원, 이주, 진화, 적응 및 혼합의 상세한 과정을 탐구하는 데 가장 좋은 후보다(Genomes Project et al., 2015). 비록 북방 한족(北方漢族)의 Y-염색체 및 X-염색체 변이가 조사되고 보고되었지만(He et al., 2017d; Chen et al., 2018), 법의학적 통계 특징과 관련하여 이 신세대 화하백금증폭시스템(Huaxia Platinum Amplification System)의 상염색체 STR 대립유전자 분포는 이전에 조사된 적이 없다. 게다가 고밀도 유전 표지를 통한 북방 한족(北方漢族)의 집단 유전 구조와 혼합 역사는 불분명하다. 따라서, 우리는 혈연관계가 없는 3,089명의 한족(漢族) 개인에게서 23개의 상염색체 STR을, 그리고 산서성(山西省)에 거주하는 20명의 한족(漢族)에게서 643,897개의 SNP를 유전자형 분석하고 분석했다. 산서성(山西省)은 북위 34∘34′−40∘44′, 동경 110∘14′−114∘33′ 사이에 위치하며, 서쪽과 남쪽의 황하(黃河)에서 동쪽의 태행산(太行山)과 북쪽의 만리장성(萬里長城)까지 총면적 약 156,700km²에 걸쳐 있다.

This area is bounded by the Shaanxi, Inner Mongolia, Hebei, Henan, and other Provinces. Archaeological, anthropological and genetic evidence from Hengbei site consistently considered that Han Chinese is originated from Shanxi and neighboring regions, also called the Central Plain (Zhao et al., 2015b). And then Han Chinese population migrated southward with the Han-associated culture (Demic diffusion) and admixed with southern Chinese natives and formed the current patterns of genetic diversity distribution (Wen et al., 2004). In addition to the estimation of forensic characterization of autosomal STRs in northern-Han, we evaluated three different population comparisons to gain a comprehensive genetic overview of the northern-Han Chinese population and nationwide and worldwide reference populations on the basis of the genetic variations of STRs (23-STRs genotype- based data set among 12 Chinese populations, 20-STRs frequency- based dataset among 53 worldwide populations and 19-STRs frequency-based dataset among 61 nationwide populations). Finally, we also collected the present available mitochondrial and Y-chromosomal genetic variations of Han Chinese populations and merged them with previously published uniparental marker variations, as well as combined whole-genome SNPs of modern and Eurasian ancient peoples, to explore the genetic legacy and phylogenetic relationship between northern Han Chinese and ancient populations (Cui et al., 2010; Li et al., 2010; Li et al., 2011; Zhao et al., 2011; Wang et al., 2012; Cui et al., 2013; Zhao et al., 2014; Dong et al., 2015; Gao et al., 2015; Li et al., 2015; Zhao et al., 2015b; Li et al., 2017; Zhang et al., 2017b; Li et al., 2018).

이 지역은 섬서(陝西), 내몽골(內蒙古), 하북(河北), 하남(河南) 및 기타 성(省)들과 경계를 이룬다. 횡북(橫北) 유적지에서 나온 고고학적, 인류학적, 유전학적 증거는 한결같이 한족(漢族)이 중원(中原)이라고도 불리는 산서(山西) 및 인접 지역에서 기원했다고 본다(Zhao et al., 2015b). 그 후 한족(漢族) 인구는 한(漢) 관련 문화와 함께 남쪽으로 이주(데믹 확산)하고 남방 중국 원주민과 혼합하여 현재의 유전적 다양성 분포 패턴을 형성했다(Wen et al., 2004). 북방 한족(北方漢族)의 상염색체 STR의 법의학적 특성 추정 외에도, 우리는 STR의 유전적 변이에 기초하여 북방 한족(北方漢族) 인구와 전국 및 전 세계 참조 인구에 대한 포괄적인 유전적 개요를 얻기 위해 세 가지 다른 인구 비교를 평가했다 (12개 중국 인구 간 23-STR 유전자형 기반 데이터 세트, 53개 전 세계 인구 간 20-STR 빈도 기반 데이터 세트, 61개 전국 인구 간 19-STR 빈도 기반 데이터 세트). 마지막으로, 우리는 또한 현재 이용 가능한 한족(漢族) 인구의 미토콘드리아 및 Y-염색체 유전 변이를 수집하여 이전에 발표된 단일부모 표지 변이와 통합하고, 현대 및 유라시아 고대인의 전체 게놈 SNP를 결합하여 북방 한족(北方漢族)과 고대 인구 간의 유전적 유산과 계통 관계를 탐구했다 (Cui et al., 2010; Li et al., 2010; Li et al., 2011; Zhao et al., 2011; Wang et al., 2012; Cui et al., 2013; Zhao et al., 2014; Dong et al., 2015; Gao et al., 2015; Li et al., 2015; Zhao et al., 2015b; Li et al., 2017; Zhang et al., 2017b; Li et al., 2018).

 

재료 및 방법 MATERIALS AND METHODS

Sample Collection, Ethics Statements and DNA Preparation

표본 수집, 윤리 성명 및 DNA 준비

This project, including study design and experimental design, was conducted in conformity with the ethical research principles for medical research involving human subjects recommended by the World Medical Association Declaration of Helsinki and approved by the Ethics Committee of Zunyi Medical University. Blood samples were collected using the FTA card with the written informed consent from 3,089 unrelated healthy Han Chinese individuals (2,009 males and 1,080 females) from Yuncheng country in the Shanxi Province, northern China. A total of 20 EDTA anti-coagulated peripheral blood samples were collected for whole-genome SNPs genotyping. All self-declared Han Chinese indigenous subjects are needed to be no intermarriage with people of other ethnic groups and resided in here at least three generations. Human genomic DNA from male samples was extracted using the DNeasy blood and tissue kit (Qiagen) and measured utilizing the NanoDrop-2000 (Thermo Scientific, USA) following the manufacturer’s instruction, and DNA from female samples was isolated using the Chelex-100 method. All our data used throughout this study are submit ed in the Supplementary Materials.

연구 설계 및 실험 설계를 포함한 이 프로젝트는 세계의사협회 헬싱키 선언(Declaration of Helsinki)에서 권장하고 준의의과대학(遵義醫科大學) 윤리위원회의 승인을 받은, 인간 대상 의료 연구에 대한 윤리적 연구 원칙에 따라 수행되었다. 중국 북부 산서성(山西省) 운성시(運城市) 출신의 혈연관계 없는 건강한 한족(漢族) 3,089명(남성 2,009명, 여성 1,080명)으로부터 서면 동의를 받은 후 FTA 카드를 사용하여 혈액 샘플을 수집했다. 전체 게놈 SNP 유전자형 분석을 위해 총 20개의 EDTA 항응고 처리된 말초 혈액 샘플을 수집했다. 스스로 한족(漢族) 토착민이라고 밝힌 모든 대상자는 다른 민족 집단과의 통혼이 없어야 하며, 이곳에서 최소 3세대 이상 거주해야 했다. 남성 샘플의 인간 게놈 DNA는 DNeasy 혈액 및 조직 키트(Qiagen)를 사용하여 추출하고, 제조사의 지침에 따라 NanoDrop-2000(Thermo Scientific, USA)을 이용하여 측정했으며, 여성 샘플의 DNA는 Chelex-100 방법을 사용하여 분리했다. 이 연구 전반에 사용된 모든 데이터는 보충 자료에 제출되었다.

PCR Amplification and STR Genotyping

PCR 증폭 및 STR 유전자형 분석

We employed Huaxia Platinum Amplification System for multiallelic STR genotyping including 23-autosomal-STRs, two sex-linked inherited Y-InDel (rs2032678) and Amelogenin in a ProFlex PCR System (Thermo Fisher Scientific) in accordance with the manufacturer’s recommendation. A 10 µL reaction volume, which contains 4 µL of primer set (the concentration of each locus is different), 4µL of master mix, 0.4 ng of template DNA as well as Prep-N-Go buffer was employed with the standard thermal cycling conditions which comprise an initial step at 95∘C for 1 min; followed by 27 cycles of denaturation at 94∘C for 3s, anneal at 59∘C for 16s, and extension at 65∘C for 29 s; and following a final extension at 60∘C for 5 min and preservation at 10∘C. Applied Biosystems 3500 Genetic Analyzer (Thermo Fisher Scientific) was utilized to separate and detect the PCR products using the 36 cm capillary array and POP-4 polymer following the corresponding instruction. A 9.5 µL of deionized Hi-Di formamide and a 0.5 of µL GeneScan 600 LIZ Size Standard v2.0 (Thermo Fisher Scientific) were utilized to mix with the amplified products or allelic ladder before the capillary electrophoresis. Finally, we used the GeneMapper ID-X v.1.4 software to identify and analyze the corresponding allele. We employed the typical control DNA of 9947A human cell line sample (Thermo Fisher Scientific) as positive, and the ddH₂O as negative in each batch of PCR amplification and electrophoresis. Infinium Global Screening Array BeadChip of Illumina WeGene V2 Arrays (WeGene, Shenzhen, China) covering approximately 700k SNPs was used to genotype autosomal SNPs based on the manufacturers’ introduction.

우리는 제조사의 권장 사항에 따라 프로플렉스 PCR 시스템(ProFlex PCR System, 써모 피셔 사이언티픽)에서 23개의 상염색체 STR, 2개의 성염색체 연관 유전 Y-InDel(rs2032678) 및 아멜로게닌(Amelogenin)을 포함하는 다중대립유전자 STR 유전자형 분석을 위해 화하백금증폭시스템(Huaxia Platinum Amplification System)을 사용했다.  4 µL의 프라이머 세트(각 유전자좌의 농도는 다름), 4 µL의 마스터 믹스, 0.4 ng의 주형 DNA 및 Prep-N-Go 버퍼를 포함하는 10 µL 반응 용량을 표준 열 순환 조건으로 사용했다. 이는 95∘C에서 1분간 초기 단계를 거치고, 이후 94∘C에서 3초간 변성, 59∘C에서 16초간 어닐링, 65∘C에서 29초간 신장하는 과정을 27회 반복한 후, 60∘C에서 5분간 최종 신장하고 10∘C에서 보존하는 과정으로 구성된다. PCR 산물을 분리하고 검출하기 위해 해당 지침에 따라 36cm 모세관 배열과 POP-4 폴리머를 사용하여 어플라이드 바이오시스템즈 3500 유전자 분석기(Applied Biosystems 3500 Genetic Analyzer, 써모 피셔 사이언티픽)를 활용했다. 모세관 전기영동 전에 증폭된 산물이나 대립유전자 래더와 혼합하기 위해 9.5 µL의 탈이온수 Hi-Di 포름아미드와 0.5 µL의 GeneScan 600 LIZ 크기 표준 v2.0(써모 피셔 사이언티픽)을 사용했다. 마지막으로, GeneMapper ID-X v.1.4 소프트웨어를 사용하여 해당 대립유전자를 식별하고 분석했다. 각 PCR 증폭 및 전기영동 배치에서 9947A 인간 세포주 샘플(써모 피셔 사이언티픽)의 일반적인 대조 DNA를 양성 대조군으로, ddH₂O를 음성 대조군으로 사용했다. 약 70만 개의 SNP를 포함하는 일루미나 위진 V2 어레이(Illumina WeGene V2 Arrays)의 인피니움 글로벌 스크리닝 어레이 비드칩(Infinium Global Screening Array BeadChip, 위진, 심천, 중국)을 제조사의 소개에 따라 상염색체 SNP의 유전자형을 분석하는 데 사용했다.

Datasets for Population Comparison and Statistical Analysis

집단 비교 및 통계 분석을 위한 데이터 세트

To comprehensively dissect the genetic background of Shanxi northern-Han Chinese, we first integrated our raw genotyping data (23 STRs) with previously published genotype data from 11 Chinese populations from five Chinese ethnic groups (Han, Hui, Tibetan, Yi, and Uyghur) (He et al., 2018b; Wang et al., 2018a; Chen et al., 2019; Liu et al., 2019).  To further explore the genetic relationship of Shanxi Han in the context of the genetic variations from the worldwide or nationwide populations, we subsequently combined our allele frequency of 20 STRs with publicly obtained data from 52 worldwide populations (Westen et al., 2012; Gaviria et al., 2013; Park et al., 2013; Fujii et al., 2014; Almeida et al., 2015; Parolin et al., 2015; Aguilar-Velazquez et al., 2016; Hossain et al., 2016; Ng et al., 2016; Park et al., 2016; Ramos-Gonzalez et al., 2016; Ristow et al., 2016; Vullo et al., 2016; Wang, 2016; Zhang et al., 2016a; Zhang et al., 2016b; Choi et al., 2017; Guerreiro et al., 2017; Jin et al., 2017; Liu et al., 2017; Moyses et al., 2017; Ossowski et al., 2017; Singh and Nandineni, 2017; Taylor et al., 2017; Wu et al., 2017; Yang et al., 2017a; He et al., 2018b; He et al., 2018e; Wang et al., 2018a; Liu et al., 2019) and allele frequency of 19 STRs with previously investigated the allele frequency distribution from 60 Chinese populations (Zhang et al., 2011; Zhang, 2012; Liu et al., 2013; Shen, 2013; Zhang, 2013; Wang, 2014; Wang et al., 2014; Xie, 2014; Hu et al., 2015; Li, 2015; Ruan, 2015; Shen et al., 2015; Wang, 2015; Yin, 2015; Zhang and Chen, 2015; Zhao et al., 2015a; Huang, 2016; Meng, 2016; Wang, 2016; Xiang, 2016; Xiao et al., 2016; Zhao, 2016; Chen et al., 2017; Fu et al., 2017; He et al., 2017a; He et al., 2017c; Jin et al., 2017; Liu, 2017; Lu et al., 2017; Yao et al., 2017; Zhang, 2017a; Zhang, 2017b; Zhang, 2017c; Zhang et al., 2017a; Zou et al., 2017; He et al., 2018b; He et al., 2018e; Wang et al., 2018a). Subsequently, to explore the genetic affinity between northern Han Chinese and ancient Asian populations, we combined mitochondrial DNA variations of 812 modern Han Chinese individuals from seven geographical different populations and 417 ancient individuals in 13 different archeological sites, and then combined Y-chromosome variations of 2,810 modern subjects from 26 Chinese populations and 114 ancient individuals in 12 neolithic sites (Cui et al., 2010; Li et al., 2010; Li et al., 2011; Zhao et al., 2011; Wang et al., 2012; Cui et al., 2013; Zhao et al., 2014; Dong et al., 2015; Gao et al., 2015; Li et al., 2015; Zhao et al., 2015b; Li et al., 2017; Zhang et al., 2017b; Li et al., 2018). Finally, we merged our 20 whole-genome SNPs data with previously published 1,924 individuals from the Human Genome Diversity Project-Centre d’Etude du Polymorphisme Humain (HGDP- CEPH) panel and International HapMap Project Phase 3 and 40 ancient humans from Eurasia (Li et al., 2008; Jeong et al., 2016; Lipson et al., 2018).

산서(山西) 북방 한족(北方漢族)의 유전적 배경을 종합적으로 분석하기 위해, 우리는 먼저 우리의 원시 유전자형 데이터(23 STR)를 5개 중국 민족 집단(한족(漢族), 후이족(Hui), 티베트족(Tibetan), 이족(Yi), 위구르족(Uyghur))에 속하는 11개 중국 인구로부터 이전에 발표된 유전자형 데이터와 통합했다(He et al., 2018b; Wang et al., 2018a; Chen et al., 2019; Liu et al., 2019).  전 세계 또는 전국 인구의 유전적 변이 맥락에서 산서(山西) 한족(漢族)의 유전적 관계를 추가로 탐구하기 위해, 우리는 이어서 20개 STR의 대립유전자 빈도를 52개 전 세계 인구로부터 공개적으로 얻은 데이터와 결합하고(Westen et al., 2012; Gaviria et al., 2013; Park et al., 2013; Fujii et al., 2014; Almeida et al., 2015; Parolin et al., 2015; Aguilar-Velazquez et al., 2016; Hossain et al., 2016; Ng et al., 2016; Park et al., 2016; Ramos-Gonzalez et al., 2016; Ristow et al., 2016; Vullo et al., 2016; Wang, 2016; Zhang et al., 2016a; Zhang et al., 2016b; Choi et al., 2017; Guerreiro et al., 2017; Jin et al., 2017; Liu et al., 2017; Moyses et al., 2017; Ossowski et al., 2017; Singh and Nandineni, 2017; Taylor et al., 2017; Wu et al., 2017; Yang et al., 2017a; He et al., 2018b; He et al., 2018e; Wang et al., 2018a; Liu et al., 2019), 19개 STR의 대립유전자 빈도를 60개 중국 인구로부터 이전에 조사된 대립유전자 빈도 분포와 결합했다(Zhang et al., 2011; Zhang, 2012; Liu et al., 2013; Shen, 2013; Zhang, 2013; Wang, 2014; Wang et al., 2014; Xie, 2014; Hu et al., 2015; Li, 2015; Ruan, 2015; Shen et al., 2015; Wang, 2015; Yin, 2015; Zhang and Chen, 2015; Zhao et al., 2015a; Huang, 2016; Meng, 2016; Wang, 2016; Xiang, 2016; Xiao et al., 2016; Zhao, 2016; Chen et al., 2017; Fu et al., 2017; He et al., 2017a; He et al., 2017c; Jin et al., 2017; Liu, 2017; Lu et al., 2017; Yao et al., 2017; Zhang, 2017a; Zhang, 2017b; Zhang, 2017c; Zhang et al., 2017a; Zou et al., 2017; He et al., 2018b; He et al., 2018e; Wang et al., 2018a). 이어서, 북방 한족(北方漢族)과 고대 아시아 인구 간의 유전적 친화도를 탐구하기 위해, 7개 지리적으로 다른 인구의 현대 한족(漢族) 812명과 13개 다른 고고학 유적지의 고대인 417명의 미토콘드리아 DNA 변이를 결합한 후, 26개 중국 인구의 현대인 2,810명과 12개 신석기 유적지의 고대인 114명의 Y-염색체 변이를 결합했다(Cui et al., 2010; Li et al., 2010; Li et al., 2011; Zhao et al., 2011; Wang et al., 2012; Cui et al., 2013; Zhao et al., 2014; Dong et al., 2015; Gao et al., 2015; Li et al., 2015; Zhao et al., 2015b; Li et al., 2017; Zhang et al., 2017b; Li et al., 2018). 마지막으로, 우리는 20개의 전체 게놈 SNP 데이터를 인간 게놈 다양성 프로젝트-인간 다형성 연구 센터(HGDP-CEPH) 패널과 국제 HapMap 프로젝트 3단계의 1,924명 및 유라시아 출신 고대인 40명의 이전에 발표된 데이터와 통합했다(Li et al., 2008; Jeong et al., 2016; Lipson et al., 2018).

STR Analysis for Forensics (STRAF) online software (Gouy and Zieger, 2017) was utilized to evaluate the allelic frequency and forensic statistical parameters of 23 STRs. Population genetic parameters based on the raw genotype data, including pairwise Fst genetic distance, locus-specific Fst, and Fis among 12 Chinese populations, were also calculated using the STRAF. Linkage and Hardy-Weinberg equilibrium analyses, as well as evaluation of the heterozygosity indexes, were performed using the Arlequin software (version3.5) (Excoffier and Lischer, 2010). Pairwise standard genetic distances (Nei, 1978; Reynolds et al., 1983; Kalinowski, 2002) between Shanxi Han and other reference populations were calculated using the Phylogeny Inference Packages version 3.5 (PHYLIP) (Excoffier and Lischer, 2010). Principal component analysis (PCA) based on the raw data was carried out using the STRAF, and PCAs on the basis of allele frequency distribution were conducted using the Multivariate Statistical Package (MVSP) version 3.22 software (Kovach, 2007). Genetic similarities and differences revealed by the genetic distances were visualized via the heatmap using the pheatmap program in R software v3.3. Genetic relationships between Shanxi Han and other three different reference population panels were subsequently explored and reconstructed via multidimensional scaling plots (MDS) using the IBM SPSS Statistics 21 (Hansen, 2005) and neighbor joining tree using the Molecular Evolutionary Genetics Analysis Version 7.0 (Mega 7.0) (Kumar et al., 2016). Under the ‘correlated allele frequencies’ and ‘LOCPRIOR’ models, we dissected the ancestry component among 12 Chinese populations using the STRUCTURE version 2.3.4.21 (Evanno et al., 2005) with predefined populations ranging from 2~6 with ten replications. For genome-wide-based population genetic analyses, we used the plink v1.90 to conduct the PCA and ADMIXTURE 1.30 to perform the model-based analysis using the pruned data (-indep-pairwise 200 25 0.4). We employed 10-fold cross- validation with the predefined ancestry populations varying from 2 to 19. We conducted the admixture-f (Source1, Source2; Shanxi Han), outgroup-f, (X, Shanxi Han; Yoruba), D (X, Y; Shanxi Han, Yoruba), qp Wave and qpAdm to explore the population history of northern Han under the genetic variations of modern and ancient population using the ADMIXTOOLS (Patterson et al., 2012). We finally explored the population splits and mixtures using unsupervised clustering analysis of TreeMix (Pickrell and Pritchard, 2012).

온라인 소프트웨어인 STRAF(STR Analysis for Forensics, Gouy and Zieger, 2017)를 활용하여 23개 STR의 대립유전자 빈도와 법의학적 통계 매개변수를 평가했다. 12개 중국 인구 간의 쌍별 Fst 유전적 거리, 유전자좌 특이적 Fst, Fis를 포함한 원시 유전자형 데이터 기반의 집단 유전 매개변수도 STRAF를 사용하여 계산했다. 연관 및 하디-와인버그 평형(Hardy-Weinberg equilibrium) 분석, 그리고 이형접합도 지수 평가는 Arlequin 소프트웨어(버전 3.5)를 사용하여 수행했다(Excoffier and Lischer, 2010). 산서(山西) 한족(漢族)과 다른 참조 인구 간의 쌍별 표준 유전적 거리(Nei, 1978; Reynolds et al., 1983; Kalinowski, 2002)는 PHYLIP(Phylogeny Inference Packages) 버전 3.5를 사용하여 계산했다(Excoffier and Lischer, 2010). 원시 데이터에 기반한 주성분 분석(PCA)은 STRAF를 사용하여 수행했으며, 대립유전자 빈도 분포에 기반한 PCA는 MVSP(Multivariate Statistical Package) 버전 3.22 소프트웨어를 사용하여 수행했다(Kovach, 2007). 유전적 거리에 의해 밝혀진 유전적 유사성과 차이점은 R 소프트웨어 v3.3의 pheatmap 프로그램을 사용하여 히트맵을 통해 시각화했다. 산서(山西) 한족(漢族)과 다른 세 가지 참조 인구 패널 간의 유전적 관계는 IBM SPSS Statistics 21(Hansen, 2005)을 사용한 다차원 척도법(MDS) 도표와 Mega 7.0(Molecular Evolutionary Genetics Analysis Version 7.0)을 사용한 최근린 결합 트리(neighbor joining tree)를 통해 탐색하고 재구성했다(Kumar et al., 2016). ‘상관된 대립유전자 빈도’ 및 ‘LOCPRIOR’ 모델 하에서, 우리는 2에서 6까지의 사전 정의된 집단과 10회 반복으로 STRUCTURE 버전 2.3.4.21(Evanno et al., 2005)을 사용하여 12개 중국 인구 간의 혈통 성분을 분석했다. 게놈 전반 기반 집단 유전 분석을 위해, 우리는 plink v1.90을 사용하여 PCA를 수행하고 ADMIXTURE 1.30을 사용하여 정리된 데이터(-indep-pairwise 200 25 0.4)로 모델 기반 분석을 수행했다.  우리는 2에서 19까지 다양한 사전 정의된 혈통 집단으로 10겹 교차 검증을 사용했다. 우리는 ADMIXTOOLS(Patterson et al., 2012)를 사용하여 현대 및 고대 인구의 유전적 변이 하에서 북방 한족(北方漢族)의 인구사를 탐구하기 위해 admixture-f₃(Source1, Source2; Shanxi Han), outgroup-f₃(X, Shanxi Han; Yoruba), D(X, Y; Shanxi Han, Yoruba), qpWave 및 qpAdm을 수행했다. 마지막으로, 우리는 TreeMix의 비지도 군집 분석을 사용하여 인구 분할 및 혼합을 탐색했다(Pickrell and Pritchard, 2012).

 

결과 RESULTS

Genetic Structure and Population Genetic Features of Northern-Han Chinese by Raw Microsatellite Data

원시 미소부수체 데이터에 의한 북방 한족(北方漢族)의 유전 구조 및 집단 유전학적 특징

The 23 autosomal-STRs included in the Huaxia Platinum System were amplified from 3,089 northern-Han Chinese individuals residing in the Shanxi Province, which is considered as the origin place of the Han ethnic group (Figure 1A). The p values of Hardy-Weinberg equilibrium (HWE) and linkage disequilibrium (LD) in 23 STRs were listed in Table S1. After correction using the Bonferroni standard, no deviations from HWE or LD were observed. Allelic frequency distribution and forensic statistical parameters are provided in Figure 1B and Table S2. A total of 342 alleles were identified with the corresponding allele frequency ranging from 0.0002 to 0.5391. The combined power of discrimination and the combined probability of exclusion in Shanxi Han were 0.999999999999999999999999994 and 0.0.9999999995, respectively. Forensic discrimination powers estimated in the northern-Han Chinese were consistent with forensic measures in the southern-Han populations, such as Zhujiang Han and Sichuan Han. All of the combined results showed that Huaxia Platinum System was informative and polymorphic in Shanxi Han population and could be considered to be a useful tool for forensic kinship identification and individual identification, and Chinese reference database establishment.

화하백금시스템(Huaxia Platinum System)에 포함된 23개의 상염색체 STR은 한족(漢族)의 발원지로 여겨지는 산서성(山西省)에 거주하는 3,089명의 북방 한족(北方漢族) 개인으로부터 증폭되었다(그림 1A). 23개 STR의 하디-와인버그 평형(HWE) 및 연관 불평형(LD)의 p-값은 표 S1에 나열되었다. 본페로니(Bonferroni) 표준을 사용하여 보정한 후 HWE 또는 LD로부터의 이탈은 관찰되지 않았다. 대립유전자 빈도 분포 및 법의학 통계 매개변수는 그림 1B와 표 S2에 제공된다. 총 342개의 대립유전자가 확인되었으며, 해당 대립유전자 빈도는 0.0002에서 0.5391까지의 범위를 보였다. 산서(山西) 한족(漢族)의 종합 식별력과 종합 부권 배제 확률은 각각 0.999999999999999999999999994와 0.9999999995였다. 북방 한족(北方漢族)에서 추정된 법의학적 식별력은 주장(珠江) 한족(漢族) 및 사천(四川) 한족(漢族)과 같은 남방 한족(南方漢族) 인구의 법의학적 측정치와 일치했다. 모든 종합 결과는 화하백금시스템(Huaxia Platinum System)이 산서(山西) 한족(漢族) 인구에서 정보 제공적이고 다형성이며, 법의학적 친족 감정 및 개인 식별, 그리고 중국 참조 데이터베이스 구축에 유용한 도구로 간주될 수 있음을 보여주었다.

To explore the genetic background of the Han Chinese population, we conducted the first population genetic analysis employing a genotype dataset consisting of 6,060 individuals from two language families (Trans-Himalayan and Altaic). Pairwise Fst genetic distances between Shanxi Han and other eleven Chinese populations were listed in Table S3 and Figure 1C. Chengdu Han showed the smallest genetic relationship with Shanxi Han (0.0002) and Urumqi Uyghur showed the largest genetic relationship with Shanxi Han (0.0032). Pairwise Fst results showed that Shanxi Han had a closer genetic relationship with all East Asians compared to the relationships of pairs of the other Chinese populations under the same reference panel. PCA based on the first two components could explain 1.07% variance (PC1: 0.58% and PC2: 0.49%). PC1 could partly distinguish the Altaic-speaking populations and other Chinese references. Both components could not separate any ethnic group from others except for Uyghur (Figure 1D). MDS and neighbor-joining tree were constructed on the basis of the pairwise Fst genetic distance matrixes. As shown in Figure 1E, five to-Burman-speaking populations grouped together and localized in the upper left part and Sinitic-speaking populations tended to be allocated in the center. Xinjiang Uyghur and Kumul Uyghur located in the right part except for Urumqi Uygur. It is strange to find a closer genetic relationship between Shanxi Han and Urumqi Uyghur, which might be caused by the metropolitan or the provincial center with the massively genetic admixture with adjoining populations in the historical time. As we expected, three obvious genetical affinity clusters were observed which corresponding to linguistic classifications, including the Altaic-Turkic (AT) cluster, Trans- Himalayan-Sinitic (THS) cluster and other Trans-Himalayan populations (THO) cluster, and Shanxi Han was located between the THO and THS, which first grouped with the Liangshan Yi group and then grouped with Han and Hui populations (Figure 1F).

한족(漢族)의 유전적 배경을 탐구하기 위해, 우리는 두 어족(티베트-히말라야어족(Trans-Himalayan)과 알타이어족(Altaic)) 출신의 6,060명으로 구성된 유전자형 데이터 세트를 사용하여 첫 번째 집단 유전 분석을 수행했다. 산서(山西) 한족(漢族)과 다른 11개 중국 인구 간의 쌍별 Fst 유전적 거리는 표 S3와 그림 1C에 나열되었다. 성도(成都) 한족(漢族)은 산서(山西) 한족(漢族)과 가장 작은 유전적 관계(0.0002)를 보였고, 우루무치(烏魯木齊) 위구르족(Uyghur)은 산서(山西) 한족(漢族)과 가장 큰 유전적 관계(0.0032)를 보였다. 쌍별 Fst 결과는 산서(山西) 한족(漢族)이 동일한 참조 패널 하에서 다른 중국 인구 쌍의 관계와 비교할 때 모든 동아시아인과 더 가까운 유전적 관계를 가지고 있음을 보여주었다. 처음 두 주성분에 기반한 PCA는 1.07%의 분산을 설명할 수 있었다(PC1: 0.58% 및 PC2: 0.49%). PC1은 알타이어(Altaic) 사용 인구와 다른 중국 참조 인구를 부분적으로 구별할 수 있었다. 두 주성분 모두 위구르족(Uyghur)을 제외하고는 어떤 민족 집단도 다른 집단과 분리할 수 없었다(그림 1D). MDS와 최근린 결합 트리는 쌍별 Fst 유전적 거리 행렬을 기반으로 구성되었다. 그림 1E에서 볼 수 있듯이, 5개의 티베트-버마어(Tibeto-Burman) 사용 인구는 함께 그룹을 이루어 왼쪽 상단에 위치했고, 시니틱어(Sinitic) 사용 인구는 중앙에 할당되는 경향을 보였다. 신강(新疆) 위구르족(Uyghur)과 쿠물(Kumul) 위구르족(Uyghur)은 우루무치(烏魯木齊) 위구르족(Uyghur)을 제외하고 오른쪽에 위치했다. 산서(山西) 한족(漢族)과 우루무치(烏魯木齊) 위구르족(Uyghur) 사이에 더 가까운 유전적 관계를 발견한 것은 이례적인데, 이는 역사적 시기에 인접 인구와의 대규모 유전적 혼합이 있었던 대도시 또는 성도(省都)의 특성 때문일 수 있다.  예상대로, 알타이-튀르크(AT) 군집, 티베트-히말라야-시니틱(THS) 군집, 그리고 기타 티베트-히말라야 인구(THO) 군집을 포함하여 언어적 분류에 해당하는 세 개의 명백한 유전적 친화 군집이 관찰되었다. 산서(山西) 한족(漢族)은 THO와 THS 사이에 위치했으며, 먼저 양산(涼山) 이족(Yi) 그룹과 그룹을 이룬 후 한족(漢族) 및 후이족(Hui) 인구와 그룹을 이루었다(그림 1F).

To directly visualize the genetic component and the corresponding proportion, we conducted Structure analysis assuming 2-6 predefined ancestry populations (Figure S1). At k=2, AT populations showed different ancestry components with other Chinese populations. At k=3 THO populations showed their specific ancestry component.  Geographically different ancestries gradually appeared within the same language family and shared varying proportions of each predefined ancestry when the k values continually increased. Shanxi Han consistently kept a unique ancestry component and harbored a closer genetic relationship with Chengdu Han and Wuzhong Hui than with Hainan Han.

유전적 구성 요소와 해당 비율을 직접 시각화하기 위해, 우리는 2-6개의 사전 정의된 조상 인구를 가정하여 Structure 분석을 수행했다(그림 S1). k=2일 때, 알타이-튀르크(AT) 인구는 다른 중국 인구와 다른 조상 구성 요소를 보였다. k=3일 때, 기타 티베트-히말라야(THO) 인구는 그들만의 특정 조상 구성 요소를 보였다.  k 값이 계속 증가함에 따라 동일한 어족 내에서 지리적으로 다른 조상들이 점차 나타났으며, 각 사전 정의된 조상의 다양한 비율을 공유했다. 산서(山西) 한족(漢族)은 일관되게 고유한 조상 구성 요소를 유지했으며, 해남(海南) 한족(漢族)보다 성도(成都) 한족(漢族) 및 오충(吳忠) 후이족(Hui)과 더 가까운 유전적 관계를 보였다.

그림 1. 원시 유전자형 데이터를 기반으로 한 산서(山西) 한족(漢族)과 다른 11개 중국 인구 간의 유전 구조. (A) 포함된 12개 인구의 지리적 분포, 민족 및 표본 크기. (B) 화하백금시스템(Huaxia Platinum System)에 포함된 23개 상염색체 STR의 법의학적 매개변수. (C) 12개 인구 간의 쌍별 Fst 유전적 거리. PCA (D), MDS (E) 및 최근린 결합 트리 (F)는 새로 연구된 산서(山西) 한족(漢族)과 다른 11개 참조 인구 간의 유전적 유사성과 차이점을 보여준다. AT, 알타이-튀르크(Altai-Turkic); THS, 티베트-히말라야-시니틱(Trans-Himalayan-Sinitic); THO, 시니틱(Sinitic)을 제외한 티베트-히말라야(Trans-Himalayan).

Genetic Heterogeneity and Phylogenetic Relationships Among Worldwide and Nationwide Populations

전 세계 및 전국 인구 간의 유전적 이질성 및 계통 관계

To characterize the general patterns of genetic similarities and differences between northern-Han Chinese and more reference populations across the whole world, we combined our newly obtained allele frequency data with previously published data from 52 worldwide populations. We calculated two pairwise genetic distances, Nei and Reynolds, among the 53 populations (Table S4 and Figure S2A). Central Chinese Han showed the smallest genetic distances with Shanxi Han (Reynolds: 0.004 and Nei: 0.0013), followed by the southern-Han Chinese populations (Guangdong Han, Sichuan Han, Xiamen, and Guizhou Han), Tibeto-Burman speakers, Turkic speakers, and other continental groups in order. Heatmap furtherly illustrated the genetic affinity existing within East Asian populations (Figure S2B). PCA was conducted based on the allele frequency distribution of 20 STRS in 53 populations (Figures S3 and 4). Top ten components could extract approximately 84.40% variance (PC1: 32.126%; PC2: 15.892%; PC3: 10.083%; PC4: 8.077%; PC5: 6.523%; PC6: 3.432%; PC7: 2.55%; PC8: 2.104%; PC9: 1.857% and PC10: 1.745%). PC1 displayed a clear separation between East Asians, Central Asians, and others, and PC2 showed differences between Americans and Europeans with some exceptions. Genetic relationships were also constructed using MDS plots. The observed patterns of relationships were consistent with the aforementioned findings via the first three PCA components. The patterns of the genetic affinity of East Asian populations were in accordance with the linguistic classification. Southern-Han Chinese populations were well-positioned at the end of the tree and then clustered with Central-Han Chinese population, followed by clustering with northern-Han Chinese populations (Shanxi Han), finally followed by Japanese, Korean and other language family or continental populations (Figure S3D).

북방 한족(北方漢族)과 전 세계의 더 많은 참조 인구 간의 유전적 유사성 및 차이점의 일반적인 패턴을 특성화하기 위해, 우리는 새로 얻은 대립유전자 빈도 데이터를 이전에 발표된 52개 전 세계 인구의 데이터와 결합했다. 53개 인구 간에 두 가지 쌍별 유전적 거리, 즉 네이(Nei)와 레이놀즈(Reynolds)를 계산했다(표 S4 및 그림 S2A). 중부 중국 한족(漢族)이 산서(山西) 한족(漢族)과 가장 작은 유전적 거리를 보였고(Reynolds: 0.004, Nei: 0.0013), 그 뒤를 이어 남방 한족(南方漢族) 인구(광동(廣東) 한족(漢族), 사천(四川) 한족(漢族), 하문(廈門), 귀주(貴州) 한족(漢族)), 티베트-버마어(Tibeto-Burman) 사용자, 튀르크어(Turkic) 사용자 및 기타 대륙 집단 순이었다. 히트맵은 동아시아 인구 내에 존재하는 유전적 친화도를 추가로 설명했다(그림 S2B). 53개 인구에서 20개 STR의 대립유전자 빈도 분포를 기반으로 PCA를 수행했다(그림 S3 및 4). 상위 10개 주성분은 약 84.40%의 분산을 추출할 수 있었다(PC1: 32.126%; PC2: 15.892%; PC3: 10.083%; PC4: 8.077%; PC5: 6.523%; PC6: 3.432%; PC7: 2.55%; PC8: 2.104%; PC9: 1.857% 및 PC10: 1.745%). PC1은 동아시아인, 중앙아시아인(中央亞細亞人) 및 기타 집단 간의 명확한 분리를 보였고, PC2는 일부 예외를 제외하고 아메리카인(American)과 유럽인(European) 간의 차이를 보였다. 유전적 관계는 MDS 도표를 사용하여 구성되기도 했다. 관찰된 관계 패턴은 처음 세 개의 PCA 주성분을 통한 앞선 발견과 일치했다. 동아시아 인구의 유전적 친화도 패턴은 언어적 분류와 일치했다. 남방 한족(南方漢族) 인구는 트리의 끝에 잘 위치했으며, 그 다음 중부 한족(漢族) 인구와 군집을 이루고, 이어서 북방 한족(北方漢族) 인구(산서(山西) 한족(漢族))와 군집을 이루었으며, 마지막으로 일본인(Japanese), 한국인(Korean) 및 기타 어족 또는 대륙 인구가 뒤따랐다(그림 S3D).

Subsequently, focused on the genetic variations in China, we collected previously investigated allele frequency data of 19 STRs from 61 populations and combined with our data. Results from pairwise genetic distances showed that Shanxi Han had a close genetic relationship with Tianjin Han (Cavalli- Sforza: 0.0048, Nei: 0.0514) and other geographically adjacent populations (Figures 2A, B). The largest genetic distances between Shanxi Han were observed with Benzhen Manchu (Cavalli-Sforza: 0.0118 and Nei: 0.1142), followed by Uyghur and Kazakh populations. MDS was constructed based on the pairwise Nei standard genetic distance matrixes (Figure 2C). Five AT-speaking populations were clustered together and allocated in the right-lower position and other Chinese minority groups had a scattered distribution and near to the Han Chinese populations. A significant south-to-north cline was observed and Shanxi Han was clustered closely with northern-Han populations. Phylogenetic relationships within Chinese populations were subsequently constructed (Figure 2D). Southern-Han Chinese and southern native minorities formed the first branch, and the AT- and THO-speaking populations formed the second branch. Northern-Han Chinese and northern Manchu groups formed the third branch. Shanxi Han was localized between the neighboring northern populations, such as Yanzhou, Inner Mongolia, Henan2, Shandong and Suzhou Han Chinese populations. The results from different standard genetic distances, PCA, MDS, and phylogenetic relationship reconstruction consistently indicated that Shanxi Han carried a higher resemblance to Beijing Han Chinese than with southern-Han Chinese or other THO-, AT-, Hmong-Mien- and Tai-Kadai-speaking populations.

이어서, 중국 내 유전 변이에 초점을 맞춰, 61개 인구에서 19개 STR의 이전에 조사된 대립유전자 빈도 데이터를 수집하여 우리 데이터와 결합했다. 쌍별 유전적 거리 결과는 산서(山西) 한족(漢族)이 천진(天津) 한족(漢族)(카발리-스포르차(Cavalli-Sforza): 0.0048, 네이(Nei): 0.0514) 및 기타 지리적으로 인접한 인구와 가까운 유전적 관계를 가지고 있음을 보여주었다(그림 2A, B). 산서(山西) 한족(漢族)과 가장 큰 유전적 거리는 본계(本溪) 만주족(Manchu)(카발리-스포르차(Cavalli-Sforza): 0.0118, 네이(Nei): 0.1142)에서 관찰되었으며, 그 뒤를 위구르족(Uyghur)과 카자흐족(Kazakh) 인구가 이었다. MDS는 쌍별 네이(Nei) 표준 유전적 거리 행렬을 기반으로 구성되었다(그림 2C). 5개의 알타이-튀르크(AT)어 사용 인구는 함께 군집을 이루어 오른쪽 아래에 위치했고, 다른 중국 소수 민족 그룹은 흩어져 분포하며 한족(漢族) 인구에 가까웠다. 남쪽에서 북쪽으로의 유의미한 경향성이 관찰되었으며, 산서(山西) 한족(漢族)은 북방 한족(北方漢族) 인구와 가깝게 군집을 이루었다. 이후 중국 인구 내의 계통 관계가 구성되었다(그림 2D). 남방 한족(南方漢族)과 남방 토착 소수민족이 첫 번째 분기를 형성했고, 알타이-튀르크(AT)어 및 기타 티베트-히말라야(THO)어 사용 인구가 두 번째 분기를 형성했다. 북방 한족(北方漢族)과 북방 만주족(Manchu) 그룹이 세 번째 분기를 형성했다. 산서(山西) 한족(漢族)은 연주(兗州), 내몽골(內蒙古), 하남(河南)2, 산동(山東), 소주(蘇州) 한족(漢族) 인구와 같은 인접한 북방 인구들 사이에 위치했다. 다른 표준 유전적 거리, PCA, MDS 및 계통 관계 재구성 결과는 일관되게 산서(山西) 한족(漢族)이 남방 한족(南方漢族)이나 다른 THO-, AT-, 몽-미엔(Hmong-Mien)-, 타이-카다이어족(Tai-Kadai) 사용 인구보다 북경(北京) 한족(漢族)과 더 높은 유사성을 지니고 있음을 나타냈다.

그림 2. 표본 추출 위치 및 산서(山西) 한족(漢族)과 다른 61개 중국 참조 인구 간의 쌍별 카발리-스포르차(Cavalli-Sforza) 유전적 거리 (A). 5개 다른 어족에 속하는 62개 인구 간의 쌍별 유전적 거리 개요 (B). 대립유전자 빈도 분포와 쌍별 네이(Nei) 유전적 거리를 기반으로 각각 구성된 주성분 분석 (C) 및 최근린 결합 트리 (D). THS, 티베트-히말라야-시니틱(Trans-Himalayan-Sinitic); THO, 시니틱(Sinitic)을 제외한 티베트-히말라야(Trans-Himalayan).

Haplogroup-Based Meta-Analysis of Ancient and Modern Human Populations

고대 및 현대 인류 집단의 하플로그룹 기반 메타분석

A large number of archeological and historical evidence supported that modern Han Chinese population was derived from the central plain area, near to Shanxi Province, and subsequently admixed with neighboring minority groups (Zhao et al., 2014; Zhao et al., 2015b). Fortunately, many genetic studies focused on the genetic architecture of Chinese ancient populations from Neolithic, Bronze, and Iron Age using the uniparental genetic markers (MtDNA and Y-chromosome) had been performed. Therefore, we comprehensively assessed the genetic difference and phylogenetic relationship between modern and ancient Chinese populations using the publicly available prehistoric Chinese archeological samples. We first meta- analyzed mitochondrial variations using 417 ancient samples assembling from 13 archeological sites (Jiangjialiang, Niuheliang, Halahaigou, Dadianzi, Dashanqian, Erlitou, Hengbei, Taojiazhai, Mogou, Xiaohe, Tianshanbeilu, Fuji, and Jinggouzi) and 770 modern northern-Hans from Beijing Han in the 1,000 genomes project and other genetic studies (Henan, Liaoning, Qingdao, and Xinjiang) and 42 southern-Han samples from Yunnan Province. Geographical position and corresponding calibrated ages of archeological sites were presented in Figure 3A. We assessed the haplogroup frequency distribution and measured the genetic distances between northern-Han Chinese and adjacent ancient populations. Significant mitochondrial haplogroup frequency differences between modern and ancient groups except for Hengbei and Taojiazhai populations were observed (Figure 3B). The relatively smaller genetic distances between ancient and modern populations were observed between Erlitou, Hengbei, Taojiazhai, and other modern Han Chinese populations. The top two components revealed 69.322% variance from 25 populations. Xiaohe population was isolated from other modern and ancient populations, which was consistent with their origin from admixture between European and East Asian (Figure 3C) (Li et al., 2015). Hengbei, Taojiazhai, Niuheliang, and Dashanqian populations had a close relationship with modern Han populations. Similar patterns of population distribution model were also reported in the MDS results (Figure 3D). Southern Han Chinese from Yunnan kept a separate relationship from the northern-Han Chinese. The phylogenetic relationship between modern and ancient populations in Figure 3E showed a close relationship between Dashanqian ancient population and Beijing Han Chinese and a close relationship between aforementioned three archeological sites (Hengbei, Taojiazhai, and Niuheliang). The Erlitou ancient population was close to Qingdao Han. These ancient populations might be the ancestry population of modern Han Chinese.

수많은 고고학적, 역사적 증거는 현대 한족(漢族)이 산서성(山西省) 인근의 중원(中原) 지역에서 유래하여 이후 주변 소수 민족과 혼합되었음을 뒷받침한다(Zhao et al., 2014; Zhao et al., 2015b). 다행히도, 단일부모 유전 표지(mtDNA 및 Y-염색체)를 사용하여 신석기, 청동기, 철기시대의 중국 고대 인구의 유전적 구조에 초점을 맞춘 많은 유전학 연구가 수행되었다. 따라서 우리는 공개적으로 이용 가능한 선사시대 중국 고고학 표본을 사용하여 현대와 고대 중국 인구 간의 유전적 차이와 계통 관계를 종합적으로 평가했다. 먼저 13개 고고학 유적지(강가량(姜家梁), 우하량(牛河梁), 할라해구(哈拉海溝), 대전자(大甸子), 대산전(大山前), 이리두(二里頭), 횡북(橫北), 도가채(陶家寨), 마구(磨溝), 소하(小河), 천산북로(天山北路), 부사(富士), 정구자(井溝子))에서 수집한 417개의 고대 표본과 1000 게놈 프로젝트의 북경(北京) 한족(漢族) 및 기타 유전 연구(하남(河南), 요녕(遼寧), 청도(靑島), 신강(新疆))의 현대 북방 한족(北方漢族) 770명, 그리고 운남성(雲南省)의 남방 한족(南方漢族) 표본 42명의 미토콘드리아 변이를 메타분석했다. 고고학 유적지의 지리적 위치와 해당 보정 연대는 그림 3A에 제시되었다. 우리는 하플로그룹 빈도 분포를 평가하고 북방 한족(北方漢族)과 인접 고대 인구 간의 유전적 거리를 측정했다. 횡북(橫北) 및 도가채(陶家寨) 인구를 제외하고 현대와 고대 집단 간에 유의미한 미토콘드리아 하플로그룹 빈도 차이가 관찰되었다(그림 3B). 이리두(二里頭), 횡북(橫北), 도가채(陶家寨)와 다른 현대 한족(漢族) 인구 사이에서 고대와 현대 인구 간의 비교적 작은 유전적 거리가 관찰되었다. 상위 두 주성분은 25개 인구로부터 69.322%의 분산을 밝혔다. 소하(小河) 인구는 다른 현대 및 고대 인구와 격리되어 있었는데, 이는 유럽인과 동아시아인 간의 혼합에서 비롯된 그들의 기원과 일치한다(그림 3C)(Li et al., 2015). 횡북(橫北), 도가채(陶家寨), 우하량(牛河梁), 대산전(大山前) 인구는 현대 한족(漢族) 인구와 가까운 관계를 가졌다. 유사한 인구 분포 모델 패턴이 MDS 결과에서도 보고되었다(그림 3D). 운남(雲南) 출신의 남방 한족(南方漢族)은 북방 한족(北方漢族)과 분리된 관계를 유지했다. 그림 3E의 현대와 고대 인구 간의 계통 관계는 대산전(大山前) 고대 인구와 북경(北京) 한족(漢族) 간의 가까운 관계, 그리고 앞서 언급한 세 고고학 유적지(횡북(橫北), 도가채(陶家寨), 우하량(牛河梁)) 간의 가까운 관계를 보여주었다. 이리두(二里頭) 고대 인구는 청도(靑島) 한족(漢族)과 가까웠다. 이 고대 인구들은 현대 한족(漢族)의 조상 인구일 수 있다.

To further evaluate the genetic ancestry and genetic relationship between northern-Han and ancient populations from paternal inherited legacy, we collected data from 114 samples obtained from 12 ancient archeological sites (Jiangjialiang, Sanguan, Niuheliang, Halahaigou, Dadianzi, Dashanqian, Jinggouzi, Miaozigou, Hengbei, Taojiazhai, Mogou, and Tianshanbeilu) and then combined with modern data from 2,810 individuals. A total of 80.6% variance extracted from 38 populations showed population substructure existed among the modern Han Chinese population. And Hengbei, Jinggouzi, Dashanqian, Mogou, Taojiazhai, and Sanguan ancient populations showed a paternally close relationship with the modern Han Chinese populations (Figure S5A). Fst and corresponding p values between different populations were calculated and submitted in Table S6. Significant Y-chromosome haplogroup frequency differences were observed due to the statistically significant differences among 572 out of 703 population comparison pairs. MDS was constructed on the basis of the linearized Fst genetic distance matrix (Figure S5B). Nine ancient populations were localized in the upper right position and the other three groups were allocated in the left-center part. Modern Han Chinese populations were clustered in the center and right lower positions. We reconstructed phylogenetic neighbor-joining tree on the basis of the pairwise linearized standard distance, which showed two different clusters: one mainly consisted of modern Han Chinese populations and the other comprised three Taiwan populations, one China Han Chinese, and all ancient populations with the exception of the Hengbei ancient population (Figure S5C). The Hengbei ancient population was first clustered with Shanxi and other northern Han Chinese populations (Shaanxi and Heilongjiang).

부계 유전 유산을 통해 북방 한족(北方漢族)과 고대 인구 간의 유전적 조상과 유전적 관계를 추가로 평가하기 위해, 12개 고대 고고학 유적지(강가량(姜家梁), 삼관(三官), 우하량(牛河梁), 할라해구(哈拉海溝), 대전자(大甸子), 대산전(大山前), 정구자(井溝子), 묘자구(廟子溝), 횡북(橫北), 도가채(陶家寨), 마구(磨溝), 천산북로(天山北路))에서 얻은 114개 표본의 데이터를 수집한 후, 2,810명의 현대인 데이터와 결합했다. 38개 인구에서 추출된 총 80.6%의 분산은 현대 한족(漢族) 인구 내에 하위 구조가 존재함을 보여주었다. 그리고 횡북(橫北), 정구자(井溝子), 대산전(大山前), 마구(磨溝), 도가채(陶家寨), 삼관(三官) 고대 인구는 현대 한족(漢族) 인구와 부계적으로 가까운 관계를 보였다(그림 S5A). 다른 인구 간의 Fst와 해당 p-값은 계산되어 표 S6에 제출되었다. 703개의 인구 비교 쌍 중 572개에서 통계적으로 유의미한 차이가 발견되어, 유의미한 Y-염색체 하플로그룹 빈도 차이가 관찰되었다. MDS는 선형화된 Fst 유전적 거리 행렬을 기반으로 구성되었다(그림 S5B). 9개의 고대 인구는 오른쪽 상단에 위치했고, 다른 세 그룹은 왼쪽 중앙 부분에 할당되었다. 현대 한족(漢族) 인구는 중앙과 오른쪽 하단 위치에 군집되었다. 우리는 쌍별 선형화된 표준 거리를 기반으로 계통 발생학적 최근린 결합 트리를 재구성했으며, 이는 두 개의 다른 군집을 보여주었다: 하나는 주로 현대 한족(漢族) 인구로 구성되었고, 다른 하나는 횡북(橫北) 고대 인구를 제외한 세 개의 대만(臺灣) 인구, 하나의 중국 한족(漢族), 그리고 모든 고대 인구로 구성되었다(그림 S5C). 횡북(橫北) 고대 인구는 먼저 산서(山西) 및 다른 북방 한족(北方漢族) 인구(섬서(陝西) 및 흑룡강(黑龍江))와 군집을 이루었다.

그림 3. 미토콘드리아 변이를 기반으로 한 고대 중국 인구와 현대 한족(漢族) 인구 간의 유전적 친화도. (A) 13개 고대 고고학 유적지의 지리적 위치, 문화 유형 및 보정 연대, 그리고 7개 현대 한족(漢族) 인구의 지리 정보. (B) 고대 및 현대 인구 간의 쌍별 네이(Nei) 유전적 거리 히트맵. (C) 20개 인구 간의 주성분 분석. (D) 네이(Nei) 유전적 거리를 기반으로 재구성된 2차원 척도법 도표 결과. (E) 미토콘드리아 유전 변이를 기반으로 계산된 네이(Nei) 거리의 최근린 결합 트리.

High-Density Genetic Variations of Modern and Ancient Genomes Show Fine-Scale Population Structure of Northern Han

현대 및 고대 게놈의 고밀도 유전 변이는 북방 한족(北方漢族)의 미세 규모 인구 구조를 보여준다

We additionally investigated the fine-scale genetic structure of Shanxi Han by determining the genetic relationships under the context of 65 worldwide populations (Figure 4A). PCA of worldwide populations allocated Shanxi Han at the end of the Eurasian-American genetic cline (Figure 4B). And Shanxi Han clustered closely with Beijing Han in the finer scale of variations from East Asia (Figure 4C). The observed patterns of genetic affinity were subsequently supported by the results from ADMIXTURE analysis (Figure 5). East Asians were a homogeneous population when the predefined ancestry populations are less than eight. Genetic component kept similar between Shanxi Han and Beijing Han, Denver Chinese, Han, and northern Han. The pairwise Fst genetic distances estimated using SNP data were presented in Table S7. The smallest genetic distance was identified between Shanxi Han and Beijing Han (Fst=0.0006), followed by Tujia and another northern-Han (Figure 6A).

우리는 추가로 65개 전 세계 인구의 맥락에서 유전적 관계를 결정함으로써 산서(山西) 한족(漢族)의 미세 규모 유전 구조를 조사했다(그림 4A). 전 세계 인구의 PCA는 산서(山西) 한족(漢族)을 유라시아-아메리카 유전적 경향성의 끝에 할당했다(그림 4B). 그리고 산서(山西) 한족(漢族)은 동아시아의 더 미세한 규모의 변이에서 북경(北京) 한족(漢族)과 가깝게 군집을 이루었다(그림 4C). 관찰된 유전적 친화도 패턴은 이후 ADMIXTURE 분석 결과에 의해 뒷받침되었다(그림 5). 사전 정의된 조상 인구가 8개 미만일 때 동아시아인은 동질적인 집단이었다. 유전적 구성 요소는 산서(山西) 한족(漢族)과 북경(北京) 한족(漢族), 덴버(Denver) 중국인, 한족(漢族), 북방 한족(北方漢族) 사이에서 유사하게 유지되었다. SNP 데이터를 사용하여 추정된 쌍별 Fst 유전적 거리는 표 S7에 제시되었다. 가장 작은 유전적 거리는 산서(山西) 한족(漢族)과 북경(北京) 한족(漢族) 사이에서 확인되었으며 (Fst=0.0006), 그 뒤를 토가족(Tujia)과 다른 북방 한족(北方漢族)이 이었다(그림 6A).

Outgroup-f3 in the form of f3(X, Shanxi Han; Yoruba) showed that the greater genetic affinity identified between Shanxi Han and Han Chinese populations, subsequently followed by the southern Tai-Kadai and Hmong-Mien speakers, and Western Trans-Himalayan and northern Altaic speakers (Figures 6B, C). We subsequently estimated the D-statistics in the form of D (X, Y; Shanxi Han, Yoruba), where X represents the worldwide populations and Y denotes the Chinese populations from different language families, to explore the status of allele sharing. Our results provided supporting evidence for more shared genetic drift between Shanxi Han and northern-Han or neighboring minorities (Figure 7 and S6 and S7). We used the admixture f3(Sourcel, Source2; Shanxi Han) to find the potentially admixed ancestral populations. Two hundred sixty- four out of 2,016 pairs were observed with significant negative values (Figure 8). The potential ancestry populations revealed by the admixture f3 indicated that the ancestral populations of Shanxi-Han derived their ancestry from southern Chinese- related population (Ancestral Southeast Asians) and East- Siberian-related population (Ancestral Northeast Asians), like the two ancestry populations observed in Indian (Ancestral North Indians and Ancestral South Indians) (Reich et al., 2009).

f3(X, Shanxi Han; Yoruba) 형태의 외집단 f3는 산서(山西) 한족(漢族)과 한족(漢族) 인구 간에 더 큰 유전적 친화도가 확인되었으며, 그 뒤를 이어 남방의 타이-카다이어족(Tai-Kadai) 및 몽-미엔어족(Hmong-Mien) 사용자, 서부 티베트-히말라야어족(Trans-Himalayan) 및 북부 알타이어족(Altaic) 사용자가 따름을 보여주었다(그림 6B, C).  우리는 이후 대립유전자 공유 상태를 탐구하기 위해 D(X, Y; Shanxi Han, Yoruba) 형태의 D-통계를 추정했다. 여기서 X는 전 세계 인구를, Y는 다른 어족의 중국 인구를 나타낸다. 우리의 결과는 산서(山西) 한족(漢族)과 북방 한족(北方漢族) 또는 인접 소수민족 간에 더 많은 공유된 유전적 부동에 대한 뒷받침 증거를 제공했다(그림 7, S6, S7). 우리는 잠재적으로 혼합된 조상 인구를 찾기 위해 혼합 f3(Source1, Source2; Shanxi Han)을 사용했다. 2,016개 쌍 중 264개에서 유의미한 음수 값이 관찰되었다(그림 8). 혼합 $f_{3}$에 의해 밝혀진 잠재적 조상 인구는, 산서(山西) 한족(漢族)의 조상 인구가 인도인(북부 인도 조상과 남부 인도 조상)에서 관찰된 두 조상 인구처럼, 남방 중국인 관련 인구(동남아시아 조상)와 동시베리아 관련 인구(동북아시아 조상)로부터 그들의 혈통을 물려받았음을 나타냈다(Reich et al., 2009).

그림 4. 전 세계 65개 인구의 지리적 위치 (A) 및 PCA 결과 (B, C).

그림 5. 2에서 19까지 다양한 사전 정의된 조상 인구를 가진 65개 인구의 모델 기반 결과.

To further validate the minimum streams of ancestry populations and evaluate the corresponding admixture proportion, we first performed the TreeMix analyses among 65 worldwide populations (Figures 9 and S8) and 25 Asian populations (Figure S9). A larger number of recent admixtures or migrations were observed in our TreeMix model. Considering the statistical significance (f3=−0.0018 and Z=−6.662) was observed in the form of f3(She Yakut; Shanxi Han), we then conducted the qpWave and qpAdm using the She and Yakut as source populations and using Yoruba, San, Papuan and Melanesian as outgroup populations. Qp Wave results (p=0.052 for rank1) indicated that Shanxi Han was derived from two ancestral populations. The qpAdm analysis further suggested that Shanxi Han has derived 25.2% Yakut-related ancestry and 74.8% She- related ancestry. Nineteen ancient populations from Eurasian were employed to explore the genetic admixture history between Shanxi Han. The shared genetic history of all pairs was presented in Figure S10. Denisovan and Vindija Neanderthal shared smaller genetic components with others. We found that Shanxi Han kept a distant genetic relationship with two archaic human populations and Italy Iceman, and shared more alleles with DevilsGate (0.2039) and other ancient populations from Southeast Asia and Nepal (Figure 10). DevilsGate, Oakaie showed significantly negative f value in the form of f(A, B; Shanxi Han) (Table S8). We finally used qp Wave to find that the minimum ancient ancestry streams modern northern-Han were 2 (rank1: p=0.118). QpAdm further showed that DevilsGate Hunter-Gatherer-related population contributed 45% ancestry and Oakaie-related ancient population contributed 55% ancestry to modern northern-Han Chinese.

조상 인구의 최소 흐름을 추가로 검증하고 해당 혼합 비율을 평가하기 위해, 우리는 먼저 65개 전 세계 인구(그림 9 및 S8)와 25개 아시아 인구(그림 S9) 사이에서 TreeMix 분석을 수행했다. 우리의 TreeMix 모델에서 더 많은 수의 최근 혼합 또는 이주가 관찰되었다. f3(서족(She), 야쿠트족(Yakut); 산서(山西) 한족(漢族)) 형태에서 통계적 유의성(f3=−0.0018 및 Z=−6.662)이 관찰되었으므로, 우리는 서족(She)과 야쿠트족(Yakut)을 원천 인구로, 요루바족(Yoruba), 산족(San), 파푸아인(Papuan), 멜라네시아인(Melanesian)을 외집단으로 사용하여 qpWave 및 qpAdm을 수행했다. QpWave 결과(rank1에 대해 p=0.052)는 산서(山西) 한족(漢族)이 두 조상 인구에서 유래했음을 나타냈다. qpAdm 분석은 산서(山西) 한족(漢族)이 25.2%의 야쿠트(Yakut) 관련 혈통과 74.8%의 서족(She) 관련 혈통을 물려받았음을 추가로 시사했다. 유라시아 출신의 19개 고대 인구를 사용하여 산서(山西) 한족(漢族) 간의 유전적 혼합 역사를 탐구했다. 모든 쌍의 공유된 유전 역사는 그림 S10에 제시되었다. 데니소바인(Denisovan)과 빈디야(Vindija) 네안데르탈인(Neanderthal)은 다른 집단과 더 작은 유전적 구성 요소를 공유했다. 우리는 산서(山西) 한족(漢族)이 두 고대 인류 집단 및 이탈리아(Italy) 아이스맨과 먼 유전적 관계를 유지하고, 데빌스게이트(DevilsGate, 0.2039) 및 동남아시아와 네팔(Nepal)의 다른 고대 인구와 더 많은 대립유전자를 공유한다는 것을 발견했다(그림 10). 데빌스게이트(DevilsGate), 오아카이에(Oakaie)는 f₃(A, B; Shanxi Han) 형태로 유의미하게 음의 f₃ 값을 보였다(표 S8). 마지막으로 qpWave를 사용하여 현대 북방 한족(北方漢族)의 최소 고대 조상 흐름이 2임을 발견했다(rank1: p=0.118). QpAdm은 데빌스게이트(DevilsGate) 수렵-채집인 관련 인구가 45%의 혈통을, 오아카이에(Oakaie) 관련 고대 인구가 55%의 혈통을 현대 북방 한족(北方漢族)에게 기여했음을 추가로 보여주었다.

그림 6. 쌍별 Fst 유전적 거리(A), 공유 대립유전자(B, C)로 밝혀진 산서(山西) 한족(漢族)과 다른 64개 전 세계 인구 간의 유전적 친화도.

그림 7. 알타이어(Altai) 사용 인구와 다른 전 세계 참조 인구 간 산서(山西) 한족(漢族)과의 공유 유전적 구성 요소: 튀르크어족(Turkic) 위구르(Uyghur) (A), 몽골어족(Mongolic) 몽골인(Mongolian) (B), 퉁구스어족(Tungusic) 오로첸족(Oroqen) (C).

그림 8. 유의미한 음수 값을 갖는 혼합 f3 결과.

그림 9. ML 트리와 모델 잔차로부터 추론된 10개의 이주 사건을 사전 가정으로 한 65개 인구 간의 인구 분할 및 혼합. 상단 패널은 10개의 이주가 있는 ML 트리를 나타내고, 하단 패널은 해당 모델 잔차를 보여준다.

그림 10. f-통계량으로 밝혀진 산서(山西) 한족(漢族)과 19개 고대 인구 간의 유전적 친화도.

 

토론 DISCUSSION

East Asia is occupied by anatomically modern human 50 kya when they migrated out of Africa. These regions are populated by the hunter-gatherer over 40 kya in the Paleolithic time (Nielsen et al., 2017). Under the natural selections from different environments, substance strategies and disease pathogens, the different ethnic group formed their specific genetic structure with a different culture, appearance, and language. In the Neolithic time, agriculture originated from the Yellow, Yangtze and Zhujiang River Basins, may be also included in Liaohe, promoted the process of population genetic structure change with different cultures (Piao et al., 2010). For China in East Asia, the world’s largest ethnic group of the Han Chinese, 55 officially recognized and several unrecognized ethnic groups are subsequently formed with their specific cultural background. The languages they used in this region include over nine language families: Indo-European, Altaic (also called “Trans- Eurasian,” including Turkic, Mongolic, and Tungusic language groups) mainly distrusted in the north; Tai-Kadai, Hmong- Mien, Austronesian, Austroasiatic, and Trans-Himalayan language families in the south. Population substructures among Chinese modern populations revealed by our autosomal STR panel have supported the patterns of population relationship found by the X and Y-chromosome markers, as well as ancestry- informative single nucleotide polymorphisms (He et al., 2017b; He et al., 2018a; He et al., 2018c). Here, our study presented the first comprehensive genetic analysis, including autosomal STR, a meta-analysis of mitochondrial and Y-chromosomal haplogroup distribution, and autosomal SNP data of northern- Han Chinese residing in Shanxi Province. We performed the comprehensive population comparison to investigate the origin, genetic legacy and detailed genetic relationship of modern Han Chinese population, especially for the northern Han Chinese. Our results showed that Altaic and Trans-Himalayan speakers except for Sinitic speakers harbored considerable genetic differences with Han Chinese populations. However, no apparent genetic differentiation between Hmong-Mien-, Tai-Kadai and neighboring Han Chinese populations is revealed in our present study (Figure 1). Analysis from the haplogroup distribution of Neolithic Chinese populations showed that the significant association of genetic continuity between ancient populations from Yellow River Valley sites (Mogou, Taojiazhai, and Hengbei) and modern northern-Han Chinese (Figures 2 and S5). Whole- genome high-density SNP data illustrate that Shanxi Han Chinese inherited 25.2% their ancestry from Yakut-related population and 74.8% from She-related population. Ancient autosomal genetic variation subsequently shows a two-way admixture from ancient North East Asian (45% ancestry from DevilsGate Hunter-Gatherer-related population) and ancient South Asian (55% ancestry Oakaie-related ancient population). These results consistently showed a more complex and ancient population admixture history of northern Han Chinese. Han Chinese may be originated from the admixture between the ancient Tibeto- Burman population and a local pre-Sinitic population which may have been linguistically Altaic in the Neolithic time when agriculture emerged in Yangtze and Yellow River Basins.

동아시아는 5만 년 전 아프리카(Africa)에서 이주한 해부학적 현생인류가 점유했다. 이 지역들은 구석기 시대(舊石器時代) 4만 년 이상 수렵-채집인에 의해 거주되었다(Nielsen et al., 2017). 다른 환경, 생존 전략 및 질병 병원균으로부터의 자연 선택 하에, 다른 민족 집단은 다른 문화, 외모, 언어와 함께 그들만의 특정한 유전 구조를 형성했다. 신석기 시대(新石器時代)에는 황하(黃河), 양자강(揚子江), 주장강(珠江) 유역에서 기원한 농업이, 어쩌면 요하(遼河)도 포함하여, 다른 문화와 함께 인구 유전 구조 변화 과정을 촉진했다(Piao et al., 2010). 동아시아의 중국에서는, 세계 최대 민족 집단인 한족(漢族)과 55개의 공식 인정된 민족 및 여러 미인정 민족 집단이 그들만의 특정한 문화적 배경을 가지고 이후 형성되었다. 이 지역에서 사용된 언어는 9개 이상의 어족을 포함한다: 북부에서 주로 분포하는 인도-유럽어족(Indo-European), 알타이어족(Altaic, “트랜스-유라시아어족”이라고도 하며 튀르크어족(Turkic), 몽골어족(Mongolic), 퉁구스어족(Tungusic) 포함), 남부의 타이-카다이어족(Tai-Kadai), 몽-미엔어족(Hmong-Mien), 오스트로네시아어족(Austronesian), 오스트로아시아어족(Austroasiatic), 티베트-히말라야어족(Trans-Himalayan)이 있다. 우리의 상염색체 STR 패널로 밝혀진 현대 중국 인구 간의 하위 구조는 X 및 Y-염색체 표지, 그리고 혈통 정보 단일염기다형성(ancestry-informative single nucleotide polymorphism)에 의해 발견된 인구 관계 패턴을 지지했다(He et al., 2017b; He et al., 2018a; He et al., 2018c). 본 연구는 산서성(山西省)에 거주하는 북방 한족(北方漢族)의 상염색체 STR, 미토콘드리아 및 Y-염색체 하플로그룹 분포의 메타분석, 그리고 상염색체 SNP 데이터를 포함하는 최초의 포괄적인 유전 분석을 제시했다. 우리는 현대 한족(漢族), 특히 북방 한족(北方漢族)의 기원, 유전적 유산 및 상세한 유전적 관계를 조사하기 위해 포괄적인 인구 비교를 수행했다. 우리의 결과는 시니틱(Sinitic) 화자를 제외한 알타이어족(Altaic) 및 티베트-히말라야어족(Trans-Himalayan) 화자들이 한족(漢族) 인구와 상당한 유전적 차이를 보였음을 나타냈다. 그러나, 현재 연구에서는 몽-미엔어족(Hmong-Mien), 타이-카다이어족(Tai-Kadai)과 인접 한족(漢族) 인구 사이에 명백한 유전적 분화가 드러나지 않았다(그림 1). 신석기 시대(新石器時代) 중국 인구의 하플로그룹 분포 분석은 황하(黃河) 유역 유적지(마구(磨溝), 도가채(陶家寨), 횡북(橫北))의 고대 인구와 현대 북방 한족(北方漢族) 간의 유전적 연속성의 유의미한 연관성을 보여주었다(그림 2 및 S5). 전체 게놈 고밀도 SNP 데이터는 산서(山西) 한족(漢族)이 그들의 혈통의 25.2%를 야쿠트(Yakut) 관련 인구로부터, 74.8%를 서족(She) 관련 인구로부터 물려받았음을 보여준다. 고대 상염색체 유전 변이는 이후 고대 동북아시아인(데빌스게이트(DevilsGate) 수렵-채집인 관련 인구로부터 45% 혈통)과 고대 남아시아인(오아카이에(Oakaie) 관련 고대 인구로부터 55% 혈통)으로부터의 양방향 혼합을 보여준다. 이러한 결과들은 일관되게 북방 한족(北方漢族)의 더 복잡하고 오래된 인구 혼합 역사를 보여주었다. 한족(漢族)은 양자강(揚子江)과 황하(黃河) 유역에서 농업이 출현한 신석기 시대(新石器時代)에, 고대 티베트-버마어파(Tibeto-Burman) 인구와 언어학적으로 알타이어족(Altaic)이었을 수 있는 토착 전(前) 시니틱(pre-Sinitic) 인구 간의 혼합에서 기원했을 수 있다.

A recent large-scale whole-genome variation study covering 11,670 Han Chinese individuals from 24 out of 33 administrative regions was carried out to explore the Han Chinese population genetic structure and genetic ancestry (Chiang et al., 2018).  Their valuable finding of east-west genetic distinction among Han Chinese is one indispensable previously unrecognized population structure, which is perfectly complemented the north-south differentiation previously found by Xu et al. (2009). Using high-density SNP typing data and other scientists using uniparental markers and classical markers (Xu et al., 2009; Stoneking and Delfin, 2010; Sanchez-Mazas et al., 2011). Our results in this study on the basis of the nationwide STR variations also provide the microsatellite evidence for north- south genetic cline but fail to reveal the east-to-west difference, which may be caused by the sample coverage.  Lu et al. (2016). whole-genome sequenced 39 Han Chinese and 38 Tibetan individuals to investigate the gene pool of the Tibetan and Han group. They found that Tibetan and Han Chinese diverged from each other at 7,000-13,000BC during the last glacial maximum (Lu et al., 2016).  Wang et al. (2018) recently also tried to investigate and elucidate the precise divergence time, genetic structure and admixture history between Han Chinese and neighboring country populations (Japanese and Korean). Their results suggested that Han Chinese and other focused two populations split approximately 1,000-1,600 BC in the Shang dynasty in Chinese history and subsequently substantial genetic admixture between them and other adjacent populations have occurred (Wang et al., 2018b). The processes of ancient whole-genome DNA studies with the technological innovations of DNA hybridization enrichment and next-generation sequencing has revolutionized the phylogenetic relationship and population history reconstruction in the European, American, Oceanian and even southeast Asians (Nielsen et al., 2017). In East Asia, just two projects respectively focused on one 40,000-year-old individual from Tianyuan cave and two hunter-gatherers from Devil’s Gate have been performed.  Yang et al. (2017) sequenced the whole-genome of Tianyuan ancient people (40,000BP) and discovered a strong genetic affinity between these ancient people and present populations, which indicated that there is a genetic continuity or population turnover in the East Asian continent (Yang et al., 2017b).  Siska et al. (2017) genome-wide analyzed two Devil’s Neolithic individuals (~7,700BP) near to the Amur basin and also detected the genetic continuity in northeast Asia. If ancient people from Paleolithic, Neolithic, Bronze, and Iron Ages in East Asia are all sequenced and conducted corresponding population history reconstruction combined with the historical, cultural, linguistic and archeological findings, a complete genetic landscape of the East Asians will be obtained. However, a number of ancient people excavated from different archeological sites in China have so far received little attention. Fortunately, there still some exploratory projects focused on the genetic variations of the uniparental markers (mtDNA and Y-chromosome) and Neolithic or historical ancient people been carried out. Thus, we can perform the first meta-analysis to investigate the phylogenetic relationship between the ancient population and modern northern-Han Chinese population. Our present meta-analysis results from the Neolithic ancient people and modern Han Chinese on the basis of the combined genetic variations of mtDNA and Y-chromosome first showed that the ancient populations from West Liao River Valley sites (Dasanqian and Niuheliang) and Yellow River Valley sites (Hengbei, Taojiazhai) share considerable similar mitochondrial haplogroup with the modern northern-Han Chinese populations. For Y-chromosome variations, ancient people from the Hengbei site shared the more significant genetic similarity with modern northern-Han Chinese from Shanxi and Heilongjiang provinces, and Dashanqian and Mogou ancient people bear a similar genetic assemblage with modern Taiwan Han people. Mogou site in the Ganqing region adjacent to the central plain is the hometown of Di-Qiang people who are thought as the direct ancestral population of Han Chinese, which is genetically close to the Han Chinese population. Our results reveal a close genetic relationship among Hengbei, Mogou and modern northern-Han Chinese populations. Our findings combined with the archeological, historical and linguistic evidence consistently supported the admixed genetic origin of modern Han Chinese.

최근 33개 행정 구역 중 24개 지역의 11,670명 한족(漢族)을 대상으로 한 대규모 전체 게놈 변이 연구가 한족(漢族)의 인구 유전 구조와 유전적 조상을 탐구하기 위해 수행되었다(Chiang et al., 2018). 한족(漢族) 내 동-서 유전적 구분에 대한 그들의 귀중한 발견은 이전에 인식되지 않았던 필수적인 인구 구조 중 하나로, Xu 등(2009)이 이전에 발견한 남-북 분화를 완벽하게 보완한다. 고밀도 SNP 타이핑 데이터와 다른 과학자들은 단일부모 표지 및 고전적 표지를 사용했다(Xu et al., 2009; Stoneking and Delfin, 2010; Sanchez-Mazas et al., 2011). 전국적인 STR 변이에 기초한 본 연구의 결과는 또한 남-북 유전적 경향성에 대한 미소부수체 증거를 제공하지만, 표본 적용 범위 때문에 동-서 차이를 밝히는 데는 실패했다. Lu 등(2016)은 티베트족(Tibetan)과 한족(漢族) 집단의 유전자 풀을 조사하기 위해 39명의 한족(漢族)과 38명의 티베트족(Tibetan) 개인의 전체 게놈을 시퀀싱했다. 그들은 티베트족(Tibetan)과 한족(漢族)이 마지막 최대 빙하기 동안인 기원전 7,000-13,000년에 서로 분기했음을 발견했다(Lu et al., 2016). Wang 등(2018)은 최근 한족(漢族)과 이웃 국가 인구(일본인(Japanese) 및 한국인(Korean)) 간의 정확한 분기 시간, 유전 구조 및 혼합 역사를 조사하고 설명하려 시도했다. 그들의 결과는 한족(漢族)과 다른 두 대상 인구가 중국 역사상 상(商) 왕조 시대인 기원전 약 1,000-1,600년에 분리되었고, 이후 그들과 다른 인접 인구 간에 상당한 유전적 혼합이 발생했음을 시사했다(Wang et al., 2018b). DNA 혼성화 농축 및 차세대 시퀀싱의 기술 혁신과 함께 고대 전체 게놈 DNA 연구 과정은 유럽인, 아메리카인, 오세아니아인, 심지어 동남아시아인의 계통 관계 및 인구 역사 재구성에 혁명을 일으켰다(Nielsen et al., 2017). 동아시아에서는, 각각 전원동(田園洞)의 4만 년 전 개인과 데빌스게이트(Devil’s Gate)의 두 수렵-채집인에 초점을 맞춘 단 두 개의 프로젝트만이 수행되었다. Yang 등(2017)은 전원(田園) 고대인(40,000BP)의 전체 게놈을 시퀀싱하고 이 고대인과 현존 인구 간의 강한 유전적 친화도를 발견했으며, 이는 동아시아 대륙에 유전적 연속성 또는 인구 교체가 있음을 나타냈다(Yang et al., 2017b). Siska 등(2017)은 아무르(Amur) 분지 근처의 두 데빌스(Devil’s) 신석기 시대 개인(~7,700BP)을 게놈 전반에 걸쳐 분석하고 동북아시아에서의 유전적 연속성을 감지했다. 만약 동아시아의 구석기, 신석기, 청동기, 철기시대의 고대인들이 모두 시퀀싱되고, 역사적, 문화적, 언어학적, 고고학적 발견과 결합하여 해당 인구 역사 재구성이 수행된다면, 동아시아인의 완전한 유전적 지형이 얻어질 것이다. 그러나 중국의 다른 고고학 유적지에서 발굴된 수많은 고대인들은 지금까지 거의 주목받지 못했다. 다행히도, 단일부모 표지(mtDNA 및 Y-염색체)의 유전적 변이와 신석기 또는 역사 시대 고대인에 초점을 맞춘 몇몇 탐색적 프로젝트가 여전히 수행되고 있다. 따라서 우리는 고대 인구와 현대 북방 한족(北方漢族) 인구 간의 계통 관계를 조사하기 위해 첫 번째 메타분석을 수행할 수 있다. mtDNA와 Y-염색체의 결합된 유전 변이에 기초한 신석기 시대 고대인과 현대 한족(漢族)에 대한 우리의 현재 메타분석 결과는, 서요하(西遼河) 유역 유적지(대산전(大山前) 및 우하량(牛河梁))와 황하(黃河) 유역 유적지(횡북(橫北), 도가채(陶家寨))의 고대 인구가 현대 북방 한족(北方漢族) 인구와 상당히 유사한 미토콘드리아 하플로그룹을 공유함을 먼저 보여주었다. Y-염색체 변이의 경우, 횡북(橫北) 유적지의 고대인들은 산서(山西)와 흑룡강성(黑龍江省)의 현대 북방 한족(北方漢族)과 더 유의미한 유전적 유사성을 공유했으며, 대산전(大山前)과 마구(磨溝) 고대인들은 현대 대만(臺灣) 한족(漢族)과 유사한 유전적 구성을 지녔다. 중원(中原)에 인접한 감청(甘靑) 지역의 마구(磨溝) 유적지는 한족(漢族)의 직접적인 조상 인구로 생각되는 저-강(氐-羌)족의 고향으로, 한족(漢族)과 유전적으로 가깝다. 우리의 결과는 횡북(橫北), 마구(磨溝) 및 현대 북방 한족(北方漢族) 인구 간의 가까운 유전적 관계를 밝혀냈다. 우리의 발견은 고고학적, 역사적, 언어학적 증거와 결합하여 현대 한족(漢族)의 혼합된 유전적 기원을 일관되게 지지했다.

 

전망 PERSPECTIVE

In summary, we genotyped 23-autosomal-STRs in 3,089 Shanxi northern-Han Chinese individuals and provided the first batch of allele frequency, forensic and population genetic parameters of northern Han Chinese. Comprehensive worldwide and nationwide population comparisons not only showed that Shanxi harbored a strong similar genetic assemblage with adjacent Han populations but also illustrated that there were apparent genetic distinctions between north- to-south Han Chinese as well as genetic differentiation between populations belonging to different language families, obviously differences observed between Tibetan, Uyghur, and others here. The first meta-analysis based on the mitochondrial and Y-chromosomal genetic variations among ancient and modern Asian populations showed a genetic affinity and genetic continuity between Mogou, Hengbei ancient population and present-day northern-Han Chinese. We also found Neolithic agriculture expansion related Dashanqian and Niuheliang ancient populations are genetically close to modern northern Han. The qpWave/qpAdm modeling further revealed that modern northern Han Chinese carried 74.8% She-related ancestry and 25.2% Yakut-related ancestry. Both Hengbei-associated and Tibetan-related uniparental lineage (D haplogroup) were observed in modern Northern Han Chinese. Besides, approximately 45% DevilsGate-like ancestry, one Tungusic-affiliated Neolithic population, was modeled via ancient DNA. Summarily, consistent with previous linguistic and archaeological evidence, the genetic mixing that led to the emergence of a Han Chinese ethnicity occurred at a very early period, probably in Neolithic times, and this mixing involved an ancient Tibeto-Burman population and a local pre-Sinitic population, which may have been linguistically Altaic. Fine-scale population history reconstruction of north Han from modern and ancient genomes consistently model their ancestral populations deriving from ancestral North East Asian and ancestral South East Asian.

요약하면, 우리는 3,089명의 산서(山西) 북방 한족(北方漢族) 개인에서 23개의 상염색체 STR을 유전자형 분석하고, 북방 한족(北方漢族)의 대립유전자 빈도, 법의학 및 집단 유전 매개변수의 첫 번째 묶음을 제공했다. 포괄적인 전 세계 및 전국 인구 비교는 산서(山西)가 인접 한족(漢族) 인구와 강하게 유사한 유전적 구성을 지니고 있음을 보여줄 뿐만 아니라, 남북 한족(漢族) 간에 명백한 유전적 구분이 있고, 다른 어족에 속하는 인구 간에도 유전적 분화가 있으며, 특히 티베트족(Tibetan), 위구르족(Uyghur) 및 기타 집단 간에 명백한 차이가 관찰되었음을 보여주었다. 고대 및 현대 아시아 인구 간의 미토콘드리아 및 Y-염색체 유전 변이에 기초한 첫 메타분석은 마구(磨溝), 횡북(橫北) 고대 인구와 현존하는 북방 한족(北方漢族) 간의 유전적 친화도 및 유전적 연속성을 보여주었다. 우리는 또한 신석기 농업 확장과 관련된 대산전(大山前) 및 우하량(牛河梁) 고대 인구가 현대 북방 한족(北方漢族)과 유전적으로 가깝다는 것을 발견했다. qpWave/qpAdm 모델링은 현대 북방 한족(北方漢族)이 74.8%의 서족(She) 관련 혈통과 25.2%의 야쿠트(Yakut) 관련 혈통을 지니고 있음을 추가로 밝혔다. 횡북(橫北) 관련 및 티베트(Tibetan) 관련 단일부모 계통(D 하플로그룹)이 모두 현대 북방 한족(北方漢族)에서 관찰되었다. 게다가, 퉁구스(Tungusic) 계열 신석기 인구인 데빌스게이트(DevilsGate) 유사 혈통이 고대 DNA를 통해 약 45%로 모델링되었다. 요약하면, 이전의 언어학적 및 고고학적 증거와 일치하게, 한족(漢族)이라는 민족의 출현으로 이어진 유전적 혼합은 아마도 신석기 시대(新石器時代)인 매우 이른 시기에 일어났으며, 이 혼합에는 고대 티베트-버마어파(Tibeto-Burman) 인구와 언어학적으로 알타이어족(Altaic)이었을 수 있는 토착 전(前) 시니틱(pre-Sinitic) 인구가 관여했다. 현대 및 고대 게놈으로부터의 북방 한족(北方漢族)의 미세 규모 인구 역사 재구성은 그들의 조상 인구가 동북아시아 조상과 동남아시아 조상에서 유래했음을 일관되게 모델링한다.

 

윤리 성명 ETHICS STATEMENT

This study was approved by the Ethics Committee of Zunyi Medical University and corresponding experiments have followed the recommendations of the World Medical Association Declaration of Helsinki. Informed consent was obtained before the sample collection from the participants.

이 연구는 준의의과대학(遵義醫科大學) 윤리위원회의 승인을 받았으며, 해당 실험은 세계의사협회 헬싱키 선언(Declaration of Helsinki)의 권고를 따랐다. 참여자들로부터 표본을 수집하기 전에 사전 동의를 받았다.

저자 기여 AUTHOR CONTRIBUTIONS

GH, PC, and FJ conceived the idea for the study. GH, PC, and FJ performed or supervised wet laboratory work. PC, JW, LL, HG, XZ, HL, LY, GH, MW, YH, GC, and YL analyzed the data. GH wrote and edited the manuscript.

GH, PC, FJ는 연구 아이디어를 구상했다. GH, PC, FJ는 실험실 작업을 수행하거나 감독했다. PC, JW, LL, HG, XZ, HL, LY, GH, MW, YH, GC, YL은 데이터를 분석했다. GH는 원고를 작성하고 편집했다.

자금 지원 FUNDING

This work was supported by grants from the PhD Scientific Research Start-up Fund of Affiliated Hospital of Zunyi Medical University (No. 201501) and the National Natural Science Foundation of China (No. 81401562).

이 연구는 준의의과대학(遵義醫科大學) 부속병원 박사 과학 연구 시작 기금(No. 201501)과 중국 국가자연과학기금(No. 81401562)의 지원을 받았다.

보충 자료 SUPPLEMENTARY MATERIAL

The Supplementary Material for this article can be found online at:

https://www.frontiersin.org/journals/genetics/articles/10.3389/fgene.2019.01045/full full#supplementary-material

이 논문의 보충 자료는 다음 주소에서 온라인으로 확인할 수 있다:

https://www.frontiersin.org/journals/genetics/articles/10.3389/fgene.2019.01045/full full#supplementary-material

 

참고문헌 REFERENCES

Aguilar-Velazquez, J. A., Martinez-Cortes, G., Inclan-Sanchez, A., Romero- Renteria, O., Diaz-Navarro, X. X., and Rangel-Villalobos, H. (2016). Population data of 23 STR loci (PowerPlex(R) Fusion System) in Mexican Mestizos from the West Region. Int. J. Legal Med. 130, 1489-1491. doi: 10.1007/ s00414-016-1361-0

Almeida, C., Ribeiro, T., Oliveira, A. R., Porto, M. J., Costa Santos, J., Dias, D., et al. (2015). Population data of the GlobalFiler ((R)) Express loci in South Portuguese population. Forensic Sci. Int. Genet. 19, 39-41. doi: 10.1016/j. fsigen.2015.06.001

Chen, J., Zheng, H., Bei, J. X., Sun, L., Jia, W. H., Li, T., et al. (2009). Genetic structure of the Han Chinese population revealed by genome-wide SNP variation. Am. J. Hum. Genet. 85, 775-785. doi: 10.1016/j.ajhg.2009.10.016

Chen, P., He, G., Zou, X., Wang, M., Jia, F., Bai, H., et al. (208). Forensic characterization and genetic polymorphisms of 19 X-chromosomal STRs in 1344 Han Chinese individuals and comprehensive population relationship analyses among 20 Chinese groups. PLoS One 13, e0204286. doi: 10.1371/ journal.pone.0204286

Chen, P., Wang, B., Gao, B., and He, G. (2019), Forensic features and genetic structure of 23 autosomal STRs in Artux Turkic-speaking population residing in southwestern Xinjiang Uyghur Autonomous Region. Int. J. Legal Med. 133, 1393-1395. doi: 10.1007/s00414-019-02072-7

Chen, P., Wang, B., He, G., Song, E., Luo, H., Zhang, L., et al. (2017). Population genetic analyses of 20 autosomal STR loci in Chinese Han population from Tianjin in Northern China. Forensic Sci. Int. Genet. 27, 184-185. doi: 10.1016/j. fsigen.2016.11.010

Chiang, C. W. K., Mangul, S., Robles, C., and Sankararaman, S. (2018). A Comprehensive map of genetic variation in the World’s Largest Ethnic Group- Han Chinese. Mol. Biol. Evol. 35, 2736-2750. doi: 10.1093/molbev/msy170

Choi, E.-J., Park, K.-W., Lee, Y.-H., Nam, Y.-H., Suren, G., Ganbold, U., et al. (2017). Forensic and population genetic analyses of the GlobalFiler STR loci in the Mongolian population. Genes Genomics 39, 423-431. doi: 10.1007/ 13258-016-0511-6

Chu, J. Y., Huang, W., Kuang, S. Q., Wang, J. M., Xu, J. J., Chu, Z. T., et al. (1998). Genetic relationship of populations in China. Proc. Natl. Acad. Sci. U. S. A. 95. 11763-11768. doi: 10.1073/pnas.95.20.11763

Cui, Y., Li, C., Gao, S., Xie, C., and Zhou, H. (2010). Early Eurasian migration traces in the Tarim Basin revealed by mtDNA polymorphisms. Am. J. Phys. Anthropol. 142, 558-564. doi: 10.1002/ajpa.21257

Cui, Y., Li, H., Ning, C., Zhang, Y., Chen, L., Zhao, X., et al. (2013). Y Chromosome analysis of prehistoric human populations in the West Liao River Valley, Northeast China. BMC Evol. Biol. 13, 216. doi: 10.1186/1471-2148-13-216

Dong, Y., Li, C., Luan, F., Li, Z., Li, H., Cui, Y., et al. (2015). Low Mitochondrial DNA diversity in an ancient population from china: insight into social organization at the Fujia site. Hum Biol 87, 71-84. doi: 10.13110/humanbiology.87.1.0071

Evanno, G., Regnaut, S., and Goudet, J. (2005). Detecting the number of clusters of individuals using the software STRUCTURE: a simulation study. Mol. Ecol. 14, 2611-2620. doi: 10.1111/j.1365-294X.2005.02553.x

Excoffier, L., and Lischer, H. E. (2010). Arlequin suite ver 3.5: a new series of programs to perform population genetics analyses under Linux and Windows. Mol. Ecol Resour, 10, 564-567. doi: 10.1111/j.1755-0998.2010.02847.x

Fu, X., He, J., Guo, J., Liu, Y., Wang, Z., Lv, J., et al. (2017). Genetic distribution of 21 STR loci in the Chinese Han population from Hainan Island using Goldeneye DNA ID 22NC Kit. Forensic Sci. Int. Genet. 29, e19-e20. doi: 10.1016/j.fsigen.2017.04.014

Fujii, K., Iwashima, Y., Kitayama, T., Nakahara, H., Mizuno, N., and Sekiguchi, K. (2014). Allele frequencies for 22 autosomal short tandem repeat loci obtained by PowerPlex Fusion in a sample of 1501 individuals from the Japanese population. Leg. Med. (Tokyo) 16, 234-237. doi: 10.1016/j.legalmed.2014.03.007

Gao, S. Z., Zhang, Y., Wei, D., Li, H. J., Zhao, Y. B., Cui, Y. Q., et al. (2015). Ancient DNA reveals a migration of the ancient Di-qiang populations into Xinjiang as early as the early Bronze Age. Am. J. Phys. Anthropol. 157, 71-80. doi: 10.1002/ ajpa.22690

Gaviria, A., Zambrano, A. K., Morejon, G., Galarza, J., Aguirre, V., Vela, M., et al. (2013). Twenty two autosomal microsatellite data from Ecuador (Powerplex Fusion). Forensic Sci. Int. Genet. Suppl. Ser. 4, e330-e333. doi: 10.1016/j. fsigss.2013.10.169

Ge, J., Sun, H., Li, H., Liu, C., Yan, J., and Budowle, B. (2014). Future directions of forensic DNA databases. Croat. Med. J. 55, 163-166. doi: 10.3325/ cmj.2014.55.163

Genomes Project, C., Auton, A., Brooks, L. D., Durbin, R. M., Garrison, E. P., Kang, H. M., et al. (2015). A global reference for human genetic variation. Nature 526, 68-74. doi: 10.1038/nature15393

Gouy, A., and Zieger, M. (2017). STRAF-A convenient online tool for STR data evaluation in forensic genetics. Forensic Sci. Int. Genet. 30, 148-151. doi: 10.1016/j.fsigen.2017.07.007

Guerreiro, S., Ribeiro, T., Porto, M. J., Carneiro De Sousa, M. J., and Dario, P. (2017). Characterization of GlobalFiler loci in Angolan and Guinean populations inhabiting Southern Portugal. Int. J. Legal Med. 131, 365-368. doi: 10.1007/s00414-016-1497-y

Hansen, J. (2005). Using SPSS for windows and macintosh: analyzing and understanding data. Am. Statistician 59, 113-113. doi: 10.1198/tas.2005.s139

He, G.-L., Chen, P.-Y., Gao, B., Han, Y.-Y., Zou, X., Song, F., et al. (2017a). Phylogenetic analysis among 27 Chinese populations and genetic polymorphisms of 20 autosomal STR loci in a Chinese Uyghur ethnic minority group. Aust. J. Forensic Sci. 50 (5), 493-502. doi: 10.1080/00450618.2016.1275793

He, G., Chen, P., Zou, X., Chen, X., Song, F., Yan, J., et al. (2017b). Genetic polymorphism investigation of the Chinese Yi minority using PowerPlex(R) Y23 STR amplification system. Int. J. Legal Med. 131, 663-666. doi: 10.1007/ s00414-017-1537-2

He, G., Li, Y., Wang, Z., Liang, W., Luo, H., Liao, M., et al. (2017c). Genetic diversity of 21 autosomal STR loci in the Han population from Sichuan province, Southwest China. Forensic Sci. Int. Genet. 31, e33-e35. doi: 10.1016/j. fsigen.2017.07.006

He, G., Li, Y., Zou, X., Zhang, Y., Li, H., Wang, M., et al. (2018a). X-chromosomal STR-based genetic structure of Sichuan Tibetan minority ethnicity group and its relationships to various groups. Int. J. Legal Med. 132, 409-413. doi: 10.1007/ s00414-017-1672-9

He, G., Wang, M., Liu, J., Hou, Y., and Wang, Z. (2018b). Forensic features and phylogenetic analyses of Sichuan Han population via 23 autosomal STR loci included in the Huaxia Platinum System. Int. J. Legal Med. 132, 1079-1082. doi: 10.1007/s00414-017-1679-2

He, G., Wang, Z., Wang, M., Luo, T., Liu, J., Zhou, Y., et al. (2018c). Forensic ancestry analysis in two Chinese minority populations using massively parallel sequencing of 165 ancestry-informative SNPs. Electrophoresis 39, 2732-2742. doi: 10.1002/elps.201800019

He, G., Wang, Z., Wang, M., Zou, X., Liu, J., Wang, S., et al. (2018d). Genetic variations and forensic characteristics of Han Chinese population residing in the Pearl River Delta revealed by 23 autosomal STRs. Mol. Biol. Rep. 45, 1125- 1133. doi: 10.1007/s11033-018-4264-y

He, G., Wang, Z., Wang, M., Zou, X., Liu, J., Wang, S., et al. (2018e). Genetic variations and forensic characteristics of Han Chinese population residing in the Pearl River Delta revealed by 23 autosomal STRs. Mol. Biol. Rep. 45 (5), 1125-1133. doi: 10.1007/s11033-018-4264-y

He, G., Wang, Z., Yan, J., and Hou, Y. (2017d). Chinese population genetic substructure using 23 Y-chromosomal STRs. Forensic Sci. Int. Genet. Suppl. Ser. 6, e110-e111. doi: 10.1016/j.fsigss.2017.09.038

Hossain, T., Hasan, M., Mazumder, A. K., Momtaz, P., Sufian, A., Khandaker, J. A., et al. (2016). Genetic polymorphism studies on 22 autosomal STR loci of the PowerPlex fusion system in Bangladeshi population. Leg. Med. (Tokyo) 23, 44-46. doi: 10.1016/j.legalmed.2016.09.005

Hu, S., Zhao, W., and Wang, T. (2015). Genetic polymorphisms of 19 STR loci in Gansu Hui. Chin. J. Forensic Med. 30, 620-621. doi: 10.13618/j.issn.1001-5728. 2015.06.021

Huang, L., Chen, X., Xiang, C., Su, S., Fan, Y., and Xu, B. (2016). Genetic Polymorphisms of 19 STR Loci in Yunnan Han population. Chin. J. Forensic Med. 31 (02), 187-191. doi: 10.13618/j.issn. 1001-5728.2016.02.023

Jeong, C., Ozga, A. T., Witonsky, D. B., Malmstrom, H., Edlund, H., Hofman, C. A., et al. (2016). Long-term genetic stability and a high-altitude East Asian origin for the peoples of the high valleys of the Himalayan arc. Proc. Natl. Acad. Sci. U. S. A. 113, 7485-7490. doi: 10.1073/pnas.1520844113

Jin, X., Wei, Y., Chen, J., Kong, T., Mu, Y., Guo, Y., et al. (2017). Phylogenic analysis and forensic genetic characterization of Chinese Uyghur group via autosomal multi STR markers. Oncotarget 8, 73837-73845. doi: 10.18632/oncotarget.17992

Kalinowski, S. T. (2002). Evolutionary and statistical properties of three genetic distances. Mol. Ecol. 11, 1263-1273. doi: 10.1046/j.1365-294X.2002.01520.x

Kovach, W. L. (2007). MVSP-A MultiVariate Statistical Package for Windows, ver. 3.1. (Wales, U.K: Kovach Computing Services, Pentraeth).

Kumar, S., Stecher, G., and Tamura, K. (2016). MEGA7: molecular evolutionary genetics analysis version 7.0 for bigger datasets. Mol. Biol. Evol. 33, 1870-1874. doi: 10.1093/molbev/msw054

Li, C., Li, H., Cui, Y., Xie, C., Cai, D., Li, W., et al. (2010). Evidence that a West-East admixed population lived in the Tarim Basin as early as the early Bronze Age. BMC Biol. 8, 15. doi: 10.1186/1741-7007-8-15

Li, C., Ning, C., Hagelberg, E., Li, H., Zhao, Y., Li, W., et al. (2015). Analysis of ancient human mitochondrial DNA from the Xiaohe cemetery: insights into prehistoric population movements in the Tarim Basin, China. BMC Genet. 16, 78. doi: 10.1186/s12863-015-0237-5

Li, H., Zhao, X., Zhao, Y., Li, C., Si, D., Zhou, H., et al. (2011). Genetic characteristics and migration history of a bronze culture population in the West Liao-River valley revealed by ancient DNA. J. Hum. Genet. 56, 815-822. doi: 10.1038/jhg.2011.102

Li, J., Zeng, W., Zhang, Y., Ko, A. M., Li, C., Zhu, H., et al. (2017). Ancient DNA reveals genetic connections between early Di-Qiang and Han Chinese. BMC Evol. Biol. 17, 239. doi: 10.1186/s12862-017-1082-0

Li, J., Zhang, Y., Zhao, Y., Chen, Y., Ochir, A., Sarenbilige, et al. (2018). The genome of an ancient Rouran individual reveals an important paternal lineage in the Donghu population. Am. J. Phys. Anthropol. 166, 895-905. doi: 10.1002/ajpa.23491

Li, J. Z., Absher, D. M., Tang, H., Southwick, A. M., Casto, A. M., Ramachandran, S., et al. (2008). Worldwide human relationships inferred from genome-wide patterns of variation. Science 319, 1100-1104. doi: 10.1126/science.1153717

Li, Y. (2015). Allele frequency of 19 autosomal STR loci in the Bai population from the southwestern region of mainland China. Electrophoresis 36, 2498-2503. doi: 10.1002/elps.201500129

Lipson, M., Cheronet, O., Mallick, S., Rohland, N., Oxenham, M., Pietrusewsky, M., et al. (2018). Ancient genomes document multiple waves of migration in Southeast Asian prehistory. Science 361, 92-95. doi: 10.1126/science.aat3188

Liu, J., Guo, L., Qi, R., Li, S.-Y., Yin, J.-Y., Zhang, W., et al. (2013). Allele frequencies of 19 autosomal STR loci in Manchu population of China with phylogenetic structure among worldwide populations. Gene 529, 282-287. doi: 10.1016/j. gene.2013.07.033

Liu, J., Wang, Z., He, G., Wang, M., and Hou, Y. (2019). Genetic polymorphism and phylogenetic differentiation of the Huaxia Platinum System in three Chinese minority ethnicities. Sci. Rep. 9, 3371. doi: 10.1038/s41598-019-39794-y

Liu, Q. (2017). Population data and mutation rates of 19 STR loci in seven provinces from China based on Goldeneye DNA ID System 20A. Int. J. Legal Med. 131,653-656. doi: 10.1007/s00414-016-1441-1

Liu, Y., Guo, L., Jin, H., Li, Z., Bai, R., Shi, M., et al. (2017). Developmental validation of a 6-dye typing system with 27 loci and application in Han population of China. Sci. Rep. 7, 4706. doi: 10.1038/s41598-017-04548-1

Lu, D., Lou, H., Yuan, K., Wang, X., Wang, Y., Zhang, C., et al. (2016). Ancestral origins and genetic history of tibetan highlanders. Am. J. Hum. Genet. 99,580- 594. doi: 10.1016/j.ajhg.2016.07.002

Lu, Y., Song, P., Huang, J., and Wu, X. (2017). Genetic polymorphisms of 20 autosomal STR loci in 5141 individuals from the Han population of Xiamen, Southeast China. Forensic Sci. Int. Genet. 29, e31-e32. doi: 10.1016/j. fsigen.2017.03.023

Meng, H. (2016). Autosomal-STR based genetic structure of Chinese Xibe ethnic group and its relationships to various groups. Int. J. Legal Med. 130, 1501-1503. doi: 10.1007/s00414-016-1369-5

Moyses, C. B., Tsutsumida, W. M., Raimann, P. E., Da Motta, C. H., Nogueira, T. L., Dos Santos, O. C., et al. (2017). Population data of the 21 autosomal STRS included in the GlobalFiler((R)) kits in population samples from five Brazilian regions. Forensic Sci. Int. Genet. 26, e28-e30. doi: 10.1016/j.fsigen.2016.10.017

Nei, M. (1978). The theory of genetic distance and evolution of human races. Jinrui Idengaku Zasshi 23, 341-369. doi: 10.1007/BF01908190

Ng. J., Oldt, R. F., Mcculloh, K. L., Weise, J. A., Viray, J., Budowle, B., et al. (2016). Native American population data based on the Globalfiler((R)) autosomal STR loci. Forensic Sci. Int. Genet. 24, e12-e13. doi: 10.1016/j.fsigen.2016.06.014

Nielsen, R., Akey, J. M., Jakobsson, M., Pritchard, J. K., Tishkoff, S., and Willerslev, E. (2017). Tracing the peopling of the world through genomics. Nature 541, 302-310. doi: 10.1038/nature21347

Nothnagel, M., Fan, G., Guo, F., He, Y., Hou, Y., Hu, S., et al. (2017). Revisiting the male genetic landscape of China: a multi-center study of almost 38,000 Y-STR haplotypes. Hum. Genet. 136, 485-497. doi: 10.1007/s00439-017-1759-x

Ossowski, A., Diepenbroek, M., Szargut, M., Zielinska, G., Jedrzejczyk, M., Berent, J., et al. (2017). Population analysis and forensic evaluation of 21 autosomal loci included in GlobalFiler PCR Kit in Poland. Forensic Sci. Int. Genet. 29, 238-e39. doi: 10.1016/j.fsigen.2017.05.003

Park, H. C., Kim, K., Nam, Y., Park, J., Lee, J., Lee, H., et al. (2016). Population genetic study for 24 STR loci and Y indel (GlobalFiler PCR Amplification kit and PowerPlex(R) Fusion system) in 1000 Korean individuals. Leg. Med. (Tokyo) 21, 53-57. doi: 10.1016/j.legalmed.2016.06.003

Park, J. H.. Hong, S. B., Kim, J. Y., Chong, Y., Han, S., Jeon, C. H., et al. (2013). Genetic variation of 23 autosomal STR loci in Korean population. Forensic Sci. Int. Genet. 7, e76-e77. doi: 10.1016/j.fsigen.2012.10.005

Parolin, M. L., Real, L. E., Martinazzo, L. B., and Basso, N. G. (2015). Population genetic analyses of the Powerplex((R)) Fusion kit in a cosmopolitan sample of Chubut Province (Patagonia Argentina). Forensic Sci. Int. Genet. 19, 221-222. doi: 10.1016/j.fsigen.2015.07.020

Patterson, N., Moorjani, P., Luo, Y., Mallick, S., Rohland, N., Zhan, Y., et al. (2012). Ancient admixture in human history. Genetics 192, 1065-1093. doi: 10.1534/ genetics.112.145037

Píao, S., Ciais, P., Huang, Y., Shen, Z., Peng, S., Li, J., et al. (2010). The impacts of climate change on water resources and agriculture in China. Nature 467, 43-51. doi: 10.1038/nature09364

Pickrell, J. K., and Pritchard, J. K. (2012). Inference of population splits and mixtures from genome-wide allele frequency data. PLoS Genet. 8, e1002967. doi: 10.1371/journal.pgen. 1002967

Ramos-Gonzalez, B., Aguilar-Velazquez, J. A., Chavez-Briones Mde, L., Delgado- Chavarria, J. R., Alfaro-Lopez, E., and Rangel-Villalobos, H. (2016), Population data of 24 STRs in Mexican-Mestizo population from Monterrey, Nuevo Leon (Northeast, Mexico) based on Powerplex((R)) Fusion and GlobalFiler((R)) kits. Forensic Sci. Int. Genet, 21, e15-e17. doi: 10.1016/j.fsigen.2015.12.004

Reich, D., Thangaraj, K., Patterson, N., Price, A. L., and Singh, L. (2009). Reconstructing Indian population history. Nature 461, 489-494. doi: 10.1038/ nature08365

Reynolds, J., Weir, B. S., and Cockerham, C. C. (1983). Estimation of the coancestry coefficient: basis for a short-term genetic distance. Genetics 105, 767-779.

Ristow, P. G., Cloete, K. W.. and D’amato, M. E. (2016). GlobalFiler((R)) Express DNA amplification kit in South Africa: extracting the past from the present. Forensic Sci. Int. Genet. 24, 194-201. doi: 10.1016/j.fsigen.2016.07.007

Ruan, X., Wang, W. N., Yang, Y. R., Xie, B. B., Chen, J., Liu, Y. C., et al. (2015). Genetic variability and phylogenetic analysis of 39 short tandem repeat loci in Beijing Han population. Yi Chuan Hereditas 37 (7), 683-691. doi: 10.16288/j. yczz. 15-025

Sanchez-Mazas, A., Di, D., and Riccio, M. E. (2011). A genetic focus on the peopling history of East Asia: critical views. Rice 4, 159-169. doi: 10.1007/s12284-011-9066-y

Schlotterer, C., and Tautz, D. (1992). Slippage synthesis of simple sequence DNA. Nucleic Acids Res. 20, 211-215. doi: 10.1093/nar/20.2.211

Shen, H., Yu, S., Guo, F., Yu, J., Jin, P., Sun, Z., et al. (2013). Genetic polymorphisms of 19 STR loci in Hui population in Liaoning province. Chin. J. Forensic Med. 28 (06), 504-505. doi: 10.13618/j.issn.1001-5728.2013.06.018

Shen, J., Kang, H., Dong, F., Guo, J., and Wang, R. (2015). Research of genetic polymorphism on 19 STR loci in Han nationality in Shanxi province and forensic medicine application. J. Shanxi Police Acad, 23, 63-66.

Singh, M., and Nandineni, M. R. (2017). Population genetic analyses and evaluation of 22 autosomal STRs in Indian populations. Int. J. Legal Med. 131, 971-973. doi: 10.1007/s00414-016-1525-y

Siska, V., Jones, E. R., Jeon, S., Bhak, Y., Kim, H. M., Cho, Y. S., et al. (2017). Genome-wide data from two early Neolithic East Asian individuals dating to 7700 years ago. Sci. Adv. 3, e1601877. doi: 10.1126/sciadv.1601877

Stoneking, M., and Delfin, F. (2010). The human genetic history of East Asia: weaving a complex tapestry. Curr. Biol. 20, R188-R193. doi: 10.1016/j. cub.2009.11.052

Su, B., Xiao, J., Underhill, P., Deka, R., Zhang, W., Akey, J., et al. (1999). Y-Chromosome evidence for a northward migration of modern humans into Eastern Asia during the last Ice Age. Am. J. Hum. Genet. 65, 1718-1724. doi: 10.1086/302680

Taylor, D., Bright, J. A., Mcgovern, C., Neville, S., and Grover, D. (2017). Allele frequency database for GlobalFiler STR loci in Australian and New Zealand populations. Forensic Sci. Int. Genet. 28, e38-e40. doi: 10.1016/j. fsigen.2017.02.012

Vullo, C., Rotondo, M., Daguerre, N., Quiroz, A., Velazquez, V., Machado, P., et al. (2016). Genetic polymorphism of 22 autosomal STR markers in Paraguay. Forensic Sci. Int. Genet. 25, e16-e17. doi: 10.1016/j.fsigen.2016.08.002

Wang, H. (2014). Genetic polymorphisms of 20 short tandem repeat loci from the Han population in Henan, China. Electrophoresis 35, 1509-1514. doi: 10.1002/ elps.201300597

Wang, H., Chen, L., Ge, B., Zhang, Y., Zhu, H., and Zhou, H. (2012). Genetic data suggests that the Jinggouzi people are associated with the Donghu, an ancient nomadic group of North China. Hum Biol 84, 365-378. doi: 10.3378/027.084.0402

Wang, J., Zhang, Q., Zhai, Z., Wang, H., Zhang, J., and Wang, Y. (2015). Genetic Polymorphisms of 19 STR loci in the Inner Mongolia Han population. Chin. J. Forensic Med. 30, 82-84. doi: 10.13618/j.issn.1001-5728.2015.01.026

Wang, M., Wang, Z., He, G., Jia, Z., Liu, J., and Hou, Y. (2018a). Genetic characteristics and phylogenetic analysis of three Chinese ethnic groups using the Huaxia Platinum System. Sci. Rep. 8, 2429. doi: 10.1038/s41598-018-20871-7

Wang, Y., Lin, B., Chen, X., Cai, J., and Zhang, Q. (2014). Genetic polymorphisms of 20 loci in Han population from Southern Fujian. Chin. J. Forensic Med. 29, 264-266. doi: 10.13618/j.cnki. 1001-5728.2014.03.020

Wang, Y., Lu, D., Chung, Y. J., and Xu, S. (2018b). Genetic structure, divergence and admixture of Han Chinese, Japanese and Korean populations. Hereditas 155, 19. doi: 10.1186/s41065-018-0057-5

Wang, Z., Zhou, D., Jia, Z., Li, L., Wu, W., Li, C., et al. (2016). Developmental validation of the Huaxia platinum system and application in 3 main ethnic groups of China. Sci. Rep. 6, 31075. doi: 10.1038/srep31075

Wen, B., Li, H., Lu, D., Song, X., Zhang, F., He, Y., et al. (2004). Genetic evidence supports demic diffusion of Han culture. Nature 431, 302-305. doi: 10.1038/ nature02878

Westen, A. A., Haned, H., Grol, L. J., Harteveld, J., Van Der Gaag, K. J., De Knijff, P., et al. (2012). Combining results of forensic STR kits: HDplex validation including allelic association and linkage testing with NGM and Identifiler loci. Int. J. Legal Med. 126, 781-789. doi: 10.1007/s00414-012-0724-4

Wu, F, Chen, M., Chao, C., and Pu, C. (2015). Study on STR markers of DNA for improving the power of identification on cases in Taiwan. International Carnahan Conference on Security Technology (ICCST). IEEE, 403-408. doi: 10.1109/ CCST.2015,738 9718

Wu, L., Pei, B., Ran, P., and Song, X. (2017). Population genetic analysis of Xiamen Han population on 21 short tandem repeat loci. Leg. Med. (Tokyo) 26, 41-44. doi: 10.1016/j.legalmed.2017.03.002

Xiang, C., Huang, L., Su, S., Fan, Y., Yu, J., Huang, Y., and Xu, B. (2016). Genetic variation of the 20 STRs in Han population from Yunnan-Kweichow plateau of China. Forensic Sci. Int. Genet. 23, e10-ell. doi: 10.1016/j.fsigen.2016.03.003

Xiao, C., Zhang, W., Wei, T., Pan, C., and Huang. D. (2016). Population data of 21 autosomal STR loci in Chinese Han population from Hubei province in Central China. Forensic Sci. Int. Genet. 20, e13-e14. doi: 10.1016/j.fsigen.2015.11.002

Xie, J., Shao, C., Zhou, Y., Zhu, W., Xu, H., Liu, Z., et al. (2014). Genetic distribution on 20 STR loci from the Han population in Shanghai, China. Forensic Sci. Int. Genet. 9, e30-e31. doi: 10.1016/j.fsigen.2013.08.007

Xu, S., Yin, X., Li, S., Jin, W., Lou, H., Yang, L.., et al. (2009). Genomic dissection of population substructure of Han Chinese and its implication in association studies. Am. J. Hum. Genet. 85, 762-774. doi: 10.1016/j.ajhg.2009.10.015

Yang, M., Ren, Z., Ji, J., Zhou, H., Zhang, H., Dai, J., et al. (2017a). Population genetic data and mutations of 22 autosomal STR loci in Guizhou Han population. Forensic Sci. Int. Genet. 29, e29-230. doi: 10.1016/j.fsigen.2017.03.008

Yang, M. A., Gao, X., Theunert, C., Tong, H., Aximu-Petri, A., Nickel, B., et al. (2017b). 40,000-Year-old individual from asia provides insight into early population structure in eurasia. Curr. Biol. 273202-3208, e3209. doi: 10.1016/j. cub.2017.09.030

Yao, J., Xiong, K., and Zhang, Y. (2017). Population data of 19 autosomal STR loci in the Chinese Han population from Jiujiang. Southern China. Forensic Sci. Int. Genet. 28, e47-e48. doi: 10.1016/j.fsigen.2017.03.007

Yao, Y. G., Kong, Q. P., Bandelt. H. J., Kivisild, T., and Zhang, Y. P. (2002). Phylogeographic differentiation of mitochondrial DNA in Han Chinese. Am. J. Hum. Genet. 70, 635-651. doi: 10.1086/338999

Yin, C., Ji, Q., Li, K., Mu, H., Zhu, B., Yan, J., et al. (2015). Analysis of 19 STR loci reveals genetic characteristic of eastern Chinese Han population. Forensic Sci. Int. Genet. 14, 108-109. doi: 10.1016/j.fsigen.2014.09.015

Zhang, H., Xia, M., Qi, L., Dong, L., Song, S., Ma, T., et al. (2016a). Forensic and population genetic analysis of Xinjiang Uyghur population on 21 short tandem repeat loci of 6-dye GlobalFiler” PCR Amplification kit. Forensic Sci. Int. Genet. 22, 22-24. doi: 10.1016/j.fsigen.2016.01.005

Zhang, H., Yang, S., Guo, W., Ren, B., Pu, L., Ma, T., et al. (2016b). Population genetic analysis of the GlobalFiler STR loci in 748 individuals from the Kazakh population of Xinjiang in northwest China. Int. J. Legal Med. 130, 1187-1189. doi: 10.1007/s00414-016-1319-2

Zhang, L., Xu, C., Chen, H., Zhou, Y., Li, F., and Chen, J. (2012). Genetic polymorphism of 19 STR loci in Xinjiang Barkol Kazakh population. Zhong Nan Da Xue Xue Bao Yi Xue Ban 37 (9), 934-938. doi: 10.3969/j.issn.1672- 7347.2012.09.014

Zhang, M. X., Han, S. Y., Gao, H. M., Sun, S. H., Xiao, D. J., Liu, Y., et al. (2013). Genetic polymorphisms of 19 STR loci in Shandong Han population. J. Forensic Sci. 29 (6), 440-443. doi: 10.3969/j.issn. 1004-5619.2013.06.010

Zhang, X., Hu, L., Du, L., Nie, A., Rao, M., bo Pang. J., et al. (2017a). Genetic analysis of 20 autosomal STR loci in the Miao ethnic group from Yunnan Province. Southwest China. Forensic Sci. Int. Genet. 28, e28-e29. doi: 10.1016/j. fsigen.2017.02.003

Zhang, X., Hu, L., Du, L., Nie, A., Rao, M., bo Pang, J., et al. (2017b). Genetic polymorphisms of 20 autosomal STR loci in the Vietnamese population from Yunnan Province, Southwest China. Int. J. Legal Med. 131 (3), 661-662. doi: 10.1007/s00414-016-1496-z

Zhang, X., Hu, L., Du, L., Zheng, H., Nie, A., Rao, M.,et al. (2017c). Population data for 20 autosomal STR loci in the Yi ethnic minority from Yunnan Province Southwest China. Forensic Sci. Int. Genet. 28, e43-e44. doi: 10.1016/j. fsigen.2017.02.017

Zhang, X., Du, L., Huang, Z., Gu, T., Hu, L., and Nie, S. (2017a). Genetic variation of 20 autosomal STR loci in three ethnic groups (Zhuang, Dai and Hani) in the Yunnan province of Southwestern China. Forensic Sci. Int. Genet. 31, e41-e42. doi: 10.1016/j.fsigen.2017.06.005

Zhang, Y., Li, A., Zhao, L., Liu, J., and Song. J. (2011). Genetic polymorphisms of 19 autosomal short tandem repeats in the Hebei Han population. Foren. Sci. Technol. 2, 48-50. doi: 10.3969/j.issn. 1008-3650.2011.02.023

Zhang, Y., Li, J., Zhao, Y., Wu, X., Li, H., Yao, L., et al. (2017b). Genetic diversity of two Neolithic populations provides evidence of farming expansions in North China. J. Hum. Genet. 62, 199-204. doi: 10.1038/jhg 2016.107

Zhang, Z., and Chen, T. (2015). Genetic polymorphisms of 20 STR loci in Han population from Western Fujian. Chin. J. Forensic Med, 30, 411-412. doi: 10.13618/j.issn.1001-5728.2015.01.025

Zhao, L., Wu, S., Gu, F., Zhang, Y., Wang, X., and Li, A. (2016). Genetic Polymorphisms of 19 STR Loci in Manchu population in Hebei Province. Chin. J. Forensic Med. 31 (01), 72-73. doi: 10.13618/j.issn. 1001-5728.2016.01.020

Zhao, W., Hu, S., and Wang, T. (2015a), Genetic polymorphisms of 19 STR loci of Pingliang Han of Gansu province. Chin. J. Forensic Med. 30, 618-619. doi: CNKI SUN FUAN.0.2015-06-022

Zhao, Y. B., Li, H. J., Li, S. N., Yu, C. C., Gao, S. Z., Xu, Z., et al. (2011). Ancient DNA evidence supports the contribution of Di-Qiang people to the han Chinese gene pool. Am. J. Phys. Anthropol. 144, 258-268. doi: 10.1002/ajpa.21399

Zhao, Y. B., Zhang, Y., Li, H. J., Cui, Y. Q., Zhu, H., and Zhou, H. (2014). Ancient DNA evidence reveals that the Y chromosome haplogroup Qlal admixed into the Han Chinese 3,000 years ago. Am. J. Hum. Biol. 26, 813-821. doi: 10.1002/ ajhb.22604

Zhao, Y. B., Zhang, Y., Zhang, Q. C., Li, H. J., Cui, Y. Q., Xu, Z., et al. (2015b). Ancient DNA reveals that the genetic structure of the northern Han Chinese was shaped prior to 3,000 years ago. PLoS One 10, e0125676. doi: 10.1371/ journal.pone.0125676

Zou, X., Li, Y., Li, P., Nie, Q., Wang, T., Hu, Y., et al. (2017). Genetic polymorphisms for 19 autosomal STR loci of Chongqing Han ethnicity and phylogenetic structure exploration among 28 Chinese populations. Int. J. Legal Med. 131, 1539-1542. doi: 10.1007/s00414-017-1577-7