#유전자 #황하 #고대DNA
Huang, Z. et al. (2025) ‘Ancient genomes reveal complex population interactions in the middle Yellow River basin during the Late Neolithic period’, Genomics, 117(4), 111061. https://linkinghub.elsevier.com/retrieve/pii/S0888754325000771.

Ancient genomes reveal complex population interactions in the middle Yellow River basin during the Late Neolithic period

유전자로 풀어보는 신석기 후기 황하 중류의 복잡한 인구 교류사

황지솨이(Zishuai Huang)a, 가오자이(Jiaqi Gao)b, 마밍즈(Mingzhi Ma)c, 후원가오(Wengao Hu)d, 샤오신(Xin Xiao)e, 리후이(Hui Li)a,*

a MOE Key Laboratory of Contemporary Anthropology, School of Life Sciences, Fudan University, Shanghai 200438, China
중국 복단대학(復旦大學) 생명과학학원 현대인류학 중점연구실, 상해(上海) 200438

b School of Archaeology and Museology, Peking University, Beijing 100871, China
중국 북경대학(北京大學) 고고학문박학원, 북경(北京) 100871

c Shaanxi Provincial Institute of Archaeology, Xi’an 710001, China
중국 섬서성(陝西省) 고고학연구원, 서안(西安) 710001

d Shenmu Baoyuan Museum, Shaanxi 719300, China
중국 섬서(陝西) 신목(神木) 바오위안(寶源) 박물관, 719300

e The Department of Sociology, University of the Witwatersrand, Wits 2050, South Africa
남아프리카공화국 비트바테르스란트 대학교 사회학과, 위츠 2050

 

[리뷰] 중화 쇼비니즘 경사도 평가: 5/10

7. Huang, Z. et al. (2025) ‘Ancient genomes reveal complex population interactions in the middle Yellow River basin during the Late Neolithic period’, Genomics, 117(4), 111061. https://linkinghub.elsevier.com/retrieve/pii/S0888754325000771.

(1) 연구 개요 저자의 주장

연구는 후기 신석기 시대 황하 중류의 핵심 유적인 타오쓰(Taosi), 스마오(Shimao), 루산마오(Lushanmao)에서 발굴된 8명의 고대 유전체를 분석했다. 저자들은 이들 대부분의 조상이 중원의 양사오 문화인과 관련이 깊으며, 여기에 동북아시아계 혈통이 보충된 형태라고 밝혔다. 특히 주목할 만한 발견은 루산마오 유적에서 발견된 한 ‘유전적 외톨이(genetic outlier)’로, 개인은 과도한 동북아시아계 혈통을 가지며 홍산 문화인과 유사한 유전적 배경을 보였다.

(2) 편향성 분석 (중화 쇼비니즘 경사도: 6/10)

이 연구는 중원 핵심부의 ‘내부적 복잡성’을 드러냈다는 점에서 긍정적이지만, 그 시야가 내륙에만 머물러 있어 결과적으로 중원의 역할을 과대평가할 위험을 안고 있다.

  • 서사 프레이밍 (중간 편향성): 연구의 초점이 ‘황하 중류 코어’에 집중되면서, 이곳을 모든 변화의 시작점이자 중심 무대로 설정하는 서사가 자연스럽게 형성된다. 이는 다른 지역(예: 산동 해안, 서요하)의 독자적인 역할을 부차적인 것으로 만들 위험이 있다.
  • 모델 선택과 반례 취급 (중간 편향성): 루산마오에서 발견된 ‘홍산 문화 관련 외톨이’는 중원 핵심부 내에서도 북방과의 직접적인 인구 교류가 있었음을 보여주는 중요한 증거다. 그러나 이 연구는 이 ‘외톨이’의 존재를 ‘복잡한 상호작용’의 증거로 제시하는 데 그치고, 이것이 중원 중심의 확산 모델 자체에 가하는 근본적인 도전에 대해서는 깊이 파고들지 않는다. 만약 타기도와 같은 해양 중심의 데이터가 비교 분석에 포함되었다면, “코어 → 동진(東進)”이라는 단순한 확산 모델의 보편성은 더욱 약화되었을 것이다.
  • 지리·환경 제약 반영 (높은 편향성): 중원 핵심 지역의 내적 상호작용을 분석하는 데 집중한 나머지, 해수면 변동과 같은 거시적인 환경 변화가 만들어낸 ‘해양 회랑’이라는 독립적인 경로를 모델에 충분히 반영하지 못했다.
  • 유전자–문화 결합 가정 (낮은 편향성): 내륙 코어 중심의 설계에서는 문화적 변화와 인구 이동을 동일시하는 가정이 암묵적으로 유지될 위험이 있으나, ‘외톨이’의 존재를 통해 유전적 구성과 문화적 소속이 불일치할 수 있음을 시사하고 있다.

(3) 결론 재구성

결론은 “중원 코어의 복잡성”과 함께 “해양 회랑의 장기적 기여”를 병렬적으로 서술해야 한다. 즉, 중원의 변화가 동쪽으로 영향을 미친 것과 동시에, 해양 네트워크 또한 독자적으로 작동하며 상호작용했음을 인정해야 한다. 이를 위해 분석 모델에서 내륙/연해/도서 세 축의 기여율을 분리하여 계량하고, 각 축의 독자성과 상호작용을 함께 평가하는 ‘매트릭스’ 모델이 필요하다. 루산마오의 ‘홍산인’은 내륙 네트워크의 복잡성을, 타기도의 ‘해안인’은 해양 네트워크의 독립성을 보여주는 상호 보완적인 증거다.

 

[논문요약]

신석기 시대 고대 중국인의 유전적 비밀 요약

약 4,000년 전, 초기 중국 문명의 핵심이었던 황하(黃河) 중류 지역에는 도사(陶寺), 석모(石峁), 노산묘(蘆山)와 같은 거대한 고대 도시들이 있었다. 이 논문은 이 유적들에서 발굴된 8명의 고대인 유전체, 즉 ‘DNA 설계도’를 분석하여 “이들은 누구였고, 서로 어떻게 교류했는가?”라는 질문에 답하는 연구이다.

주류 집단: 황하 농경민과 동북아시아인의 만남

연구 대상자 대부분은 비슷한 유전적 특징을 공유했다. 이들의 정체는 두 가지 주요 유전 분석으로 밝혀졌다.

유전적 GPS, 주성분 분석(PCA)

PCA는 각 개인의 유전 정보를 바탕으로 전체 동아시아인 유전자 지도 위에 점을 찍어 그 위치를 보여주는 기술이다. 그림 1에서 볼 수 있듯이, 이 지역 고대인들(주황색, 노란색, 파란색 마름모)은 황하 유역의 농경민(붉은색 타원)과 몽골, 아무르강 유역의 동북아시아인(노란색 타원) 사이의 중간 지점에 모여 있다. 이는 이들이 주로 황하 유역의 앙소(仰韶) 문화 사람들과 유전적으로 가까우면서도, 북방 사람들과도 피가 섞였음을 의미한다.

그림 1 설명: 이 유전자 지도에서 각 점은 한 개인 또는 집단을 나타낸다. 신석기 시대 산서-섬서 지역 사람들은 황하 유역(붉은색)과 동북아시아(노란색) 집단이 만나는 지점에 모여 있다.

유전적 레시피, ADMIXTURE 분석

ADMIXTURE 분석은 한 사람의 DNA가 어떤 조상 집단으로부터 몇 퍼센트씩 왔는지, 즉 ‘유전적 레시피’를 보여주는 분석이다. 그림 2의 막대그래프는 각 개인의 유전적 조상 비율을 보여준다. LSM_1을 제외한 대부분의 사람들은 황하 유역 조상(파란색)과 티베트 고원 관련 조상(빨간색)이 주를 이루고, 동북아시아 조상(노란색)이 소량 섞인 비슷한 ‘레시피’를 가지고 있다.

그림 2 설명: 각 막대는 개인 또는 집단을, 색깔은 다른 조상 집단을 의미한다. 대부분의 사람들은 파란색, 빨간색, 노란색이 비슷한 비율로 섞여 있지만, LSM_1(맨 왼쪽)과 WLR_MN은 노란색(동북아시아) 비율이 월등히 높다.

그림 4의 모델링 결과에 따르면, 이들의 유전적 구성은 황하 유역 토착민(YR_MN)의 피를 약 76-92%, 그리고 ‘거실장(居室葬, 집 안에 시신을 묻는 풍습)’을 공유했던 북동쪽의 유민(裕民) 유적 사람들의 피를 약 8-24% 물려받은 것으로 가장 잘 설명된다.

미스터리한 이방인, LSM_1

하지만 노산묘(蘆山) 유적에서 발견된 LSM_1이라는 남성은 모두와 확연히 달랐다. 그는 이 지역의 유전적 특이점이었다.

  • 유전자 지도(그림 1)에서 그는 다른 사람들과 떨어져 동북아시아인 그룹 쪽으로 크게 치우쳐 있었다.
  • 유전적 레시피(그림 2)에서 그의 DNA는 동북아시아 조상(노란색)의 비율이 압도적으로 높았고, 그 구성이 동북쪽 홍산(紅山) 문화 사람(WLR_MN)과 거의 똑같았다.
  • 유전적 친밀도 검사(그림 3)에서도 그는 다른 이웃들과 달리 동북의 홍산(紅山) 문화 사람과 월등히 가깝다는 결과가 나왔다.

그림 3 설명: 이 그래프는 유전적 친밀도를 보여준다. 빨간 점이 위쪽으로 갈수록 LSM_1이 동북아시아 집단(WLR_MN)과 더 가깝다는 의미이다.

이는 LSM_1 또는 그의 직계 조상이 동북쪽 홍산(紅山) 문화 지역에서 이주해 온 사람일 가능성을 강력하게 시사한다.

DNA에 남은 근친혼의 흔적

LSM_1의 DNA에서는 또 다른 충격적인 사실이 발견되었다.

동형접합성 연속구간(ROH) 분석

ROH는 부모에게서 물려받은 DNA의 특정 구간이 완전히 동일할 때 나타난다. 이 구간이 길고 많을수록 부모가 가까운 친척, 즉 근친 관계일 가능성이 높다는 강력한 증거가 된다.

그림 5는 각 개인의 ROH 길이를 보여준다. 다른 사람들에게서는 거의 발견되지 않은 긴 ROH 구간이 LSM_1에게서는 무려 254.75cM이나 발견되었다. 이는 그의 부모가 사촌 정도의 가까운 친척이었음을 시사한다.

그림 5 설명: LSM_1의 막대그래프는 다른 사람들과 비교할 수 없을 정도로 높다. 특히 붉은색과 노란색으로 표시된 긴 ROH 구간은 부모가 매우 가까운 친척이었음을 의미한다.

흥미롭게도 이러한 근친혼의 흔적은 LSM_1의 유전적 고향으로 추정되는 동북의 홍산(紅山) 문화 사람들에게서도 공통으로 발견되었다. 연구진은 이를 홍산(紅山) 문화의 독특한 사회 구조와 연관 짓는다. 홍산(紅山) 문화는 제사장이 통치하는 ‘신정(神政) 사회’였을 가능성이 큰데, 지배층이 권력과 혈통의 순수성을 지키기 위해 의도적으로 족내혼이나 근친혼을 했을 수 있다는 것이다. 순장자와 함께 집 안에 묻힌 LSM_1의 독특한 무덤 역시 그의 높은 신분을 암시한다.

결론: 복잡하게 얽힌 고대사

이 연구는 신석기 후기 황하 유역이 단일 민족 사회가 아니었음을 보여준다. 대부분은 황하 유역의 농경민과 북방의 집단이 섞인 후예들이었다.

하지만 동시에 LSM_1과 같은 이례적인 인물의 존재는 소규모 집단이 먼 거리를 이동하며 교류했음을 증명한다. 특히 근친혼이라는 독특한 문화적 관습까지 함께 가져왔을 가능성은 당시 사회가 우리가 생각했던 것보다 훨씬 더 복잡하고 다원적이었음을 알려준다. 이 연구는 DNA 분석을 통해 기록되지 않은 고대인의 삶과 사회의 한 단면을 생생하게 복원해 낸 중요한 성과라 할 수 있다.

 

[논문번역]

요약 (ABSTRACT)

The middle reaches of the Yellow River in the Late Neolithic period were the frontier of cultural communication between the Central Plains and the northern steppe. The remarkable sites that emerged during this period, such as Taosi, Shimao, and Lushanmao, played important roles in the formation of early Chinese civilization. Here we report ancient genomic data from 8 individuals from the three sites. Population genetics analysis revealed that the ancestries of these individuals were mainly related to the Yangshao culture populations from the Central Plains, supplemented by Northeast Asian ancestry. We also found an individual who was a genetic outlier at the Lushanmao site who carried excess Northeast Asian ancestry and harbored a genetic background similar to that of the Hongshan culture population. These findings provide a more detailed picture of genetic interactions and population migrations in northern China of Late Neolithic period and suggest potential cross-regional population interactions.

신석기 후기, 황하(黃河) 중류 지역은 중원(中原)과 북방 초원 사이의 문화 교류가 활발한 최전선이었다. 이 시기 출현한 도사(陶寺), 석모(石峁), 노산묘(蘆山)와 같은 중요한 유적들은 초기 중국 문명 형성에 큰 역할을 했다. 이 연구에서는 세 유적에서 발굴된 8명의 고대인 유전체(게놈) 데이터를 보고한다. 집단 유전학 분석 결과, 이들의 조상은 주로 중원(中原)의 앙소(仰韶)문화 집단과 관련이 있었고, 동북아시아계 조상이 일부 섞여 있었다. 또한 노산묘(蘆山) 유적에서 유전적으로 특이한 한 명을 발견했는데, 그는 동북아시아계 조상 성분을 더 많이 가지고 있었고 홍산(紅山)문화 집단과 유사한 유전적 배경을 지녔다. 이러한 발견은 신석기 후기 중국 북부의 유전적 상호작용과 인구 이동에 대한 더 상세한 그림을 제공하며, 지역을 넘나드는 인구 교류가 있었을 가능성을 시사한다.

 

목차

1. 서론 (Introduction)

2. 방법 (Methods)

2.1. 고대 DNA 추출, 라이브러리 제작 및 시퀀싱 (Ancient DNA extraction, library preparation, and sequencing)

2.2. 원시 데이터 전처리 및 고대 DNA 인증 (Raw data pre-processing and authentication of ancient DNA)

2.3. 성별 결정, 하플로그룹 할당 및 유전적 친족 관계 분석 (Sex determination, haplogroup assignment and genetic relatedness analysis)

2.4. 집단 분석 및 동형접합성 연속구간(ROH) 분석 (Population analysis and Run of Homozygosity (ROH) analysis)

3. 결과 (Results)

3.1. 데이터 개요 (Data overview)

3.2. 산서-섬서 지역에 널리 퍼진 혼합 혈통 (Admixed ancestries widespread in the Shanxi-Shaanxi area)

3.3. LSM_1: 신석기 후기 산서-섬서 지역의 유전적 특이 개체 (LSM_1 is a genetic outlier in the Late Neolithic Shanxi-Shaanxi area)

3.4. 동형접합성 연속구간(ROH) 분석을 통해 본 근친혼의 가능성 (ROH analysis reveals possible connection to consanguine marriage)

4. 토론 (Discussion)

참고문헌 (References)

 

1. 서론 (Introduction)

The end of the Late Neolithic era was a period of rapid social changes in China [1]. During this period, a series of large core settlements covering an area of millions of square meters emerged in the middle reaches of the Yellow River, especially Shanxi and Shaanxi, such as the Shimao site (~4300-3800 BP) [2], the Taosi site (~4300-3900 BP) [3] and the Lushanmao site (~4300-4100 BP) [4], demonstrating a trend of comprehensive revival since the early stage of Longshan period [5]. Close archaeological interactions were observed between the three sites. Some pottery and jade artifacts unearthed at the Lushanmao site are similar to those of the early stage of Taosi site [6], and both sites have large-sized rammed-earth buildings [7,8]. In the Shimao and Lushanmao sites, jades were found embedded in the wall [4,9] (Fig. S1), which may be a ritual custom shared by the two sites. In addition, M1 of the Lushanmao site is a Jushizang [4,10], a burial custom that buries the dead inside the houses in which people continued living. This custom was also found at the Yumin [11] and Xinglongwa sites [12] in the West Liao River region [10], suggesting potential cultural contacts between the two areas.

신석기 시대 말기는 중국에서 사회가 급격하게 변하던 시기였다 [1]. 이 시기 황하(黃河) 중류, 특히 산서(山西)와 섬서(陝西) 지역에는 수백만 제곱미터에 달하는 일련의 대규모 핵심 취락들이 출현했다. 예를 들어 석모(石峁) 유적(약 4300-3800년 전) [2], 도사(陶寺) 유적(약 4300-3900년 전) [3], 그리고 노산묘(蘆山) 유적(약 4300-4100년 전) [4]이 있으며, 이는 용산(龍山) 시기 초기 이래 전면적으로 부흥하는 경향을 보여준다 [5]. 세 유적 사이에서는 고고학적으로 긴밀한 상호작용이 관찰되었다. 노산묘(蘆山) 유적에서 출토된 일부 토기와 옥기는 도사(陶寺) 유적 초기 단계의 유물과 유사하며 [6], 두 유적 모두 대규모 판축(版築, 흙을 다져 쌓는 건축 방식) 건물을 가지고 있다 [7,8]. 석모(石峁)와 노산묘(蘆山) 유적에서는 성벽에 옥을 박아 넣은 것이 발견되었는데 [4,9] (Fig. S1), 이는 두 유적이 공유했을 가능성이 있는 의례 풍습이다. 또한, 노산묘(蘆山) 유적의 M1은 거실장(居室葬)인데 [4,10], 이는 사람이 계속해서 거주하는 집 내부에 죽은 자를 묻는 장례 풍습이다. 이러한 풍습은 서요하(西遼河) 유역의 유민(裕民) 유적 [11]과 흥륭와(興隆洼) 유적 [12]에서도 발견되어 [10], 두 지역 간에 문화적 접촉이 있었을 가능성을 시사한다.

Previous ancient DNA studies have uncovered that populations from the periphery of Yellow River basin, such as those from the Miaozigou site and the Shengedaliang site near the Shimao site, mainly presented a mixed genetic background with the Yellow River ancestry related to the Yangshao culture as the main source (YR_MN) and the Amur River basin-related Northeast Asian ancestry as the minor source (AR_EN) [13]. This reflects the interplays of gene flows between the core area of the Central Plains and the wider Northeast Asia region. Genetic affinity between populations of northern Shaanxi and southern Shanxi in the Longshan period was also corroborated by mitogenomes [14], indicating close genetic relationships within the Shanxi-Shaanxi area. However, a detailed profiling of ancestry composition of the Late Neolithic populations from this area is still lacking.

기존의 고대 DNA 연구들은 황하(黃河) 유역의 주변부, 예를 들어 석모(石峁) 유적 근처의 묘자구(廟子溝) 유적과 성격달량(聖格達梁) 유적의 인구가 주로 혼합된 유전적 배경을 가졌다는 사실을 밝혀냈다. 주된 원천은 앙소(仰韶) 문화와 관련된 황하(黃河) 조상(YR_MN)이었고, 부차적 원천은 아무르강(黑龍江) 유역과 관련된 동북아시아 조상(AR_EN)이었다 [13]. 이는 중원(中原)의 핵심 지역과 더 넓은 동북아시아 지역 사이의 유전자 흐름이 상호작용했음을 반영한다. 용산(龍山) 시기 섬서(陝西) 북부와 산서(山西) 남부 인구 간의 유전적 친화성은 미토콘드리아 유전체 분석을 통해서도 확증되었으며 [14], 이는 산서-섬서(山西-陝西) 지역 내에 긴밀한 유전적 관계가 있었음을 나타낸다. 하지만, 이 지역 신석기 후기 인구의 조상 구성에 대한 상세한 분석은 여전히 부족하다.

In order to understand the genetic composition of the populations from Late Neolithic Shanxi-Shaanxi area, we selected 8 ancient individuals for research. The samples from the Lushanmao site came from the occupant of M1 and his three human sacrifices, coded as LSM 1, 2, 3, and 4. The samples from the Shimao site came from a radial bone unearthed together with a set of bronze and jade rings [9] (Fig. S1), and two individuals represented by the teeth buried in the stone wall along with jade artifacts, coded as SM_1, 2, and 3. The individual of the Taosi site came from the middle period monarchic mausoleum IIM22, which had a great quantity of grave goods including jades and lacquered wooden artifacts [3], indicating the royal status of its owner. This individual was coded as TS.

신석기 후기 산서-섬서(山西-陝西) 지역 인구의 유전적 구성을 이해하기 위해, 우리는 8명의 고대인을 연구 대상으로 선정했다. 노산묘(蘆山) 유적의 시료는 M1 무덤 주인과 그의 순장자 세 명으로부터 나왔으며, LSM 1, 2, 3, 4로 부호화했다. 석모(石峁) 유적의 시료는 한 세트의 청동 및 옥고리와 함께 출토된 요골(橈骨, 팔의 바깥쪽 뼈) 하나와 [9] (Fig. S1), 옥기와 함께 돌벽에 묻혀 있던 치아로 대표되는 두 명의 개체로부터 나왔으며, SM_1, 2, 3으로 부호화했다. 도사(陶寺) 유적의 개체는 중기 왕릉급 무덤인 IIM22에서 나왔는데, 이 무덤에는 옥기와 칠기 목기 등을 포함한 다량의 껴묻거리가 있어 [3] 주인이 왕족 신분이었음을 나타낸다. 이 개체는 TS로 부호화했다.

 

2. 방법 (Methods)

2.1. 고대 DNA 추출, 라이브러리 제작 및 시퀀싱 (Ancient DNA extraction, library preparation, and sequencing)

The samples were first polished by a sandblaster machine (Renfert, Germany) then cleaned with 8% sodium hypochlorite solution and anhydrous ethanol to completely remove the contaminants on the surfaces. The samples were then irradiated with UV light for 30 min before the powder was obtained using a dental drill (Saeshin, South Korea). We followed previously described protocols of ancient DNA extraction [15] and half-UDG (uracil-DNA-glycosylase) treated [16] double-stranded ancient DNA library preparation [17] for further sequencing. We carried out in-solution SNP enrichment targeting a panel of 1.24 million SNPs (“1240 K”) [18] and mitochondrial DNA before the libraries were sequenced on an Illumina NovaSeq 6000 platform.

시료 표면의 오염물질을 완전히 제거하기 위해, 먼저 샌드블라스터(sandblaster) 기계(Renfert, 독일)로 표면을 연마한 후 8% 차아염소산나트륨 용액과 무수 에탄올로 세척했다. 그 후 시료에 30분간 자외선을 쪼인 뒤, 치과용 드릴(새신, 대한민국)을 사용하여 분말을 채취했다. 우리는 이전에 기술된 고대 DNA 추출 프로토콜 [15]과, UDG(uracil-DNA-glycosylase) 효소를 절반만 처리하는(half-UDG) 방식의 [16] 이중 가닥 고대 DNA 라이브러리 제작법 [17]을 따라 추가적인 염기서열 분석(시퀀싱)을 진행했다. 라이브러리를 일루미나(Illumina)사의 노바식(NovaSeq) 6000 플랫폼에서 시퀀싱하기 전에, 124만 개의 단일염기 다형성(SNP)으로 구성된 “1240K” 패널 [18]과 미토콘드리아 DNA를 표적으로 하여 용액 내 농축(in-solution enrichment)을 수행했다.

2.2. 원시 데이터 전처리 및 고대 DNA 인증 (Raw data pre-processing and authentication of ancient DNA)

EAGER v2.5.0 [19] was implemented to pre-process the raw data and output the statistics for ancient DNA authenticity evaluation. Adapter-Removal v2.3.2 [20] was used for adapter clipping and paired-end reads merging. Merged reads were mapped onto human reference genome with decoy sequence (hs37d5) using BWA v0.7.17 [21] (-n 0.01, -l 1024). We removed the duplicated reads with DeDup v0.12.8 [19]. Postmortem damage signals of ancient DNA were examined by DamageProfiler v0.4.9 [22] before these signals were masked by trimming 2 bp at each end of the reads with bamUtils v1.0.15 [23]. We used pileupCaller with “-randomHaploid” option to generate pseudo-haploid data for each sample. We then used ContamMix v1.0-11 [24] and Schmutzi v1.5.7 [25] to estimate mitochondrial contamination, hapCon v0.64 [26] and ANGSD v0.940 [27] to estimate nuclear contamination (based on X chromosome), respectively.

EAGER v2.5.0 [19]을 이용하여 원시 데이터를 전처리하고, 고대 DNA의 진위 여부를 평가하기 위한 통계 자료를 산출했다. Adapter-Removal v2.3.2 [20]를 사용하여 어댑터(adapter)를 잘라내고 쌍으로 이뤄진 리드(paired-end reads)를 병합했다. 병합된 리드는 BWA v0.7.17 [21]을 사용하여 디코이 서열(decoy sequence)이 포함된 인간 표준 유전체(hs37d5)에 배열(mapping)했다 (옵션: -n 0.01, -l 1024). 중복된 리드는 DeDup v0.12.8 [19]로 제거했다. 고대 DNA의 사후 손상 신호는 DamageProfiler v0.4.9 [22]로 검사한 후, bamUtils v1.0.15 [23]를 사용하여 각 리드의 양 끝에서 2 염기쌍(bp)을 잘라내어 이 신호들을 가렸다. “-randomHaploid” 옵션과 함께 pileupCaller를 사용하여 각 시료의 유사 단상(pseudo-haploid) 데이터를 생성했다. 그 후, 미토콘드리아 오염도를 추정하기 위해 ContamMix v1.0-11 [24]과 Schmutzi v1.5.7 [25]을 사용했으며, 핵 오염도(X염색체 기반)를 추정하기 위해 각각 hapCon v0.64 [26]와 ANGSD v0.940 [27]을 사용했다.

2.3. 성별 결정, 하플로그룹 할당 및 유전적 친족 관계 분석 (Sex determination, haplogroup assignment and genetic relatedness analysis)

Sex. DetERRmine [28] module embedded in EAGER was used to determine the genetic sex of the samples based on the relatively ratios of reads mapped onto the X or Y chromosome to those mapped onto the autosomes. The assignments of mitochondrial haplogroups were done by HaploGrep v3.2.1 [29] based on the mitochondrial consensus sequences generated by log2fasta program in Schmutzi. We used Yleaf v3.2.1 [30] and HaploGrouper [31] to determine the Y chromosome haplogroup for the males (based on ISOGG 2019). For genetic relatedness, we used PMR-based READv2 [32] and IBD-based KIN [33] to detect potential kinships between the samples.

상염색체에 배열된 리드 수에 대한 X 또는 Y염색체에 배열된 리드 수의 상대적 비율을 기반으로 시료의 유전적 성별을 결정하기 위해 EAGER에 내장된 Sex.DetERRmine [28] 모듈을 사용했다. 미토콘드리아 하플로그룹의 할당은 Schmutzi의 log2fasta 프로그램으로 생성된 미토콘드리아 합의 서열(consensus sequences)을 기반으로 HaploGrep v3.2.1 [29]을 통해 이루어졌다. 남성의 Y염색체 하플로그룹은 Yleaf v3.2.1 [30]과 HaploGrouper [31]를 사용하여 (ISOGG 2019 기준) 결정했다. 유전적 친족 관계를 확인하기 위해, PMR 기반의 READv2 [32]와 IBD 기반의 KIN [33]을 사용하여 시료들 간의 잠재적 친족 관계를 탐지했다.

2.4. 집단 분석 및 동형접합성 연속구간(ROH) 분석 (Population analysis and Run of Homozygosity (ROH) analysis)

We merged the newly-generated pseudo-haploid data with Allen Ancient DNA Resource (AADR) v54.1.p1 [34,35] using mergeit program embedded in EIGENSOFT v8.0.0. Dataset based on “Human Origins” panel (597,573 sites) [36] was used for principal component analysis (PCA), which was conducted by smartPCA v18140 program in EIGENSOFT. Dataset based on “1240 K” panel (1,233,013 sites) [18] was used for ADMIXTURE analysis, f-statistics-based analyses and ROH analysis. Before performing ADMIXTURE analysis using ADMIXTURE v1.3.0, we first pruned the linkage disequilibrium using Plink v1.9 with the option ‘-indep-pairwise 200 25 0.4’. We performed 10 replicates of ADMIXTURE at each value of K from 2 to 8, specifying different random seeds for each run with the parameter ‘-s’. We also used ‘-cv’ flag to enable the cross-validation procedure. The output of ADMIXTURE analysis was visualized with BITE v2.1.0 [37] and AncestryPainter v2.0.1 [38]. We calculated the f₃ and f₄ statistics with ADMIXTOOLS 2(v2.0.0) [39]. Homogeneity tests and admixture modelling were done by qpWave/qpAdm v1520 programs implemented in ADMIXTOOLS v7.0.2 [36]. Finally, we used hapROH [40] for the detection of potential ROHs carried by the samples.

새로 생성된 유사 단상(pseudo-haploid) 데이터를 EIGENSOFT v8.0.0에 내장된 mergeit 프로그램을 사용하여 알렌 고대 DNA 자원(AADR) v54.1.p1 [34,35]과 병합했다. EIGENSOFT의 smartPCA v18140 프로그램을 사용하여 주성분 분석(PCA)을 수행했으며, 이때 “인류 기원(Human Origins)” 패널(597,573개 위치) 기반의 데이터 세트를 사용했다 [36]. ADMIXTURE 분석, f-통계 기반 분석, ROH 분석에는 “1240K” 패널(1,233,013개 위치) 기반의 데이터 세트를 사용했다 [18]. ADMIXTURE v1.3.0을 이용한 분석을 수행하기 전에, 먼저 Plink v1.9를 ‘-indep-pairwise 200 25 0.4’ 옵션으로 사용하여 연관 불균형(linkage disequilibrium)을 제거했다. K값을 2에서 8까지 변화시키며 각 값에 대해 10회씩 ADMIXTURE 분석을 반복 수행했고, ‘-s’ 매개변수를 사용하여 각 실행마다 다른 무작위 시드(seed)를 지정했다. 또한 ‘-cv’ 플래그를 사용하여 교차 검증(cross-validation) 절차를 활성화했다. ADMIXTURE 분석 결과는 BITE v2.1.0 [37]과 AncestryPainter v2.0.1 [38]로 시각화했다. f₃과 f₄ 통계량은 ADMIXTOOLS 2(v2.0.0) [39]로 계산했다. 동질성 검사와 혼합 모델링은 ADMIXTOOLS v7.0.2 [36]에 포함된 qpWave/qpAdm v1520 프로그램으로 수행했다. 마지막으로, 시료들이 가진 잠재적 ROH를 탐지하기 위해 hapROH [40]를 사용했다.

 

3. 결과 (Results)

3.1. 데이터 개요 (Data overview)

Here, we present 8 newly generated genome-wide data from the Lushanmao, Shimao and Taosi site of Late Neolithic Shanxi-Shaanxi area to further investigate the internal structure of the population in the region and potential genetic exchanges with surrounding groups. All samples showed postmortem damage signals of C→T/G→A mis-incorporations at the 5’/3′ end. The average fragment lengths of the reads were between 54.49 and 68.09 bp, which were consistent with the fragmentation pattern of ancient DNA caused by depurination [41] (Table S1).

여기서 우리는 신석기 후기 산서-섬서(山西-陝西) 지역의 노산묘(蘆山), 석모(石峁), 도사(陶寺) 유적에서 나온 8명의 새로운 전체 유전체(genome-wide) 데이터를 제시한다. 이를 통해 이 지역 인구의 내부 구조와 주변 집단과의 잠재적 유전 교류를 심층적으로 조사하고자 한다. 모든 시료는 리드(read)의 5′ 말단과 3′ 말단에서 C→T/G→A 염기 변환 오류와 같은 사후 손상 신호를 보였다. 리드의 평균 조각 길이는 54.49에서 68.09 염기쌍(bp) 사이였으며, 이는 탈퓨린화(depurination)로 인해 발생하는 고대 DNA의 단편화 패턴과 일치했다 [41] (표 S1).

According to the output results of Sex. DetERRmine [28], LSM 3 and SM_1 with high X-rates (0.715 for LSM 3, 0.779 for SM_1) likely possessed the karyotype XX, indicating these two samples were female (Table S1). Except for LSM 4, the remaining seven samples covered more than 100,000 SNPs (146,528-723,608) on the 1240 K panel, adequate for relatively accurate population genetics analysis. All samples showed a low level (<5%) of mitochondrial and nuclear contamination (Table S1). Besides, no second-degree or lower degree relationship was found between individuals (Fig. S2 and Table S2).

Sex.DetERRmine [28]의 분석 결과에 따르면, X-rate가 높은(LSM 3의 경우 0.715, SM_1의 경우 0.779) LSM 3과 SM_1은 XX 핵형을 가졌을 가능성이 높아, 이 두 시료가 여성이었음을 나타낸다 (표 S1). LSM 4를 제외한 나머지 7개 시료는 1240K 패널에서 10만 개 이상의 SNP(단일염기 다형성) 정보(146,528-723,608개)를 확보하여, 비교적 정확한 집단 유전학 분석을 수행하기에 충분했다. 모든 시료는 미토콘드리아 및 핵 오염도가 5% 미만의 낮은 수준을 보였다 (표 S1). 그 외에, 개체들 사이에서 2촌 또는 그 이하의 친족 관계는 발견되지 않았다 (그림 S2 및 표 S2).

The Y chromosome haplogroups were On and Of that were found frequently in Han Chinese [42], as well as Nla and N1b2 haplogroups that appeared at lower frequencies in Northeast Asians and Sino-Tibetan populations [43]. Mitochondrial haplogroups showed higher diversity than Y chromosome haplogroups, but were essentially consistent with the diversity range of Neolithic populations in northern Shaanxi and southern Shanxi reported previously [14] (Table S1).

Y염색체 하플로그룹은 현대 한족(漢族)에서 자주 발견되는 O계열(On, Of) [42]과, 동북아시아인 및 중국-티베트어족 집단에서 낮은 빈도로 나타나는 N계열(N1a, N1b2) 하플로그룹이 확인되었다 [43]. 미토콘드리아 하플로그룹은 Y염색체 하플로그룹보다 더 높은 다양성을 보였으나, 이전에 보고된 섬서(陝西) 북부와 산서(山西) 남부 신석기 시대 인구의 다양성 범위와 본질적으로 일치했다 [14] (표 S1).

3.2. 산서-섬서 지역에 널리 퍼진 혼합 혈통 (Admixed ancestries widespread in the Shanxi-Shaanxi area)

In the PCA space composed of PC1 and PC2, which indicated north-south and coastal-inland differentiations, respectively, it can be observed that the East Asians were roughly divided into three genetic clines: 1) a Northeast Asian-related cline towards the fourth quadrant, including mainly the ancient populations from the Amur River region, Mongolia and the Russian Far East, as well as modern Mongolic- and Tungusic-speaking populations. 2) A Southeast Asian-related cline towards the third quadrant, including mainly the ancient populations form coastal southern China and Southeast Asia, as well as modern Hmong-Mien, Kra-Dai, Austronesian and Austroasiatic populations. 3) A Sino-Tibetan-related cline includes mainly the ancient populations from Yellow River region, Tibet Plateau and Nepal, as well as modern Sino-Tibetan populations. The Sino-Tibetan-related cline was connected with the Northeast Asian-related cline and the Southeast Asian-related cline through ancient Tibetans and modern Han populations, respectively (Fig. 1).

각각 남-북과 해안-내륙의 분화를 나타내는 주성분1(PC1)과 주성분2(PC2)로 구성된 주성분 분석(PCA) 공간에서, 동아시아인은 대략 세 개의 유전적 연속체(cline)로 나뉘는 것을 관찰할 수 있다. 1) 제4사분면 방향의 동북아시아 관련 연속체: 주로 아무르강(黑龍江) 유역, 몽골(蒙古), 러시아 극동 지역의 고대 인구와 현대 몽골어족 및 퉁구스어족 사용 집단을 포함한다. 2) 제3사분면 방향의 동남아시아 관련 연속체: 주로 중국 남부 해안과 동남아시아의 고대 인구 및 현대 몽-미엔어족, 크라-다이어족, 오스트로네시아어족, 오스트로아시아어족 집단을 포함한다. 3) 중국-티베트 관련 연속체: 주로 황하(黃河) 유역, 티베트 고원, 네팔의 고대 인구와 현대 중국-티베트어족 집단을 포함한다. 중국-티베트 관련 연속체는 각각 고대 티베트인과 현대 한족(漢族)을 통해 동북아시아 관련 연속체 및 동남아시아 관련 연속체와 연결되었다 (그림 1).

Samples from Late Neolithic Shanxi-Shaanxi area were projected onto the intersection of the Sino-Tibetan-related cline and the Northeast Asian-related cline, clustering with ancient populations from Yellow River region (Fig. 1). The genetic positions of the Late Neolithic Shanxi-Shaanxi populations indicated a close relationship with the ancient populations from the Central Plains. These populations also shared the highest genetic similarity with each other or with other ancient populations from the periphery of Yellow River region (e.g. Shimao_LN from the Shengedaliang site or Miaozigou MN from the Miaozigou site) when measured in the form of f₃(Mbuti; Reference population X, Populations from the Late Neolithic Shanxi-Shaanxi area) (Fig. S5 and Table S3).

신석기 후기 산서-섬서(山西-陝西) 지역의 시료들은 중국-티베트 관련 연속체와 동북아시아 관련 연속체가 교차하는 지점에 투영되었으며, 황하(黃河) 유역의 고대 인구와 함께 군집을 이루었다 (그림 1). 신석기 후기 산서-섬서(山西-陝西) 인구의 유전적 위치는 중원(中原)의 고대 인구와 가까운 관계임을 나타냈다. f₃(음부티; 참조 집단 X, 신석기 후기 산서-섬서 지역 집단) 통계 형태로 측정했을 때, 이 집단들은 서로 간에 또는 황하(黃河) 유역 주변부의 다른 고대 인구(예: 성격달량(聖格達梁) 유적의 Shimao_LN 또는 묘자구(廟子溝) 유적의 Miaozigou_MN)와 가장 높은 유전적 유사성을 공유했다 (그림 S5 및 표 S3).

그림 1. 동아시아 및 동남아시아인의 유전적 맥락에서 본 신석기 후기 산서-섬서(山西-陝西) 지역 인구의 주성분 분석(PCA). 고대 시료를 현대인 집단으로부터 계산된 첫 두 개의 PCA 축에 투영했다. 점선으로 둘러싸인 타원은 각각 동북아시아 관련 그룹(노란색), 동남아시아 관련 그룹(파란색), 중국-티베트 관련 그룹(빨간색)이 차지하는 영역을 나타낸다. (이 그림 범례의 색상에 대한 해석은 이 논문의 웹 버전을 참조하기 바란다.)

These populations were proved to fit a two-way admixture model of YR_MN- and AR_EN-related ancestries [13]. We also conducted a series of unsupervised ADMIXTURE analyses with K ranging from 2 to 8 to acquire more insights on the genetic ancestries of the target populations (Fig. S3). The cross-validation errors gradually increased from k=2 to 8 and mode inconsistency appeared after K=6 (Fig. S4). This means that it is difficult to determine the optimal K value directly and robustly [44]. Nevertheless, we entail a characterization of the ancestry differentiation within East Eurasia, especially in the northern East Asian population. Choosing K=2 with the lowest cross-validation error for interpretation will not meet this requirement. Instead, we selected K=4, where the northern East Asian-related ancestry was divided into a Northeast Asian-related subgroup (yellow) and a Tibetan Plateau-related subgroup (red) (Fig. 2). Together with the southern East Asian-related ancestry (blue), the three East Eurasian related ancestries correspond to the three clines on the PCA plot (Fig. 1). In ADMIXTURE results with k=4 all populations from the Late Neolithic Shanxi-Shaanxi area except LSM_1 showed a genetic profile very similar to Shimao_LN (Fig. 2), indicating a shared genetic connection in Late Neolithic Shanxi-Shaanxi area.

이 집단들은 황하(黃河) 유역 중석기인(YR_MN) 관련 조상과 아무르강(黑龍江) 유역 신석기인(AR_EN) 관련 조상의 2방향 혼합 모델에 부합하는 것으로 증명되었다 [13]. 우리는 또한 대상 집단의 유전적 조상에 대한 더 많은 통찰을 얻기 위해 K값을 2에서 8까지 변화시키며 일련의 비지도 ADMIXTURE 분석을 수행했다 (그림 S3). 교차 검증(cross-validation) 오류는 K=2에서 8로 갈수록 점진적으로 증가했으며, K=6 이후에는 모드(mode) 불일치가 나타났다 (그림 S4). 이는 최적의 K값을 직접적이고 확실하게 결정하기 어렵다는 것을 의미한다 [44]. 그럼에도 불구하고, 우리는 동유라시아, 특히 북부 동아시아 인구 내의 조상 분화를 특성화할 필요가 있다. 해석을 위해 교차 검증 오류가 가장 낮은 K=2를 선택하는 것은 이러한 요구 사항을 충족시키지 못한다. 대신 우리는 K=4를 선택했으며, 이 값에서는 북부 동아시아 관련 조상이 동북아시아 관련 하위 그룹(노란색)과 티베트 고원 관련 하위 그룹(빨간색)으로 나뉘었다 (그림 2). 남부 동아시아 관련 조상(파란색)과 함께, 이 세 동유라시아 관련 조상은 PCA 도표의 세 연속체와 상응한다 (그림 1). K=4의 ADMIXTURE 결과에서, LSM_1을 제외한 신석기 후기 산서-섬서(山西-陝西) 지역의 모든 인구는 Shimao_LN과 매우 유사한 유전적 양상을 보여주어 [그림 2], 신석기 후기 산서-섬서(山西-陝西) 지역 내에 공유된 유전적 연결이 있었음을 나타낸다.

그림 2. K=4일 때 동아시아인과 동남아시아인에 대한 ADMIXTURE 분석 결과. 동유라시아인에게서 풍부하게 나타나는 세 가지 조상 성분이 관찰되었다: 노란색은 동북아시아 관련 조상, 빨간색은 티베트 고원 관련 조상, 파란색은 동남아시아 관련 조상을 나타낸다. 또한, 회색은 러시아 아파나시에보(Afanasievo)로 대표되는 서유라시아 관련 조상을 나타낸다. (이 그림 범례의 색상에 대한 해석은 이 논문의 웹 버전을 참조하기 바란다.)

To further understand this shared genetic profile, we used qpAdm to model the target populations and related populations. Here, we implemented a tournament-wise framework [45] to compare competing models. We chose AR_EN or Yumin as Northeast Asian-related source since the Yumin and Lushanmao site shared the burial practice of Jushizang. Populations from the periphery of Yellow River region were best modelled as a two-way admixture of Yumin- (7.8-23.7%) and YR_MN-related (76.3-92.2%) ancestries (Fig. 4). It is notable that the newly reported individuals from the Shimao site possessed the lowest proportion of Yumin-related ancestry. In contrast, individuals from the Shengedaliang site 35 km away (Shimao_LN) carried more Yumin-related ancestry than other populations from the Late Neolithic Shanxi-Shaanxi area, suggesting such admixed ancestries were heterogeneous among different sites in the terms of relative proportions.

이 공유된 유전적 양상을 더 깊이 이해하기 위해, 우리는 qpAdm을 사용하여 대상 집단과 관련 집단을 모델링했다. 여기서는 경쟁하는 모델들을 비교하기 위해 토너먼트 방식의 프레임워크를 구현했다 [45]. 유민(裕民) 유적과 노산묘(蘆山) 유적이 거실장(居室葬)이라는 장례 관습을 공유하기 때문에, 우리는 동북아시아 관련 조상의 원천으로 아무르강(黑龍江) 유역 신석기인(AR_EN) 또는 유민(裕民) 유적 인구를 선택했다. 황하(黃河) 유역 주변부의 인구는 유민(裕民) 관련 조상(7.8-23.7%)과 황하(黃河) 유역 중석기인(YR_MN) 관련 조상(76.3-92.2%)의 2방향 혼합 모델로 가장 잘 설명되었다 (그림 4). 주목할 점은, 새로 보고된 석모(石峁) 유적의 개체들은 유민(裕民) 관련 조상 비율이 가장 낮았다는 것이다. 반면, 35km 떨어진 성격달량(聖格達梁) 유적의 개체(Shimao_LN)는 다른 신석기 후기 산서-섬서(山西-陝西) 지역 인구보다 더 많은 유민(裕民) 관련 조상을 가지고 있었는데, 이는 이러한 혼합 조상이 유적지마다 상대적 비율 면에서 이질적이었음을 시사한다.

3.3. LSM_1: 신석기 후기 산서-섬서 지역의 유전적 특이 개체 (LSM_1 is a genetic outlier in the Late Neolithic Shanxi-Shaanxi area)

Though populations from the Late Neolithic Shanxi-Shaanxi area formed a genetic cluster, which is linked together by the two-way admixed ancestry mentioned above, we still found that LSM_1 from the Lushanmao site harbored an unexpected Hongshan culture-related genetic background. We calculated a series of f₄ statistics in the form of f₄(Mbuti, Reference population X; Other populations from Late Neolithic Shanxi-Shaanxi area, LSM_1) to determine if LSM_1 share more alleles with other populations. LSM_1 showed a strong genetic affinity with WLR_MN, as evidenced by the significant positive values (Z > 3) of the f₄ statistics (Fig. 3 and Table S4).

신석기 후기 산서-섬서(山西-陝西) 지역의 인구는 앞에서 언급한 2방향 혼합 조상에 의해 서로 연결된 하나의 유전적 군집을 형성했지만, 우리는 노산묘(蘆山) 유적의 LSM_1이 예상치 못한 홍산(紅山) 문화 관련 유전적 배경을 가지고 있음을 발견했다. 우리는 LSM_1이 다른 집단과 더 많은 대립유전자를 공유하는지 확인하기 위해, f₄(음부티; 참조 집단 X; 다른 신석기 후기 산서-섬서 지역 집단, LSM_1) 형태의 일련의 f₄ 통계량을 계산했다. f₄ 통계량의 유의미한 양수 값(Z > 3)에서 증명되듯이, LSM_1은 서요하(西遼河) 유역 중석기인(WLR_MN)과 강한 유전적 친화성을 보였다 (그림 3 및 표 S4).

그림 3. f₄(음부티, 참조 집단 X; LSM_1, 다른 신석기 후기 산서-섬서 지역 집단) 형태의 F₄ 통계 (표 S4와 관련됨). 상위 10개와 하위 10개 값을 그래프에 표시했다. 오차 막대는 표준 오차 1을 나타낸다. 통계적으로 유의미한 양수 값(Z > 3)은 참조 집단이 두 번째 집단보다 첫 번째 집단과 더 많은 유전적 부동(genetic drift)을 공유함을 의미하며, 음수 값은 그 반대를 의미한다. LSM_1은 다른 신석기 후기 산서-섬서(山西-陝西) 지역 집단과 비교했을 때, 홍산(紅山) 문화 관련 집단(WLR_MN)에 대해 추가적인 유전적 친화성을 보였다.

In the pairwise-qpWave analysis testing the genetic homogeneity of different ancient population pairs, LSM_1 also clustered with WLR_MN (p = 0.95) and Miaozigou_MN (p = 0.46), demonstrating a genetic profile that is fairly different from those of surrounding contemporary populations (p < 0.05) (Fig. S6).

서로 다른 고대 인구 쌍의 유전적 동질성을 검사하는 쌍별(pairwise) qpWave 분석에서, LSM_1은 서요하(西遼河) 유역 중석기인(WLR_MN, p=0.95) 및 묘자구(廟子溝) 유적 중석기인(Miaozigou_MN, p=0.46)과도 군집을 이루었다. 이는 주변의 동시대 인구와는 상당히 다른 유전적 양상(p < 0.05)을 보여준다 (그림 S6).

In PCA and ADMIXTURE analysis, LSM_1 deviated from the genetic pattern shared by other populations of Late Neolithic Shanxi-Shaanxi area, in line with the results of f-statistics-based analyses. LSM_1 shifted towards the Northeast Asian-related cline in the PCA space composed of PC1 and PC2 (Fig. 1). This additional gene flow from ancient Northeast Asians was also reinforced by the excess Northeast Asian-related component LSM_1 carried in the unsupervised ADMIXTURE analysis (Fig. 2). LSM_1 was also best modelled as a two-way admixture of Yumin and YR_MN-related ancestries, with the ratio of two very similar to that of WLR_MN (Fig. 4 and Table S5). Besides, the outgroup-f₃ statistics in the form of f₃(Mbuti; Reference population X, LSM_1) showed that LSM_1 shared the most genetic shifts with WLR_MN (Fig. S5 and Table S3). These results echoed with the homogeneity of LSM_1 and WLR_MN confirmed by qpWave (Fig. S6).

주성분 분석(PCA)과 ADMIXTURE 분석에서 LSM_1은 신석기 후기 산서-섬서(山西-陝西) 지역의 다른 인구가 공유하는 유전적 패턴에서 벗어나 있었으며, 이는 f-통계 기반 분석 결과와 일치한다. LSM_1은 PC1과 PC2로 구성된 PCA 공간에서 동북아시아 관련 연속체 쪽으로 이동했다 (그림 1). 이러한 고대 동북아시아인으로부터의 추가적인 유전자 흐름은 비지도 ADMIXTURE 분석에서 LSM_1이 가진 과도한 동북아시아 관련 성분에 의해서도 뒷받침되었다 (그림 2). LSM_1은 또한 유민(裕民) 관련 조상과 황하(黃河) 유역 중석기인(YR_MN) 관련 조상의 2방향 혼합 모델로 가장 잘 설명되었는데, 두 조상의 비율은 서요하(西遼河) 유역 중석기인(WLR_MN)의 비율과 매우 유사했다 (그림 4 및 표 S5). 그 외에, f₃(음부티; 참조 집단 X, LSM_1) 형태의 외집단(outgroup) f₃ 통계량은 LSM_1이 서요하(西遼河) 유역 중석기인(WLR_MN)과 가장 많은 유전적 이동(genetic shifts)을 공유함을 보여주었다 (그림 S5 및 표 S3). 이러한 결과들은 qpWave 분석으로 확인된 LSM_1과 WLR_MN의 동질성과 일치했다 (그림 S6).

그림 4. 신석기 후기 산서-섬서(山西-陝西) 지역 집단 및 관련 고대 집단에 대한 최적의 2방향 qpAdm 모델 (표 S5와 관련됨). 오차 막대는 잭나이프 리샘플링(jackknife resampling)으로 추정된 표준 오차 1을 나타낸다. 각 qpAdm 모델의 p값은 오른쪽에 제시되어 있다.

3.4. 동형접합성 연속구간(ROH) 분석을 통해 본 근친혼의 가능성 (ROH analysis reveals possible connection to consanguine marriage)

We also used hapROH to examine ROHs larger than 4 cM in ancient samples from Late Neolithic Shanxi-Shaanxi area. Surprisingly, we found that LSM_1 carried a total of 254.75 cM ROHs with the longest one spanning 41.32 cM, indicating parental relatedness (Fig. 5). In contrast, only one ROH segment (~6 cM, SM_2) was detected in other samples. We then screened for potential ROHs in other related samples from northern China, two WLR_MN individuals were also found to carry a large number of ROH fragments (Fig. S7). An explanation for these ROHS accompanied by WLR_MN-related ancestry is the theocratic practice observed in the Hongshan culture [46]. The religious class in such a theocratic society may have special concepts and customs for maintaining bloodline, thus resulting in inbreeding.

우리는 또한 hapROH를 사용하여 신석기 후기 산서-섬서(山西-陝西) 지역 고대 시료에서 4cM보다 큰 동형접합성 연속구간(ROH)을 조사했다. 놀랍게도, 우리는 LSM_1이 총 254.75cM의 ROH를 가지고 있으며, 가장 긴 구간은 41.32cM에 달하는 것을 발견했는데, 이는 부모가 친족 관계였음을 시사한다 (그림 5). 이와 대조적으로, 다른 시료들에서는 단 하나의 ROH 구간(SM_2에서 약 6cM)만이 탐지되었다. 그 후 우리는 중국 북부의 다른 관련 시료들에서 잠재적 ROH를 탐색했으며, 두 명의 서요하(西遼河) 유역 중석기인(WLR_MN) 개체 역시 다수의 ROH 조각을 가지고 있는 것을 발견했다 (그림 S7). 서요하(西遼河) 유역 중석기인(WLR_MN) 관련 조상과 함께 이러한 ROH가 나타나는 현상에 대한 한 가지 설명은 홍산(紅山) 문화에서 관찰되는 신정(神政) 사회 관습이다 [46]. 이러한 신정 사회의 종교 계층은 혈통을 유지하기 위한 특별한 관념과 풍습을 가졌을 수 있으며, 그 결과 근친혼이 발생했을 수 있다.

그림 5. 신석기 후기 산서-섬서(山西-陝西) 지역 개체들이 가진 동형접합성 연속구간(ROH) 조각들. LSM_1은 다른 개체들보다 훨씬 더 많은 ROH 조각을 가지고 있었다. 오른쪽 패널들은 근친 교배(왼쪽) 또는 제한된 인구 크기(오른쪽)로 인해 발생하는 ROH의 이론적 기대치를 나타낸다.

The contrast between the large number of short ROH fragments carried by LSM_1 and the lack of ROH fragments in other individuals also suggests that LSM_1 might harbor a genetic background with a smaller effective population size and had not undergone genetic admixture with other populations in the Shanxi-Shaanxi area.

LSM_1이 가진 다수의 짧은 ROH 조각들과 다른 개체들에게서 ROH 조각이 없다는 점의 대비는, LSM_1이 더 작은 유효 집단 크기를 가진 유전적 배경을 지녔으며 산서-섬서(山西-陝西) 지역의 다른 인구와 유전적 혼합을 겪지 않았을 가능성을 시사한다.

 

4. 토론 (Discussion)

The Shanxi-Shaanxi area in the Late Neolithic period was the frontier of contacts and cultural exchanges between the ancient populations of the Central Plains and the northern steppe [1], giving rise to a series of large settlements on the Loess Plateau, among which the Taosi, Shimao and Lushanmao sites are the most notable. The cultural associations and shared ritual customs between the three sites suggest potential population interactions. Population genetics analysis of 8 ancient genomes from the Late Neolithic Shanxi-Shaanxi area reported in this research showed that the genetic positions of these populations were related to their geographical distribution, showing a genetic background dominated by the Yellow River basin-related ancestry and supplemented by ancient Northeast Asian-related ancestry, consistent with the dual cultural influence of the Central Plains and the northern steppe [6]. Comparative qpAdm modelling (Fig. 4 and Table S5) illuminated that the Northeast Asian-related ancestry may be related to the Yumin site, which is a temporally and spatially proximal source, and this site shared the burial custom of Jushizang with the Lushanmao site. However, since the sample size of the Yumin site is only 1, this may have weakened qpAdm’s power to determine the best model [47]. Thus, we would like the qpAdm results reported here to be treated with more caution. This warning also applies to the models involving LSM_1 and TS, where the sample size of the target population is 1. More thorough sampling of the Early and Middle Neolithic populations in the surrounding areas is necessary for exploring the potential best proxy of this Northeast Asian-related ancestry.

신석기 후기 산서-섬서(山西-陝西) 지역은 중원(中原)과 북방 초원지대의 고대 인구 간 접촉과 문화 교류의 최전선이었으며 [1], 이로 인해 황토 고원(Loess Plateau)에 일련의 대규모 취락들이 생겨났는데, 그중 도사(陶寺), 석모(石峁), 노산묘(蘆山) 유적이 가장 주목할 만하다. 세 유적 간의 문화적 연관성과 공유된 의례 풍습은 잠재적인 인구 상호작용을 시사한다. 이 연구에서 보고된 신석기 후기 산서-섬서(山西-陝西) 지역 8명의 고대 유전체에 대한 집단 유전학 분석은, 이들 인구의 유전적 위치가 지리적 분포와 관련이 있음을 보여주었다. 즉, 황하(黃河) 유역 관련 조상이 지배적이고 고대 동북아시아 관련 조상이 일부 더해진 유전적 배경을 보이는데, 이는 중원(中原)과 북방 초원의 이중적 문화 영향과 일치한다 [6]. 비교 qpAdm 모델링(그림 4 및 표 S5)은 동북아시아 관련 조상이 시간적, 공간적으로 가까운 원천인 유민(裕民) 유적과 관련 있을 수 있음을 밝혔다. 또한 이 유적은 노산묘(蘆山) 유적과 거실장(居室葬)이라는 장례 풍습을 공유했다. 하지만 유민(裕民) 유적의 시료 크기가 1에 불과하기 때문에, 최적의 모델을 결정하는 데 있어 qpAdm의 검정력이 약화되었을 수 있다 [47]. 따라서 우리는 여기에 보고된 qpAdm 결과가 더 신중하게 다루어지기를 바란다. 이 경고는 대상 인구의 시료 크기가 1인 LSM_1과 TS를 포함하는 모델에도 동일하게 적용된다. 이 동북아시아 관련 조상의 잠재적인 최적 대리 집단(proxy)을 탐색하기 위해서는 주변 지역의 신석기 시대 전기 및 중기 인구에 대한 더 철저한 시료 채취가 필요하다.

Although most individuals have similar ancestry composition, LSM_1 was found to be a genetic outlier in the Late Neolithic Shanxi-Shaanxi area. This individual carried a higher proportion of Northeast Asian-related ancestry, similar to that of the Hongshan culture-related population (WLR_MN) (Fig. 2, Fig. 4 and Table S5). Investigation of the ROH fragments carried by LSM_1 also showed that his ROH fragments were longer than 250 cM and LSM_1 probably was a descendant of first-degree cousins (Fig. 5). Given that a large number of ROHs were also detected in the Hongshan culture-related population, we hypothesize that the co-occurrence of this Hongshan culture-related ancestry and inbreeding may have originated from the theocratic society of the Hongshan culture. Hongshan culture is known for a large number of jade offerings buried in the graves and the stone altars used for religious sacrificial ceremonies [48]. These cultural customs also played dominant roles in the Banlashan site [49], to which WLR_MN belonged. Religious or ritual behaviors were the core of the social power system of the Hongshan culture communities, indicating that its population attached great significance to theocratic power. Heavy emphasis on the theocratic power may have sanctified the importance of bloodline-maintaining, thereby promoting the practice of consanguine marriages. However, we cannot rule out the influence of the smaller population size, as indicated by the large number of short ROH fragments carried by WLR_MN (Fig. S7). LSM_1 was buried in a Jushizang with human sacrifices, a ritualistic burial custom that had certain conceptual resonance with the practices of the Hongshan culture. Based on these observations, we tentatively posit a linkage between sacralized hierarchy and endogamy. Given the inferential nature of this hypothesis and the requisite for direct archaeogenetic validation of parental relatedness, broad and stratified sampling of more Hongshan culture-related individuals and comparative analysis of consanguinity patterns across different status group are essential for a further verification of this hypothesis. Y chromosome haplogroup N1b2 of LSM_1 also links him to the wider northern region of East Asia, with this haplogroup being present in ancient Tibetan [50] and Xiongnu [51] populations, although populations carrying this haplogroup may have gradually migrated to Southeast Asia during the Iron Age [52,53].

대부분의 개체들이 유사한 조상 구성을 가졌음에도 불구하고, LSM_1은 신석기 후기 산서-섬서(山西-陝西) 지역에서 유전적 특이 개체로 발견되었다. 이 개체는 홍산(紅山) 문화 관련 인구(WLR_MN)와 유사하게 더 높은 비율의 동북아시아 관련 조상을 가지고 있었다 (그림 2, 그림 4 및 표 S5). LSM_1이 가진 동형접합성 연속구간(ROH) 조각에 대한 조사 역시 그의 ROH 조각 길이가 250cM보다 길다는 것을 보여주었으며, LSM_1은 아마도 1세대 사촌(first-degree cousins)의 후손이었을 것이다 (그림 5). 홍산(紅山) 문화 관련 인구에서도 다수의 ROH가 탐지되었다는 점을 고려하여, 우리는 이 홍산(紅山) 문화 관련 조상과 근친혼의 동시 발생이 홍산(紅山) 문화의 신정(神政) 사회에서 비롯되었을 수 있다는 가설을 세운다. 홍산(紅山) 문화는 무덤에 묻힌 다수의 옥 공물과 종교적 제사 의식에 사용된 석제 제단으로 유명하다 [48]. 이러한 문화적 관습은 서요하(西遼河) 유역 중석기인(WLR_MN)이 속했던 반랍산(半拉山) 유적에서도 지배적인 역할을 했다 [49]. 종교적 또는 의례적 행위는 홍산(紅山) 문화 공동체의 사회 권력 시스템의 핵심이었으며, 이는 그 인구가 신정 권력에 큰 중요성을 부여했음을 나타낸다. 신정 권력에 대한 강한 강조는 혈통 유지의 중요성을 신성시하여 근친혼 관습을 조장했을 수 있다. 하지만, 서요하(西遼河) 유역 중석기인(WLR_MN)이 가진 다수의 짧은 ROH 조각이 시사하듯이, 더 작은 인구 크기의 영향을 배제할 수는 없다 (그림 S7). LSM_1은 순장자와 함께 거실장(居室葬)에 묻혔는데, 이는 홍산(紅山) 문화의 관습과 특정 개념적 공명을 일으키는 의례적 장례 풍습이다. 이러한 관찰에 근거하여, 우리는 신성화된 계층과 족내혼(endogamy) 사이의 연관성을 잠정적으로 가정한다. 이 가설의 추론적 성격과 부모의 친족 관계에 대한 직접적인 고고유전학적 검증의 필요성을 고려할 때, 이 가설을 추가로 검증하기 위해서는 더 많은 홍산(紅山) 문화 관련 개체에 대한 광범위하고 층화된 시료 채취와 서로 다른 지위 집단 간의 혈족 관계 패턴에 대한 비교 분석이 필수적이다. LSM_1의 Y염색체 하플로그룹 N1b2는 또한 그를 더 넓은 동아시아 북부 지역과 연결 짓는다. 이 하플로그룹은 고대 티베트인 [50]과 흉노(匈奴) [51] 인구에 존재했으며, 비록 이 하플로그룹을 가진 인구는 철기 시대 동안 점차 동남아시아로 이주했을 수 있지만 말이다 [52,53].

The other two noteworthy individuals are SM_1 and TS. The ornaments of bronze and jade rings unearthed with SM_1 indicate aristocratic status, and the biological sex determination based on genetic data confirmed that SM_1 was female (Table S1), suggesting that women could hold a noble status in social stratification in the late Neolithic period. TS was of royalty in the middle period of Taosi [54], and was archaeologically considered to be related to Emperor Shun [55], the legendary leader of ancient China. His Y chromosome haplogroup was Oβ (Table S1), which is an important founding haplogroup among modern Han Chinese males [42], indicating a shared paternal lineage between ancient rulers and present-day populations.

다른 두 주목할 만한 개체는 SM_1과 TS이다. SM_1과 함께 출토된 청동 및 옥고리 장신구는 귀족 신분을 나타내며, 유전 데이터에 기반한 생물학적 성별 결정은 SM_1이 여성이었음을 확인해주어(표 S1), 신석기 후기 사회 계층에서 여성이 고귀한 지위를 가질 수 있었음을 시사한다. TS는 도사(陶寺) 중기의 왕족이었으며 [54], 고고학적으로는 고대 중국의 전설적 지도자인 순(舜)임금과 관련이 있다고 여겨진다 [55]. 그의 Y염색체 하플로그룹은 Oβ였는데(표 S1), 이는 현대 한족(漢族) 남성들의 중요한 창시 하플로그룹 중 하나로 [42], 고대 통치자와 현 시대 인구 사이에 부계 혈통이 공유되었음을 나타낸다.

Our study provides a genetic snapshot of the populations from Late Neolithic Shanxi-Shaanxi area, elucidating their close genetic connection with the Yangshao culture-related populations in the Yellow River basin and a minor amount of Northeast Asian admixture. The eccentric genetic background of LSM_1 suggests transregional population interaction, which may be a small-scale migration with limited genetic admixture with local populations. In the future, more detailed and thorough paleogenomics surveys are needed in Shanxi, Shaanxi and surrounding areas to gather more profound insights into the widespread genetic exchanges and complex population dynamics in northern China.

우리 연구는 신석기 후기 산서-섬서(山西-陝西) 지역 인구의 유전적 단면을 제공하여, 이들이 황하(黃河) 유역의 앙소(仰韶) 문화 관련 인구와 긴밀한 유전적 관계를 맺고 있었으며 소량의 동북아시아 혼합이 있었음을 밝혀냈다. LSM_1의 특이한 유전적 배경은 지역을 넘나드는 인구 상호작용을 시사하며, 이는 현지 인구와 제한적으로 유전적 혼합이 이루어진 소규모 이주였을 수 있다. 미래에는 중국 북부의 광범위한 유전적 교류와 복잡한 인구 동태에 대한 더 깊은 통찰을 얻기 위해, 산서(山西), 섬서(陝西) 및 주변 지역에서 더 상세하고 철저한 고유전체학 조사가 필요하다.

 

CRediT 저자 기여도 진술 (CRediT authorship contribution statement)

Zishuai Huang: Writing original draft, Visualization, Methodology, Formal analysis, Conceptualization. Jiaqi Gao: Methodology. Mingzhi Ma: Resources. Wengao Hu: Resources. Xin Xiao: Resources. Hui Li: Writing – review & editing, Supervision, Project administration, Funding acquisition, Conceptualization.

황지솨이(Zishuai Huang): 초고 작성, 시각화, 방법론, 공식 분석, 개념화. 가오자이(Jiaqi Gao): 방법론. 마밍즈(Mingzhi Ma): 자료 제공. 후원가오(Wengao Hu): 자료 제공. 샤오신(Xin Xiao): 자료 제공. 리후이(Hui Li): 논문 검토 및 편집, 지도, 프로젝트 관리, 연구비 확보, 개념화.

연구비 (Funding)

This study was supported by the Ethnic Study Project of National Ethnic Affairs Commission of the People’s Republic of China (2024-GMI-161).

이 연구는 중화인민공화국 국가민족사무위원회(National Ethnic Affairs Commission of the People’s Republic of China)의 민족 연구 프로젝트(Ethnic Study Project) (2024-GMI-161)의 지원을 받았다.

이해관계 상충 선언 (Declaration of competing interest)

The authors declare that they have no known competing financial interests or personal relationships that could have appeared to influence the work reported in this paper.

저자들은 이 논문에 보고된 연구에 영향을 미칠 수 있는 것으로 보일 수 있는, 알려진 경쟁적 재정 이해관계나 개인적 관계가 없음을 선언한다.

감사의 글 (Acknowledgments)

We acknowledge Shaanxi Provincial Institute of Archaeology and Shenmu Baoyuan Museum for providing the ancient samples.

고대 시료를 제공해준 섬서성(陝西省) 고고학연구원과 신목(神木) 바오위안(寶源) 박물관에 감사를 표한다.

부록 A. 보충 데이터 (Appendix A. Supplementary data)

Supplementary data to this article can be found online at https://linkinghub.elsevier.com/retrieve/pii/S0888754325000771.

이 논문의 보충 데이터는 https://linkinghub.elsevier.com/retrieve/pii/S0888754325000771 에서 온라인으로 찾아볼 수 있다.

데이터 이용 가능성 (Data availability)

The untrimmed BAM files reported in this paper have been deposited in the Genome Sequence Archive in National Genomics Data Center, China National Center for Bioinformation / Beijing Institute of Genomics, Chinese Academy of Sciences (Accession No. PRJCA037932) that are accessible at https://ngdc.cncb.ac.cn/gsa-human.

이 논문에 보고된 가공 전 BAM 파일들은 중국과학원(中國科學院) 국가생물정보센터(China National Center for Bioinformation) / 북경유전체연구소(Beijing Institute of Genomics)의 국가유전체데이터센터(National Genomics Data Center) 내 유전체서열저장소(Genome Sequence Archive)에 기탁되었으며(접수 번호: PRJCA037932), https://ngdc.cncb.ac.cn/gsa-human 에서 접근할 수 있다.

 

참고문헌 (References)

[1] X. Dal, Prehistoric Society stages in China and the formation of early states, Acta Archaeol. Sin. 03 (2020) 309-336.

[2] Z. Sun. J. Shao, A. Shao, N. Kang, F. Qu, X. Liu, The Shimao site in Shenmu County, Shaanxi, Archaeology 07 (2013) 15-24-12

[3] N. He. Taosi: An archaeological example of urbanization as a political center in prehistoric China, Archaeol. Res. Asia 14 (2018) 20-32.

[4] M. Ma, L. Zhai, H. Zhang, L. Du, L. Wang, H. Zhao, The Neolithic site of Lushanmao in Yan’an City, Shaanxi, Archaeology 07 (2019) 29-45-22.

[5] C. Zhang, How far did the proto-Neolithic society proceed: discussion on the three regional rise and fall of the prehistoric complex Society in China, Cultural Relics 06 (2023) 50-60-51.

[6] X. Dal, From Lushanmao to Shimao the complexing process of prehistoric societies in the northern plateau, Archaeology 06 (2024) 19.-29.

[7] N. He, J. Gao, X. Wang, Huge construction foundation with rammed-clay referred to middle period of Taosi culture unearthed from Taosi walled-town in Xiangfen County, Shanxi, Archaeology 03 (2008) 3-6.

[8] T. Wang, The Lushanmao site and the formation of the Xitu type architectural tradition, Archaeology 04 (2021) 89-102.

[9] Z. Sun, J. Shao, N. Di, A synthesis of the archaeological discovery and research of the Shimao site, Cult. Relics. Cent. Chin. 01 (2020) 39-62.

[10] J. Chang, Burying the dead inside a house at the Lushanmao site and related issues, Relics Museol. 05 (2020) 53-60.

[11] X. Zhang, Study on M1 human bone from the early Neolithic site of Yumin, Huade County, Inner Mongolia, J. Chifeng Univ. 40 (2019) 31-35.

[12] D. Wang, A tentative exploration of indoor burial of Xinglongwa culture, J. Chifeng Univ. 39 (2018) 17-20.

[13] C. Ning. T. LI. K. Wang. F. Zhang, T. Li, X. Wu, S. Gao, Q Zhang, H. Zhang, M. J. Hudson, G. Dong, S. Wu, Y. Fang, C. Liu, C. Feng, W. Li, T. Han, R. Li, J. Wei, Y. Zhu, Y. Zhou, C.C. Wang, S. Fan, Z. Xiong, Z. Sun, M. Ye, L. Sun, X. Wu, F. Liang, Y. Cao, X. Wei, H. Zhu, H. Zhou, J. Krause, M. Robbeets, C. Jeong, Y. Cui, Ancient genomes from northern China suggest links between subsistence changes and human migration. Nat. Commun. 11 (2020) 2700.

[14] J. Xue, W. Wang, J. Shao, X. Dai, Z. Sun, J.D. Gardner, L. Chen, X. Guo, N. DI, X. Pei, X. Wu, G. Zhang, C. Cui, P. Cao, F. Liu, Q. Dai, X. Feng. R. Yang, W. Ping, L. Zhang, N. He, Q. Fu, Ancient Mitogenomes reveal the origins and genetic. structure of the Neolithic Shimao population in northern China, Front Genet. 13 (2022) 909267.

[15] J. Dabney, M. Knapp, 1, Glocke, M.T. Gansauge, A. Weihmann, B. Nickel, C. Valdiosera, N. García, S. Pääbo, J.L. Arsuaga, M. Meyer, Complete mitochondrial genome sequence of a middle Pleistocene cave bear reconstructed from ultrashort DNA fragments, Proc. Natl. Acad. Sci. USA 110 (2013) 15758-15763.

[16] N. Rohland, E. Harney, S. Mallick, S. Nordenfelt, D. Reich, Partial uracil-DNA-glycosylase treatment for screening of ancient DNA, Philos. Trans. R. Soc. Land. Ser, B Biol. Sci. 370 (2015) 20130624.

[17] M. Meyer, M. Kircher, Illumina sequencing library preparation for highly multiplexed target capture and sequencing, Cold Spring Harb Protoc 2010 (2010) pdb.prot5448.

[18] Q. Fu, M. Hajdinjak, O.T. Moldovan, S. Constantin, S. Mallick, P. Skoglund, N. Patterson, N. Rohland, 1. Lazaridis, B. Nickel, B. Viola, K. Prüfer, M. Meyer, J. Kelso, D. Reich, S. Pääbo, An early modern human from Romania with a recent Neanderthal ancestor, Nature 524 (2015) 216-219.

[19] A. Peltzer, G. Jager, A. Herbig, A. Seitz, C. Kniep, J. Krause, K. Nieselt, EAGER: efficient ancient genome reconstruction, Genome Biol. 17 (2016) 60.

[20] M. Schubert. S. Lindgreen, L. Orlando, AdapterRemoval v2: rapid adapter trimming, identification, and read merging. BMC. Res. Notes 9 (2016) 88.

[21] H. LI, R. Durbin, Fast and accurate short read alignment with burrows-wheeler transform, Bioinformatics 25 (2009) 1754-1760.

[22] J. Neukamm, A. Peltzer, K. Nieselt, DamageProfiler: fast damage pattern calculation for ancient DNA, Bioinformatics 37 (2021) 3652-3653.

[23] G. Jun, M.K. Wing, G.R. Abecasis, H.M. Kang, An efficient and scalable analysis framework for variant extraction and refinement from population-scale DNA sequence data, Genome Res. 25 (2015) 918-925.

[24] Q. Fu, A. Mittník, P.L.F. Johnson, K. Bos, M. Lari, R. Bollongino, C. Sun, L. Giemsch, R. Schmitz, J. Burger, A.M. Ronchitelli, F. Martini, R.G. Cremonesi, J. Svoboda, P. Bauer, D. Caramelli, S. Castellano, D. Reich, S. Pääbo, J. Krause, A revised timescale for human evolution based on ancient mitochondrial genomes, Curr. Biol. 23 (2013) 553-559.

[25] G. Renaud, V. Slon, A.T. Duggan, J. Kelso, Schmutzi: estimation of contamination and endogenous mitochondrial consensus calling for ancient DNA, Genome Biol. 16 (2015) 224.

[26] Y. Huang, H. Ringbauer, hapCon: estimating contamination of ancient genomes by copying from reference haplotypes, Bioinformatics 38 (2022) 3768-3777.

[27] T.S. Korneliussen, A. Albrechtsen, R. Nielsen, ANGSD: analysis of next generation sequencing data, BMC Bioinf. 15.(2014) 356.

[28] T.C. Lamnidis, K. Majander, C. Jeong, E. Salmela, A. Wessman, V. Moiseyev, V. Khartanovich, O. Balanovsky, M. Ongyerth, A. Weihmann, A. Sajantila, J. Kelso, S. Paabo, P. Onkamo, W. Haak, J. Krause, S. Schiffels, Ancient Fennoscandian genomes reveal origin and spread of Siberian ancestry in Europe, Nat. Commun. 9 (2018) 5018.

[29] S. Schönherr, H. Weissensteiner, F. Kronenberg. L. Forer, Haplogrep 3 an interactive haplogroup classification and analysis platform, Nucleic Acids Res. 51 (2023) W263-w268.

[30] A. Ralf, D. Montiel Gonzalez, K. Zhong, M. Kayser, Yleaf: software for human Y-chromosomal Haplogroup inference from next-generation sequencing data, Mol Biol. Evol. 35 (2018) 1291-1294.

[31] A. Jagadeesan, S.S. Ebenesersdóttir, V.B, Guðmundsdóttir, EL. Thordardottir, K.Η. 5. Moore, A. Helgason, HaploGrouper a generalized approach to haplogroup classification, Bioinformatics 37 (2021) 570-572

[32] E. Alaçamlı, T. Naidoo, M.N. Güler, E. Saglıcan, 5. Aktürk, I. Mapelli, K.B. Vural, M. Somel, H. Malmstrom, T. Günther, READv2: advanced and user-friendly detection of biological relatedness in archaeogenomics, Genome Biol. 25 (2024) 216.

[33] D. Popli, S. Peyregne, B.M. Peter, KIN: a method to infer relatedness from low-coverage ancient DNA, Genome Biol. 24 (2023) 10.

[34] S. Mallick, D. Reich, The Allen ancient DNA resource (AADR): A curated compendium of ancient human genomes, in: Harvard Dataverse, 2023.

[35] S. Mallick, A. Micco, M. Mah, H. Ringbauer, I. Lazaridis, L. Olalde, N. Patterson, D. Reich, The Allen ancient DNA resource (AADR) a curated compendium of ancient human genomes, Sci. Data 11 (2024) 182.

[36] N. Patterson, P. Moorjani, Y. Luo, S. Mallick, N. Rohland, Y. Zhan, T. Genschoreck, T. Webster, D. Reich, Ancient admixture in human history, Genetics 192 (2012) 1065-1093.

[37] M. Milanesi, S. Capomaccio, E. Vajana, L. Bomba, J.F. Garcia, P. Ajmone-Marsan, L. Colli, BITE: an R package for biodiversity analyses, bioRxiv (207) 181610. https://github.com/marcomilanesi/BITE

[38] S. Chen, C. Lei, X. Zhao, Y. Pan, D. Lu, S. Xu, Ancestry Painter 2.0: visualizing ancestry composition and admixture history graph, Genome Biol. Eval. 16 (2024).

[39] R. Maier, P. Flegontov, O. Flegontova, U. Işıldak, P. Changmai, D. Reich, On the limits of fitting complex models of population history to f-statistics, Elife 12 (2023).

[40] H. Ringbauer, J. Novembre, M. Steinrücken, Parental relatedness through time revealed by runs of homozygosity in ancient DNA, Nat. Commun. 12 (2021) 5425.

[41] J. Dabney, M. Meyer, S. Pääbo, Ancient DNA damage, Cold Spring Harb, Perspect. Biol. 5.(2013).

[42] S. Yan, C.C. Wang, H.X. Zheng, W. Wang, Z.D. Qin, L.H. Wei, Y. Wang, X.D. Pan, W. Q. Fu, Y.G. He, L.J. Xiong. W.F. Jin, S.L. Li, Y. An, H. Li, L. Jin, Y chromosomes of 40% Chinese descend from three Neolithic super-grandfathers, PLoS One 9.(2014) e105691.

[43] K. Hu, S. Yan, K. Liu, C. Ning, L.-H. Wel, S.-L. Li, B. Song, G. Yu, F. Chen, L-J. Liu, Z-P. Zhao, C.-C. Wang, Y.-J. Yang, Z D. Qin, J.-Z. Tan, F.-Z. Xue, H. Li, L.-L. Kang, L. Jin, The dichotomy structure of Y chromosome Haplogroup N, arXiv (2015), 1504.06463.

[44] C.C. Liu, S. Shringarpure, K. Lange, J. Novembre, Exploring population structure with admixture models and principal component analysis, Methods Mol. Biol. 2090 (2020) 67-86.

[45] L. Lazaridis, N. Patterson, D. Anthony, L. Vyazov, R. Fournier, H. Ringbauer, 1. Olalde, A.A. Khokhlov, E.P. Kitov, N.1. Shishlina, S.C. Ailincai, D.S. Agapov, S. A. Agapov, E. Barieva, B. Bauyrzhan, Z. Bereczki, A. Buzhilova, P. Changmai, A. A. Chizhevsky, I. Ciobanu, M. Constantinescu, M. Csányi, J. Dani, P. K. Dashkovskiy, 5. Evinger, A. Faifert, P. Flegontov, A. Frinculeasa, M. N. Frinculeasa, T. Hajdu, T. Higham, P. Jarosz, P. Jelínek, V.I. Khartanovich, E. N. Kirginekov, V. Kiss, A. Kitova, A.V. Kiyashko, J. Koledin, A. Korolev, P. Kosintsev, G. Kulcsar, P. Kuznetsov, R. Magomedov, A.M. Mamedov, E. Melis, V. Moiseyev, E. Molnar, J. Monge, O. Negrea, N.A. Nikolaeva, M. Novak, M. Ochir-Goryaeva, G. Pálfi, S. Popovici, M.P. Rykun, T.M. Savenkova, V.P. Semibratov, N. N. Seregin, A. Sercákova, R.S. Mussayeva, I. Shingiray, V.N. Shirokov, A. Simalesik, K. Sirak, K.N. Solodovníkov, J. Tárnoki, A.A. Tishkin, V. Trifonov, S. Vasilyev, A. Akbari, E.S. Brielle, K. Callan, F, Candillo, O. Cheronet, E. Curtis, O. Flegontova, L. Iliev, A. Kearns, D. Keating. A.M. Lawson, M. Mah, A. Micco, M. Michel, J. Oppenheimer, L. Qiu, J.N. Workman, F. Zalzala, A. Szécsényi-Nagy, P. F. Palamara, S. Mallick, N, Rohland, R. Pinhasi, D. Reich, The genetic origin of the indo-Europeans, Nature 639 (2025) 132-142.

[46] R.D. Drennan, C.E. Peterson, X. Lu, T. Li, Hongshan households and communities in Neolithic northeastern China, J. Anthropol. Archaeol. 47 (2017) 50-71.

[47] É. Harney, N. Patterson, D. Reích, J. Wakeley, Assessing the performance of qpAdm: a statistical tool for studying population admixture, Genetics 217 (2021).

[48] C.E. Peterson, X. Lai, R.D. Drennan, D. Zhu, Hongshan chiefly communities in Neolithic northeastern China, Proc. Natl. Acad. Sci. USA 107 (2010) 5756-5761.

[49] 2. Xiong, S. Fan, Y. Wu, S. Li, Y. Xin, T. Gao, Excavation of the Hongshan culture cemetery at Banlashan, Chaoyang City, Liaoning, Archaeology (2017) 3-34-32.

[50] H. Wang. M.A. Yang, S. Wangdue, H. Lu, H. Chen, L. Li, G. Dong, T. Tsring, H. Yuan, W. He, M. Ding, X. Wu, S. Li, N. Tashi, T. Yang, F. Yang, Y. Tong. 2. Chen, Y. He, P. Cao, Q. Dai, F. Liu, X. Feng, T. Wang, R. Yang, W. Ping, Z. Zhang, Y. Gao, M. Zhang, X. Wang, C. Zhang, K. Yuan, A.M. Ko, M. Aldenderfer, X. Gao, S. Xu, Q. Fu, Human genetic history on the Tibetan plateau in the past 5100 years. Sci. Adv. 9. (2023) eadd5582.

[51] C. Jeong, K. Wang, S. Wilkin, W.T.T. Taylor, B.K. Miller, J.H. Bemmann, R. Stahl, C. Chiovelli, F. Knolle, S. Ulziibayar, D. Khatanbaatar, D. Erdenebaatar, U. Erdenebat, A. Ochir, G. Ankhsanaa, C. Vanchigdash, B. Ochir, C. Munkhbayar, D. Tumen, A. Kovalev, N. Kradin, B.A. Bazarov, D.A. Miyagashev, P.B. Konovalov, E. Zhambaltarova, A.V. Miller, W. Haak, S. Schiffels, J. Krause, N. Boivin, M. Erdene, J. Hendy, C. Warinner, A dynamic 6,000-year genetic history of Eurasia’s eastern steppe, Cell 183 (2020) 890-904.829.

[52] H. McColl, F. Racimo, L. Vinner, F. Demeter, T. Gakuhari, J.V. Moreno-Mayar, G. van Driem, U. Gram Wilken, A. Seguin-Orlando, C. de la Fuente Castro, S. Wasef, R. Shoocongdej, V. Souksavatdy, T. Sayavongkhamdy, M.M. Saidin, M.E. Allentoft, T. Sato, A.S. Malaspinas, F.A. Aghakhanian, T. Korneliussen, A. Protaska, A. Margaryan, P. de Barros Damgaard, S. Kaewsutthi, P. Lertrit, T.M.H. Nguyen, H. C. Hung, T. Minh Tran, H. Nghia Truong, G.H. Nguyen, S. Shahidan, K. Wiradnyana, H. Matsumae, N. Shigehara, M. Yoneda, H. Ishida, T. Masuyama, Y. Yamada, A. Tajima, H. Shibata, A. Toyoda, T. Hanihara, 5. Nakagome, T. Deviese, A.M. Bacon, P. Duringer, J.L. Ponche, L. Shackelford, E. Patole Edoumba, A.T. Nguyen, B. Bellina-Pryce, J.C. Galipaud, R. Kinaston, H. Buckley, C. Pottier, S. Rasmussen, T. Higham, R.A. Foley, M.M. Lahr, L. Orlando, M. Sikora, M.E. Phipps, H. Oota, C. Higham, D.M. Lambert, E. Willerslev, The prehistoric peopling of Southeast Asia, Science 361 (2018) 88-92

[53] W. Kutanan, J. Kampuansai, M. Srikummool, A. Brunelli, S. Ghirotto, L. Arias, E. Macholdt, A. Hübner, R. Schröder, M. Stoneking. Contrasting paternal and maternal genetic histories of Thai and Lao populations, Mol. Biol. Evol. 36 (2019) 1490-1506.

[54] N. He, Archaeological Indicators for Chinese early states: a case study of Taosi in Shanxi, Soc. Evol. History 17 (2018) 205-234.

[55] N. He, Taosi: The Starting Point of the Formation of the Core of Chinese Civilization, Shanghai Ancient Books Publishing House, Shanghai, China, 2022.