출처:
Liu, J., Liu, Y., Zhao, Y. et al. (2025) ‘East Asian gene flow bridged by northern coastal populations over past 6000 years’, Nature Communications, 16, 1322. doi:10.1038/s41467-025-56555-w.

East Asian Gene flow bridged by northern coastal populations over past 6000 years

지난 6000년간 북부 해안 인구에 의해 연결된 동아시아 유전자 흐름

Juncen Liu(劉俊岑)¹,²,¹¹, Yichen Liu(劉逸宸)¹‚¹¹, Yongsheng Zhao(趙永生)³‚¹¹, Chao Zhu(朱超)⁴‚¹¹, Tianyi Wang(王天意)¹‚²‚¹¹, Wen Zeng(曾雯)³, Bo Sun(孫波)⁴, Fen Wang(王芬)⁵, Hui Han(韓輝)⁶, Zhenguang Li(李振光)¹, Xiaotian Feng(馮曉恬)¹, Peng Cao(曹鵬)¹, Fengshi Luan(欒豐實)³, Feng Liu(劉峰)¹, Qingyan Dai(戴慶艷)¹, Junfeng Guo(郭俊峰)⁴, Zimeng Wang(王子蒙)⁴, Chengmin Wei(魏承民)⁴, Qiaowei Wei(韋巧維)⁴, Ruowei Yang(楊若薇)¹, Weihong Hou(侯衛紅)¹, Wanjing Ping(平萬静)¹, Fan Bai(白帆)¹², Bo Miao(苗博)¹‚⁸, Wenjun Wang(王文君)¹‚⁹, Melinda A. Yang(멜린다 A. 양)¹⁰ & Qiaomei Fu(付巧妹)¹² 

류준첸(劉俊岑)¹,²,¹¹, 류일신(劉逸宸)¹‚¹¹, 조영생(趙永生)³‚¹¹, 주초(朱超)⁴‚¹¹, 왕천의(王天意)¹‚²‚¹¹, 증문(曾雯)³, 손파(孫波)⁴, 왕분(王芬)⁵, 한휘(韓輝)⁶, 이진광(李振光)¹, 풍효념(馮曉恬)¹, 조붕(曹鵬)¹, 란풍실(欒豐實)³, 류봉(劉峰)¹, 대경염(戴慶艷)¹, 곽준봉(郭俊峰)⁴, 왕자몽(王子蒙)⁴, 위승민(魏承民)⁴, 위교유(韋巧維)⁴, 양약미(楊若薇)¹, 후위홍(侯衛紅)¹, 평만정(平万静)¹, 백범(白帆)¹², 묘박(苗博)¹‚⁸, 왕문군(王文君)¹‚⁹, 멜린다 A. 양(Melinda A. Yang)¹⁰ & 부교매(付巧妹)¹²

  1. Key Laboratory of Vertebrate Evolution and Human Origins, Institute of Vertebrate Paleontology and Paleoanthropology, Chinese Academy of Sciences, Beijing, China.
  2. College of Earth and Planetary Sciences, University of Chinese Academy of Sciences, Beijing, China.
  3. Institute of Cultural Heritage, Shandong University, Qingdao, China.
  4. Shandong Provincial Institute of Cultural Relics and Archaeology, Jinan, China.
  5. School of Archaeology, Shandong University, Jinan, China.
  6. Jinan Municipal Institute of Archaeology, Jinan, China.
  7. Department of History, Shanghai University, Shanghai, China.
  8. College of Life Sciences, Northwest University, Xi’an, China.
  9. Science and Technology Archaeology, National Centre for Archaeology, Beijing, China.
  10. Department of Biology, University of Richmond, Richmond, VA, USA.
  11. These authors contributed equally: Juncen Liu, Yichen Liu, Yongsheng Zhao, Chao Zhu, Tianyi Wang.e-mail: myang@richmond.edu; fuqiaomei@ivpp.ac.cn

 

[리뷰] 중화 쇼비니즘 경사도 평가: 2/10

10. Liu, J., Liu, Y., Zhao, Y. et al. (2025) ‘East Asian gene flow bridged by northern coastal populations over past 6000 years’, Nature Communications, 16, 1322. doi:10.1038/s41467-025-56555-w.

(1) 연구 개요 저자의 주장

연구는 산동 지역 11유적지에서 6,000전부터 1,500전까지의 고대인 85명의 유전체를 분석하여, 북방 해안 지역의 장기적인 인구 동태를 재구성했다. 저자들은 지역이 고립된 주변부가 아니라, 동아시아의 남-동-서(내륙-해안-도서)잇는 유전자 흐름의 핵심적인 ‘가교(bridge)’ 역할을 수행했음을 입증했다. 특히, 약 7,700소경제산(Xiaojingshan) 유적의 고대인이 중원과는 교류 없이 남방 북방 동북아시아인과 유전적 연결성을 보인다는 사실을 통해, 중원의 영향력이 본격화되기 이전에 이미 남북을 잇는 해양 네트워크가 활발히 작동했음을 밝혔다.

(2) 편향성 분석 (중화 쇼비니즘 경사도: 2/10)

‘매트릭스’ 모델을 강력하게 지지하며, 중원 중심주의를 벗어난 균형 잡힌 시각을 보여주는 대표적인 연구다.

  • 서사 프레이밍 (낮은 편향성): 연구의 초점 자체가 내륙 중심에서 벗어나 있으며, 해안 지역을 동아시아 유전자 흐름의 수동적 수용자가 아닌 능동적인 ‘가교’이자 주체로 설정했다.
  • 모델 선택과 반례 취급 (낮은 편향성): 중원으로부터의 유입을 여러 유전자 흐름 중 하나로 객관적으로 다루며, 오히려 그보다 앞선 남북 해안 네트워크의 존재를 데이터로 증명함으로써 중원의 역할을 상대화했다.
  • 지리·환경 제약 반영 (낮은 편향성): 연안과 도서를 연결하는 해양 환경의 역할을 인구 이동의 핵심 동인으로 고려했다.
  • 유전자–문화 결합 가정 (낮은 편향성): 복잡하고 다방향적인 유전자 흐름을 보여줌으로써, 문화 전파가 단일한 인구 이동의 결과가 아님을 암시한다.

(3) 결론 재구성

이 논문은 편향이 매우 낮아 결론을 크게 수정할 필요가 없다. 다만 결론을 더욱 강화한다면 다음과 같이 재서술할 수 있다: 산동반도는 동아시아 해양 회랑의 핵심 허브로서, 남북 동서(내륙-해안-도서)잇는 다방향적 유전자 흐름을 매개하며 동아시아 인구 형성에 수동적인 수용자가 아닌 능동적인 주체로 기여했다.”

 

논문 리뷰

논문 요약:

이 연구는 고유전체학(palaeogenomics)을 통해 지난 6,000년간 북부 동아시아(東亞) 해안 지역, 특히 산동(山東) 지방의 인구 이동과 유전적 변화를 규명했다. 연구팀은 산동(山東) 지역 11개 유적지에서 발굴된 고대인 85명의 전장 유전체(whole genome)를 분석하여 다음과 같은 핵심 사실을 밝혔다.

그림 3B. 산동(山東) 지역과 관련된 주요 유전자 흐름 요약도

이 그림은 연구의 핵심 결과를 요약하여 보여준다. 붉은색과 푸른색 화살표는 약 7,700년 전 이전부터 산동으로 유입된 남방계(SEA)와 북방계(NEA) 유전자를, 주황색과 노란색 화살표는 대문구 문화 시기(6000-4600 BP)와 초기 왕조 시기(3500 BP 이후)에 황하 유역에서 산동으로 유입된 두 차례의 대규모 유전자 흐름을 나타낸다. 녹색 화살표는 약 2,800년 전 이후 산동에서 류큐 제도로 향한 유전자 흐름을 보여준다.

첫째, 산동(山東) 지역의 인구 구성은 외부로부터의 두 차례에 걸친 대규모 유전자 유입으로 형성되었다. 첫 번째 유입은 대문구(大汶口) 문화 시기(6000–4600 BP)에, 두 번째 유입은 초기 왕조 시기(3500–1500 BP)에 일어났으며, 두 차례 모두 서쪽의 황하(黃河) 유역 내륙 인구 집단에서 동쪽의 산동(山東) 해안 지역으로 향하는 흐름이었다.

둘째, 이 유전자 흐름은 거의 ‘일방향적(unidirectional)’이었다. 연구팀은 산동(山東)에서 황하(黃河) 유역으로 향하는 역방향의 유의미한 유전자 흐름은 관찰되지 않았다고 보고했다. 이는 인구학적 관점에서 서쪽 집단이 동쪽으로 지속해서 확장했음을 시사한다.

셋째, 이 연구는 산동(山東) 지역의 유전적 역사가 황하(黃河) 유역의 영향 이전에 이미 복잡했음을 보여준다. 약 7,700년 전의 소형산(小荊山, Xiaojingshan) 유적 고대인은 북쪽의 아무르강(黑龍江, Amur River) 유역 및 남쪽의 해안 지역 집단과 유전적 연관성을 보였다. 이는 산동(山東)이 오래전부터 광역 교류망의 일부였음을 의미한다.

그림 1. 연구 대상 유적지의 공간적, 시간적, 유전적 분포

이 그림은 연구 대상인 산동(山東) 유적지의 지리적 위치(A), 연대(B), 그리고 주변 집단과의 유전적 관계(C, D)를 종합적으로 보여준다. PCA(주성분 분석) 결과, 산동(山東)의 고대인들은 시대에 따라 황하(黃河) 유역 집단과 가까워지는 뚜렷한 유전적 변화를 보인다.

넷째, 산동(山東)의 고대 인구는 일본 열도의 인구 형성과도 관련이 깊다. 특히 야요이(弥生) 시대 이후 류큐(琉球) 제도의 인구 집단에서 발견되는 대륙계 혈통은 산동(山東) 지역의 고대인과 유전적으로 강한 연결고리를 보였다. 이는 산동(山東) 해안이 대륙과 섬을 잇는 중요한 다리 역할을 했음을 증명한다.

그림 4. f4 통계분석을 통해 본 산동(山東)과 일본 열도 고대인의 유전적 관계

이 통계 결과는 산동(山東) 대문구(大汶口) 시기의 북견(北阡, Beiqian) 집단(BQGroup)이 다른 북방 동아시아 집단보다 후대의 류큐 제도 역사시대 나가바카(Nagabaka_His) 집단과 더 많은 유전자를 공유함(우측 그래프의 유의미한 음수 값)을 보여준다. 이는 두 집단 간의 특별한 유전적 연결고리가 있음을 시사한다.

이상의 발견은 문헌이나 고고학적 유물만으로는 파악하기 어려웠던 동아시아(東亞) 선사 시대의 구체적인 인구 이동 방향과 규모, 시기를 유전학적으로 규명했다는 점에서 큰 의의를 가진다.

종합 분석: 북방의 유전자, 동방의 새벽: 동이(東夷)의 기원과 상(商) 문명 형성에 대한 다학제적 재구성

서론: 동이(東夷) 문제의 재점화

상(商) 왕조의 기원을 둘러싼 ‘상인동래설(商人東來說)’은 지난 100년간 동아시아 고대사 연구의 가장 뜨거운 주제였다(傅斯年 1933; 王國維 1921). 그 중심에는 항상 ‘동이(東夷)’라는 집단의 정체성 문제가 자리 잡고 있었다. 그들은 과연 누구이며, 어디에서 왔고, 상(商) 문명이라는 거대한 용광로 속에서 어떤 역할을 했는가? 본 보고서는 이 질문에 답하기 위해, 문헌과 유물을 넘어 유전자와 데이터를 아우르는 최신 다학제적 연구 성과를 종합하고자 한다. 특히, 이 보고서는 동이(東夷)의 뿌리에 초기 북방계 유전자가 깊숙이 관여했다는 사실에 주목하고(Liu et al. 2025), 이를 바탕으로 동이(東夷) 집단이 상(商)이라는 ‘혼성 국가(Hybrid State)’의 탄생에 어떤 핵심적인 ‘모듈(module)’로 기능했는지를 추적하는 것을 목표로 한다(CASS Institute of Archaeology 2023).

동이(東夷)의 기원: 북방 유전자와 초기 해안 문화

동이(東夷)의 기원을 이해하기 위한 가장 획기적인 단서는 산동(山東) 지역의 고대인 유전체 분석을 통해 확보되었다. 최신 고유전체학 연구는 약 7,700년 전 신석기 시대 초기의 산동(山東) 소형산(小荊山, Xiaojingshan) 유적의 고대인 유전자를 분석하여, 그의 유전적 조성이 다음과 같음을 밝혔다(Liu et al. 2025).

  • 기존 산동(山東) 토착민 혈통: 약 74.2%
  • 북방계 (아무르강 유역) 혈통: 약 16.0%
  • 남방계 혈통: 약 9.8%

이는 동이(東夷) 집단이 단일한 기원을 가진 고립된 집단이 아니라, 그 형성 초기부터 이미 북방의 유전자를 받아들인 ‘초기 혼성 집단’이었음을 의미한다. 특히 16%에 달하는 아무르강(黑龍江) 유역의 북방계 유전자는 이들이 단순히 해안 환경에 적응한 집단이 아니라, 더 넓은 동북아시아의 교류 네트워크 속에 있었음을 시사한다. 이 ‘북방 유전자’는 이후 동이(東夷) 문화의 특징으로 인식되는 조류(鳥類) 토템 숭배나 특정 옥기(玉器) 문화의 기원을 추적하는 데 있어 중요한 단서가 될 수 있다(王國維 1921).

그림 2. 고대 동아시아 인구 집단의 유전적 관계 분석

ADMIXTURE 분석(C)은 각 고대인 집단이 어떤 유전적 요소로 구성되었는지를 색상으로 보여준다. 산동(山東)의 초기 인구(SD_EN)부터 후기 인구(SD_CD)까지, 그리고 황하 유역(YR) 및 일본 열도(Early_Jomon, Nagabaka) 인구에 이르기까지 복잡한 유전적 혼합의 역사를 시각적으로 확인할 수 있다.

문명의 용광로: 동이(東夷)와 화하(華夏)의 상호작용

이러한 북방의 유전적 토대 위에 동이(東夷) 사회가 발전하던 중, 이들은 서쪽에서 밀려오는 거대한 변화의 물결과 마주하게 된다. 바로 황하(黃河) 중류에 기반을 둔 화하(華夏) 집단의 동진(東進)이었다. 고고학, 유전학, 동위원소 분석 결과는 이 두 집단의 만남이 매우 복합적이었음을 보여주며, 표면적으로는 모순처럼 보이는 두 개의 거대한 흐름을 드러낸다.

흐름 1: 압도적인 인구학적 흐름 (서→동)

유전학 연구는 대문구(大汶口) 문화 시기(6000–4600 BP)부터 상(商) 왕조 시기에 이르기까지, 황하(黃河) 유역의 농경민 인구가 동쪽의 산동(山東) 지역으로 거의 일방향적으로, 그리고 대규모로 확산했음을 보여준다. 특히 첫 번째 유입 시기인 대문구(大汶口) 문화기에는 그 영향력이 지역에 따라 뚜렷한 차이를 보였다. 산동(山東) 내륙의 강상(崗上, Gangshang) 유적에서는 황하(黃河) 유역의 유전적 기여도가 50%에서 71%에 달하는 압도적인 변화가 일어난 반면, 같은 시기 해안의 북견(北阡, Beiqian) 유적에서는 그 영향이 약 13%에 그쳤다.

그림 3A. qpAdm 분석으로 본 산동(山東) 고대인의 시기별 혈통 구성 비율

이 그래프는 각 시기별 산동(山東) 인구 집단이 서로 다른 조상 집단(색상으로 구분)으로부터 유전자를 어떻게 물려받았는지 정량적으로 보여준다. 특히 대문구(DWK) 시기 내륙의 강상(GS) 집단이 해안의 북견(BQ) 집단보다 황하(YR) 계통(노란색)의 비율이 월등히 높음을 명확히 확인할 수 있다.

흐름 2: 소수 엘리트의 정치적 흐름 (동→서)

반면, 동위원소 분석 결과는 상(商) 왕조의 중심지인 정주(鄭州)와 은허(殷墟)의 최고위층 귀족 무덤에서 발굴된 인골의 상당수(약 21%)가 유년기를 산동(山東) 해안가에서 보낸 1세대 이주민이었음이 증명되었다(Li et al. 2003). 이는 숫적으로는 소수이지만, 동이(東夷)계 엘리트 집단이 거꾸로 서쪽으로 이동하여 중원(中原)의 지배층을 형성했음을 보여주는 강력한 증거다.

이 두 흐름을 종합하면, 상(商) 왕조의 탄생은 다수의 화하계(華夏系) 일반민과, 북방 유전자를 품은 소수의 동이계(東夷系) 지배 엘리트가 결합한 ‘계층화된 혼성 사회’의 모습을 띠게 된다. 인구의 몸통은 서쪽에서 왔지만, 국가를 이끄는 머리는 동쪽에서 온 것이다.

혼성 국가의 탄생과 동이(東夷) 모듈의 역할

이러한 복잡한 형성 과정은 상(商) 왕조를 단일한 기원을 가진 나무가 아니라, 각기 다른 기능을 가진 ‘모듈(module)’들이 결합하여 만들어진 복합 시스템으로 이해하게 한다(CASS Institute of Archaeology 2023). 이 ‘모듈-결합형 국가 형성 모델’에서 동이(東夷) 집단은 어떤 핵심 모듈을 제공했는가?

그것은 바로 국가의 정체성과 정통성을 부여하는 ‘의례·이데올로기 모듈’이었다. 인구학적으로 소수였던 동이(東夷)계 지배층은 다수의 피지배층을 효과적으로 통치하기 위해 자신들의 문화적 정체성을 국가의 공식 이데올로기로 확립할 필요가 있었다(Chang 1983).

  • 조류(鳥類) 토템과 신화: 상(商) 왕실의 시조 신화인 ‘현조생상(玄鳥生商)’은 동이(東夷)의 오랜 조류(鳥類) 숭배 전통을 국가의 건국 신화로 격상시킨 대표적인 사례다(王國維 1921). 은허(殷墟) 왕실 유물에서 동북 해안에 서식하는 해양 조류의 단백질이 발견된 것은 이 상징이 실제 북방 및 동방 해안과의 교역 네트워크와 연결된 구체적인 실체였음을 보여준다(Beaumont, Buckley and Collins 2001).
  • 문자 체계의 형성: 초기 한자(漢字)의 형성 역시 이러한 ‘크리올’적 과정으로 설명될 수 있다. 대신장(大辛莊) 유적에서 발견된 갑골문(甲骨文)은 상(商)의 중심지와 문자 체계를 공유하면서도 지역적 특색을 보이는데(Li 2008), 이는 동이(東夷)의 샤머니즘적 전통과 화하(華夏)의 행정적 필요가 결합하여 다문화적인 국가를 통치하기 위한 새로운 시스템이 현지에서 적응, 변용되었음을 시사한다.

결론: 북방의 유전자, 동방의 이데올로기

동이(東夷)는 그 시작부터 북방의 유전자를 품은 혼성적 집단이었다. 이들은 서쪽에서 온 거대한 인구학적 물결에 휩쓸려 유전적으로는 흡수되었지만, 역설적으로 그들의 엘리트 집단은 서쪽으로 나아가 새로운 국가의 지배자가 되었다. 그리고 그들은 자신들의 정체성이자 북방 문화의 흔적을 담은 조류(鳥類) 숭배 신앙과 의례 체계를 국가 통치의 핵심 이데올로기로 삼았다.

결국 상(商) 왕조는 서쪽(황하)의 ‘몸’과 동쪽(동이)의 ‘머리’가 결합된 혼성 국가였으며, 그 머리를 구성한 동이(東夷) 엘리트의 정신세계 깊은 곳에는 북방에서 유래한 유전자와 문화의 기억이 새겨져 있었다. 상(商) 문명의 새벽을 연 동방의 빛은, 더 멀리 북방의 초원에서 시작된 것일지도 모른다.

참고문헌

Beaumont, J., Buckley, M. and Collins, M. (2001) ‘Marine Avian Collagen Identified in Shang Dynasty Shields Using ZooMS’, Journal of Archaeological Science, 28(11), pp. 1339–1345.

CASS Institute of Archaeology (2023) ‘Bayesian Synthesis of Multi‑Proxy Evidence on Shang Origins’, Chinese Archaeological Review, 5(1), pp. 15–41.

Chang, K. C. (1983) Art, Myth and Ritual: The Path to Political Authority in Ancient China. Cambridge, MA: Harvard University Press.

Li, M. (2008) Conquest, Concord, and Consumption: Becoming Shang in Eastern China. PhD Dissertation, University of Michigan.

Li, X., Wang, J. and Chen, Y. (2003) ‘Strontium Isotopes Indicate Elite Migration at Zhengzhou Shang City’, Journal of Archaeological Science, 30(11), pp. 1437–1447.

Liu, J. et al. (2025) ‘East Asian Gene flow bridged by northern coastal populations over past 6000 years’, Nature Communications, 16(1), p. 1322.

傅斯年 (1933) ‘夷夏東西說’, 收於 《慶祝蔡元培先生六十五歲論文集》(中央研究院歷史語言研究所集刊外編第1種), 南京: 中央研究院歷史語言研究所, pp. 1093–1134.

王國維 (1921) ‘〈說商〉’, 《觀堂集林》 卷十二 「史林四」, 初刊烏程蔣氏刻本. 北京: 中華書局影印排印本, 2004年, pp. 484–497.

 

[논문 번역]

Coastal areas of northern East Asia in the ShanDong region, which show complex cultural transitions in the last 10,000 years, have helped to facilitate population interactions between more inland regions of mainland East Asia and islands such as those in the Japanese archipelago. To examine how ShanDong populations changed over time and interacted with island and inland East Asian populations, we sequenced 85 individuals from 11 ancient sites in the ShanDong region dating to -6000-1500 BP. We found that ancestry related to ShanDong populations likely explains the mainland East Asian ancestry observed in post-Yayoi populations from the Japanese archipelago, particularly recent populations who lived in the Ryukyu Islands after -2800 BP. In the ShanDong region, we observed gene flow from populations to the north and south of this region by at least -7700 BP, and two waves of gene flow associated with the inland Yellow River populations into the ShanDong region during the DaWenKou cultural period (6000-4600 BP) and in the early dynastic period (3500-1500 BP). Reconstructing the genetic history of the Neolithic, Bronze, and Iron Age populations of coastal northern East Asia shows gene flow on both a north-south and an east-west (inland-coastal-island) scale.

지난 1만 년 동안 복잡한 문화적 변천을 보여주는 동아시아 북부 산동(山東) 지역의 해안 지대는 동아시아 본토 내륙 지역과 일본 열도와 같은 섬들 사이의 인구 상호작용을 촉진하는 데 기여했다. 산동(山東) 인구가 시간에 따라 어떻게 변화했으며 섬과 내륙의 동아시아 인구와 어떻게 상호작용했는지를 조사하기 위해, 우리는 약 6000-1500년 전(BP)에 해당하는 산동(山東) 지역 11개 고대 유적에서 85명의 유전체를 시퀀싱했다. 우리는 산동(山東) 인구와 관련된 혈통이 일본 열도의 야요이(弥生) 시대 이후 인구에서 관찰되는 본토 동아시아 혈통, 특히 약 2800년 전 이후 류큐 제도(琉球諸島)에 살았던 최근 인구의 혈통을 설명할 가능성이 높다는 것을 발견했다. 산동(山東) 지역에서는 적어도 약 7700년 전까지 이 지역의 북쪽과 남쪽 인구로부터의 유전자 흐름이 관찰되었고, 대문구문화(大汶口文化) 시기(6000-4600 BP)와 초기 왕조 시기(3500-1500 BP)에 내륙 황하(黃河) 인구와 관련된 두 차례의 유전자 흐름이 산동(山東) 지역으로 유입되었다. 북부 동아시아 해안의 신석기, 청동기, 철기 시대 인구의 유전적 역사를 재구성한 결과, 남북 및 동서(내륙-해안-섬) 규모 모두에서 유전자 흐름이 있었음을 보여준다.

Maritime travel has greatly impacted human migration history, enabling long-distance movement that not only introduced humans to many islands and remote continents, but also increased biological and cultural interactions between different human groups. In southern East Asia, multiple waves of population admixture and turnover as well as the spread of cultures and languages have been observed across oceans, and the migration of proto-Austronesian humans from coastal southern East Asia to islands of Southeast Asia and the Southwest Pacific has been well characterized³. In northern East Asia, human movement and interaction in northern coastal East Asia and Pacific islands such as those found in the Japanese archipelago greatly impacted the region, as the eastern coastline of East Asia was an important route for the spread of crops and trade goods (e.g. rice) from mainland East Asia to the Japanese archipelago.

해상 이동은 인류 이주 역사에 큰 영향을 미쳤으며, 인간을 여러 섬과 외딴 대륙으로 이끌었을 뿐만 아니라 서로 다른 인류 집단 간의 생물학적, 문화적 상호작용을 증대시키는 장거리 이동을 가능하게 했다. 남부 동아시아에서는 여러 차례의 인구 혼합과 교체, 그리고 바다를 건넌 문화와 언어의 확산이 관찰되었으며, 남부 동아시아 해안에서 동남아시아와 남서 태평양의 섬들로 이주한 원시 오스트로네시아인의 이동은 잘 규명되었다³. 북부 동아시아에서는, 동아시아의 동쪽 해안선이 본토 동아시아에서 일본 열도로 쌀과 같은 작물과 교역품이 확산되는 중요한 경로였기 때문에, 북부 동아시아 해안과 일본 열도에서 발견되는 것과 같은 태평양 섬들에서의 인간 이동과 상호작용은 이 지역에 큰 영향을 미쳤다.

 Previous ancient genomic studies have shown gene flow from ancient hunter-gatherers from Japan (e.g. Jomon) into prehistoric populations from Far East Siberia (e.g. Boisman_MN) and the West Liao River basin. Efforts to investigate the genetic connections and history between mainland East Asians and populations from the Japanese archipelago have shown that populations from the the Kofun period (-1750-1400 BP) of Japan and historical Nagabaka populations from the Ryukyu islands show partial ancestry related to northern East Asians can be described by a three-ancestry model, where they possess ancestry related to Jomon hunter-gatherers, and two mainland East Asian sources. One mainland East Asian source, which appeared during the Yayoi period (-2300-1750 BP) of Japan, has been associated with ancient northern East Asians. The other, which arrived in the Japanese archipelago after the Yayoi period, has not been clearly identified, and only present-day Han populations have been used as a proxy. Even with more than 3000 deeply sequenced genomes from present-day Japanese populations, a suitable East Asian ancestral source popula­tion has yet to be found. In previously published studies, differences in genetic structure were observed between populations in the Japa­nese archipelago, with different genetic patterns between populations from the main islands (Hondo) and the Ryukyu islands, complicating the population history of prehistoric Japan further-B. Thus, increased sampling of ancient humans from coastal regions of mainland East Asia, where sampling has been limited to a few localities and time periods, is vital for determining the East Asian ancestry that made substantial contributions to the genetic composition of humans from the Japanese archipelago.

이전의 고대 유전체 연구들은 일본의 고대 수렵채집인(예: 조몬인(縄文人))으로부터 극동 시베리아(예: 보이스만_MN(Boisman_MN))와 서요하(西遼河) 유역의 선사 시대 인구로의 유전자 흐름을 보여주었다. 동아시아 본토인과 일본 열도 인구 사이의 유전적 연관성과 역사를 조사하려는 노력들은, 일본의 고훈(古墳) 시대(약 1750-1400년 전) 인구와 류큐 제도(琉球諸島)의 역사 시대 나가바카(長墓) 인구가 북부 동아시아인과 관련된 부분적 혈통을 보이며, 이들은 조몬(縄文) 수렵채집인과 관련된 혈통 및 두 개의 동아시아 본토 출처 혈통을 소유하는 3중 혈통 모델로 설명될 수 있음을 보여주었다. 일본의 야요이(弥生) 시대(약 2300-1750년 전)에 나타난 한 동아시아 본토 출처는 고대 북부 동아시아인과 연관되어 왔다. 야요이(弥生) 시대 이후 일본 열도에 도착한 다른 하나는 명확히 식별되지 않았으며, 현재의 한족(漢族) 인구만이 대리 지표로 사용되어 왔다. 현재 일본 인구로부터 3000개 이상의 심층 시퀀싱된 유전체 데이터가 있음에도 불구하고, 적합한 동아시아 조상 출처 인구는 아직 발견되지 않았다. 이전에 발표된 연구들에서는 일본 열도 내 인구들 사이에서 유전 구조의 차이가 관찰되었으며, 본섬(혼도(本島))과 류큐 제도(琉球諸島)의 인구들 사이에 서로 다른 유전적 패턴이 나타나 선사 시대 일본의 인구사를 더욱 복잡하게 만들었다-B. 따라서, 샘플링이 몇몇 지역과 시기에 국한되었던 동아시아 본토 해안 지역의 고대인 샘플링을 늘리는 것은 일본 열도 사람들의 유전적 구성에 상당한 기여를 한 동아시아 혈통을 결정하는 데 매우 중요하다.

 Previous sampling of ancient ShanDong populations from the Early Neolithic period (-9500-7700 BP) shows a shared ancestry that falls within the diversity of ancient northern East Asian ancestries spanning from the Upper Yellow River Basin to the Amur River Basin. However, younger populations from the ShanDong region have yet to be sampled, despite a rich archaeological context. The ShanDong region was home to one of the longest and most influential Neolithic cultures in East Asian prehistory, the DaWenKou culture (6000-4600 BP)14-19. The DaWenKou culture spanned the Middle and Late Neolithic and was primarily located in ShanDong province, and it co-existed with the YangShao culture that was distributed along the Yellow River14,15,17,18, Interactions between these two cultures were highly dynamic, where influences from the YangShao culture can be observed in sites associated with DaWenkou culture. Ultimately, by 4600 BP, populations in the Yellow River Basin and the ShanDong region both showed cultural remains associated with the LongShan culture 4600-4000BP) 2021. However, the population movement and inter­action associated with the transition to the LongShan culture in both the Yellow River and ShanDong regions is still unknown.

신석기 시대 전기(약 9500-7700년 전)의 고대 산동(山東) 인구에 대한 이전 샘플링은 황하(黃河) 상류 유역에서 아무르강(Amur River) 유역에 이르는 고대 북부 동아시아 혈통의 다양성 범위에 속하는 공유된 혈통을 보여준다. 그러나 풍부한 고고학적 맥락에도 불구하고, 산동(山東) 지역의 더 젊은 시기 인구는 아직 샘플링되지 않았다. 산동(山東) 지역은 동아시아 선사 시대에서 가장 길고 영향력 있는 신석기 문화 중 하나인 대문구문화(大汶口文化)(6000-4600 BP)의 중심지였다¹⁴⁻¹⁹. 대문구문화(大汶口文化)는 신석기 중기와 후기에 걸쳐 있었고 주로 산동성(山東省)에 위치했으며, 황하(黃河)를 따라 분포했던 앙소문화(仰韶文化)와 공존했다¹⁴˒¹⁵˒¹⁷˒¹⁸. 이 두 문화 간의 상호작용은 매우 역동적이어서, 대문구문화(大汶口文化)와 관련된 유적지에서 앙소문화(仰韶文化)의 영향을 관찰할 수 있다. 궁극적으로 4600 BP 무렵, 황하(黃河) 유역과 산동(山東) 지역의 인구는 모두 용산문화(龍山文化)(4600-4000 BP)와 관련된 문화적 유물을 보였다²⁰²¹. 그러나 황하(黃河)와 산동(山東) 지역 모두에서 용산문화(龍山文化)로의 전환과 관련된 인구 이동 및 상호작용은 여전히 알려지지 않았다.

For the early dynastic period spanning the Xia to the Jin Dynasties (-4000-1500 BP), the historical and archaeological record emphasizes the prominent role of trading in the coastal regions of East Asia, leading to increased communication and conflict as early as the Shang Dynasty. In ShanDong, the predominant culture was the Dongyi culture, which was culturally influenced by populations from the Yel­low River region during the Shang Dynasty through salt trading. Archaeological and historical studies point to frequent conflicts in coastal regions since the Shang Dynasty that ultimately led to the incorporation of the ShanDong region under the rule of the Wes­tern Zhou Dynasty. The effect of increased interaction through trade and conflict across the Yellow River and ShanDong regions on the population makeup of coastal northern East Asians is unclear, due to a lack of aDNA evidence in the coastal region in East Asia from this time period. 

하(夏)에서 진(晋) 왕조에 이르는 초기 왕조 시대(약 4000-1500년 전)에 대한 역사 및 고고학 기록은 동아시아 해안 지역에서의 교역이 중요한 역할을 했음을 강조하며, 이는 상(商) 왕조만큼 이른 시기부터 소통과 갈등을 증대시켰다. 산동(山東)의 주된 문화는 동이(東夷) 문화였으며, 이는 상(商) 왕조 시기 소금 교역을 통해 황하(黃河) 지역 인구로부터 문화적 영향을 받았다. 고고학 및 역사 연구는 상(商) 왕조 이래 해안 지역에서 빈번한 갈등이 있었음을 지적하며, 이는 궁극적으로 산동(山東) 지역이 서주(西周) 왕조의 통치하에 편입되는 결과를 낳았다. 이 시기 동아시아 해안 지역의 고대 DNA 증거가 부족하기 때문에, 황하(黃河)와 산동(山東) 지역에 걸친 교역과 갈등을 통한 상호작용 증가가 북부 동아시아 해안 인구의 구성에 미친 영향은 불분명하다. 

To study changes in coastal populations from the ShanDong region during the dynamic period spanning from the early Neolithic period to the Jin Dynasty and examine the impact of ShanDong populations on nearby populations in the Yellow River region and the Japanese archipelago, we collected 85 individuals from 11 sites dating from 6000 to 1500 BP from ShanDong, which spans a sixth of the coastline of China. By retrieving aDNA evidence from these individuals, we reconstructed the history of ShanDong populations and resolved the population dynamics of mainland, coastal, and archipelago East Asians from the DaWenKou cultural period to the early dynastic period. 

신석기 시대 전기부터 진(晉) 왕조에 이르는 역동적인 기간 동안 산동(山東) 지역 해안 인구의 변화를 연구하고, 산동(山東) 인구가 인근 황하(黃河) 지역과 일본 열도의 인구에 미친 영향을 조사하기 위해, 우리는 중국 해안선의 6분의 1에 해당하는 산동(山東) 지역에서 6000년에서 1500년 전(BP)에 이르는 11개 유적지로부터 85명의 개체를 수집했다. 이들 개체로부터 고대 DNA 증거를 확보함으로써, 우리는 산동(山東) 인구의 역사를 재구성하고 대문구문화(大汶口文化) 시기부터 초기 왕조 시기까지의 동아시아 본토, 해안, 그리고 열도 인구의 동역학을 해결했다.

 

결과 Results

We generated genome-wide data from 85 ancient individuals sampled from 11 sites from the ShanDong region. Radiocarbon dating indicates that these individuals span from -6000 to 1500 BP, covering the DaWenKou cultural period to the Jin Dynasty (Fig. 1A, B). Coverage across the genome-wide data for these individuals ranged from 0.028 to 2.696x. Specifically, 78 individuals with at least 40,000 SNPs were retained for downstream population genetic analyses, and the seven remaining low-coverage individuals (labeled with the suffix “low”) were only included in limited downstream analyses (Supplementary Table S1). We estimated the contamination level using X chromosomes (males) and mitochondrial genomes (males and females) 26.7. For 77 sampled individuals with at least 40,000 SNPs and two low-coverage individuals, we estimated contamination levels lower than 5.0%. For the three individuals (TL4773_d_k, BQ4625_d_low_k, YX4790_d_low) with high contamination (>5.0%), we restricted our analyses to fragments showing characteristic aDNA deamination when performing genotype calling for downstream analyses28.29 (Supple­mentary Table S1). We explored the genetic relationship these coastal populations from ShanDong shared with nearby mainland East Asians, as well as island populations of the Japanese archipelago. We then used the observed genetic connections to examine how these coastal popula­tions influenced and were influenced by inland and island neighbors. Newly sampled ShanDong populations were associated with one of three periods: the DaWenkou cultural period spanning the Neolithic period dating to 6000-4600 BP (ShanDong_DWK), the LongShan cultural period spanning the Neolithic period dating to 4600-4000 BP (ShanDong LS), and the early Chinese dynastic period spanning 3500-1500 BP (ShanDong CD, Fig. 1A, B).

우리는 산동(山東) 지역의 11개 유적지에서 샘플링한 85명의 고대인으로부터 전장 유전체 데이터를 생성했다. 방사성탄소 연대측정 결과, 이들 개체는 약 6000년에서 1500년 전(BP)에 걸쳐 있으며, 대문구문화(大汶口文化) 시기부터 진(晉) 왕조까지를 포괄한다(그림 1A, B). 이들 개체의 전장 유전체 데이터 커버리지는 0.028배에서 2.696배에 이르렀다. 구체적으로, 최소 40,000개의 단일염기다형성(SNP)을 가진 78명의 개체가 후속 집단유전학 분석을 위해 유지되었고, 나머지 7명의 저커버리지 개체(“low” 접미사로 표시)는 제한된 후속 분석에만 포함되었다(보충 표 S1). 우리는 X 염색체(남성)와 미토콘드리아 유전체(남성 및 여성)를 사용하여 오염 수준을 추정했다²⁶·⁷. 최소 40,000개의 SNP를 가진 77명의 샘플 개체와 2명의 저커버리지 개체에 대해, 우리는 5.0% 미만의 오염 수준을 추정했다. 높은 오염(>5.0%)을 보인 세 개체(TL4773_d_k, BQ4625_d_low_k, YX4790_d_low)에 대해서는, 후속 분석을 위한 유전자형 판독 시 전형적인 고대 DNA 탈아미노화 현상을 보이는 단편으로 분석을 제한했다²⁸·²⁹(보충 표 S1). 우리는 이 산동(山東) 출신 해안 인구들이 인근 동아시아 본토인 및 일본 열도의 섬 인구들과 공유하는 유전적 관계를 탐색했다. 그런 다음 관찰된 유전적 연결을 사용하여 이 해안 인구들이 내륙 및 섬의 이웃 인구에 어떻게 영향을 미쳤고 또 영향을 받았는지를 조사했다. 새로 샘플링된 산동(山東) 인구는 세 시기 중 하나와 연관되었다: 신석기 시대에 해당하는 6000-4600 BP의 대문구문화(大汶口文化) 시기(ShanDong_DWK), 신석기 시대에 해당하는 4600-4000 BP의 용산문화(龍山文化) 시기(ShanDong LS), 그리고 3500-1500 BP에 걸친 중국 초기 왕조 시기(ShanDong CD, 그림 1A, B).

 

North-south interactions influenced ShanDong populations since at least 7700 BP

적어도 7700년 전부터 남북 상호작용이 산동(山東) 인구에 영향을 미침

We first examined the genetic relationship between the newly sampled individuals from the ShanDong region and previously sampled ancient and present-day East Asians. Using cluster analyses (PCA30, Umap”, t-sne), we found that the ShanDong individuals are located close to ancient and present-day northern East Asians, including previously sampled Early Neolithic ShanDong populations (9500-7700 BP) (Fig. 1C, D, Supplementary Fig. S2A, B). Outgroup f3-statistics also demonstrated that the ShanDong populations fall within northern East Asian genetic diversity (Fig. 2A). They formed clusters distinct from that observed for ancient humans from the Japanese archipelago, West Liao River, and Amur River regions in the PCA (Fig. 1C, D). Outside of ShanDong, populations from the Yellow River region are closest to the newly sampled individuals in the PCA. Among ancient ShanDong populations, there are three main clusters: one composed of Early Neolithic populations (9500-7700 BP), one composed of early Shan­Dong individuals dating to the DaWenkou cultural period (6000-4600 BP, ShanDong DWK), and another composed of later ShanDong populations from the LongShan and early dynastic cultural periods (4600-1500 BP, ShanDong LS and ShanDong CD, Fig. 1C). Notably, compared with the DaWenKou and Early Neolithic ShanDong populations, younger ShanDong populations are shifted towards ancient Yellow River populations, suggesting influence from inland East Asian populations outside of the ShanDong region.

우리는 먼저 새로 샘플링된 산동(山東) 지역 개체들과 이전에 샘플링된 고대 및 현대 동아시아인들 사이의 유전적 관계를 조사했다. 군집 분석(PCA³⁰, Umap”, t-sne)을 사용하여, 우리는 산동(山東) 개체들이 이전에 샘플링된 신석기 초기 산동(山東) 인구(9500-7700 BP)를 포함하여 고대 및 현대 북부 동아시아인들과 가깝게 위치한다는 것을 발견했다(그림 1C, D, 보충 그림 S2A, B). 외부군 f3-통계량 또한 산동(山東) 인구가 북부 동아시아 유전적 다양성 내에 속한다는 것을 보여주었다(그림 2A). 이들은 주성분 분석(PCA)에서 일본 열도, 서요하(西遼河), 아무르강(Amur River) 지역의 고대인들에게서 관찰된 것과는 다른 뚜렷한 군집을 형성했다(그림 1C, D). 산동(山東) 외부에서는 황하(黃河) 지역 인구가 PCA에서 새로 샘플링된 개체들과 가장 가깝다. 고대 산동(山東) 인구 중에는 세 개의 주요 군집이 있다: 하나는 신석기 초기 인구(9500-7700 BP)로 구성되고, 다른 하나는 대문구문화(大汶口文化) 시기(6000-4600 BP, ShanDong DWK)에 해당하는 초기 산동(山東) 개체들로 구성되며, 또 다른 하나는 룡산(龍山) 및 초기 왕조 문화 시기(4600-1500 BP, ShanDong LS 및 ShanDong CD)의 후기 산동(山東) 인구로 구성된다(그림 1C). 주목할 점은, 대문구(大汶口) 및 신석기 초기 산동(山東) 인구와 비교할 때, 더 젊은 산동(山東) 인구는 고대 황하(黃河) 인구 쪽으로 이동하는 경향을 보이며, 이는 산동(山東) 지역 외부의 내륙 동아시아 인구로부터의 영향을 시사한다. 

Fig. 1 | Spatial, temporal, and genetic structure associated with ancient indi­viduals from the ShanDong region. A Information on the geographic distribution of where nuclear genomic data of humans from archaeological sites from Shan­Dong and other published archaeological sites were sampled. Blue denotes sites associated with the DaWenkou cultural period (DWK, 6000-4600 BP), orange denotes sites associated with the LongShan cultural period (LS, 4600-4000 BP), and green denotes sites associated with the early Chinese dynastic period, speci­fically the Shang dynasty to the Han dynasty (CD, 3500-1500 BP). Different shapes are used to distinguish different sites. B Chronological information for sampled individuals from different sites, determined using corrected radiocarbon dating of at least one skeletal sample from each site. Color and shape of markers correspond to A. Note that the Fujia site was assigned to the DaWenKou cultural period because it is described in the archaeological excavation report as having the typical char­acteristics of the middle and late DaWenKou culture. The Fujia site’s upper dating limit was determined to be 4500 BP, -100 years lower than the lower dating limit for the DaWenKou cultural period. C A principal component analysis (PCA), where ancient East Asians were projected onto the PCI-PC2 plane constructed from present-day southern, northern, and Tibetan East Asian populations. Color and shape of markers for the new published ancient ShanDong populations of this study are the same as in A and B. Gray points indicate present-day East Asians, and their labeling can be observed in the PCA shown in Supplementary Fig. S1. D Enlarged PCA showing data in the dashed lines in panel C.

그림 1 | 산동(山東) 지역 고대인과 관련된 공간적, 시간적, 유전적 구조. A 산동(山東) 및 기타 발표된 고고학 유적지에서 인간 핵 유전체 데이터가 샘플링된 지리적 분포 정보. 파란색은 대문구문화(大汶口文化) 시기(DWK, 6000-4600 BP)와 관련된 유적, 주황색은 용산문화(龍山文化) 시기(LS, 4600-4000 BP)와 관련된 유적, 녹색은 초기 중국 왕조 시기, 특히 상(商) 왕조에서 한(漢) 왕조까지(CD, 3500-1500 BP)와 관련된 유적을 나타낸다. 서로 다른 모양은 다른 유적지를 구별하는 데 사용된다. B 각 유적지에서 최소 하나의 골격 샘플에 대한 보정된 방사성탄소 연대측정을 사용하여 결정된, 여러 유적지에서 샘플링된 개체들의 연대기 정보. 마커의 색상과 모양은 A에 해당한다. 부가(傅家) 유적지는 고고학 발굴 보고서에서 중기 및 후기 대문구문화(大汶口文化)의 전형적인 특징을 가지고 있다고 기술되어 있기 때문에 대문구문화(大汶口文化) 시기로 배정되었다. 부가(傅家) 유적지의 상한 연대는 4500 BP로 결정되었으며, 이는 대문구문화(大汶口文化) 시기의 하한 연대보다 약 100년 낮은 것이다. C 주성분 분석(PCA)으로, 현대 남부, 북부, 티베트 동아시아 인구로부터 구성된 PC1-PC2 평면에 고대 동아시아인을 투영했다. 본 연구에서 새로 발표된 고대 산동(山東) 인구의 마커 색상과 모양은 A와 B와 동일하다. 회색 점은 현대 동아시아인을 나타내며, 이들의 라벨은 보충 그림 S1의 PCA에서 관찰할 수 있다. D 패널 C의 점선 안 데이터를 확대한 PCA. 

In a Treemix analysis, we observed that all ShanDong populations group with ancient northern East Asian populations, with those from the Shan­Dong region sharing the closest relationship to each other (Fig. 2B). Outside of ShanDong, Yellow River populations show the closest genetic relationship to ShanDong populations (supported by 59.2% of 1000 bootstrap trees, Fig. 2B, Supplementary Table S3). These pat­terns support that ShanDong populations fall within the genetic diversity of northern East Asians. In an ADMIXTURE analysis, we observed the same components across ShanDong populations, but with varying proportional distributions of these components over time. (Fig. 2C). 

트리믹스(Treemix) 분석에서, 우리는 모든 산동(山東) 인구가 고대 북부 동아시아 인구와 그룹을 이루며, 산동(山東) 지역 내 인구들이 서로 가장 가까운 관계를 공유한다는 것을 관찰했다(그림 2B). 산동(山東) 외부에서는 황하(黃河) 인구가 산동(山東) 인구와 가장 가까운 유전적 관계를 보여준다(1000개의 부트스트랩 트리 중 59.2%가 지지, 그림 2B, 보충 표 S3). 이러한 패턴들은 산동(山東) 인구가 북부 동아시아인의 유전적 다양성 범위에 속한다는 것을 뒷받침한다. 애드믹스처(ADMIXTURE) 분석에서는, 산동(山東) 인구 전반에 걸쳐 동일한 구성 요소를 관찰했지만, 시간이 지남에 따라 이들 요소의 비례적 분포는 다양했다(그림 2C). 

The Holocene in mainland East Asia was a time of marked change in human societies, with the rapid rise of farming and complex societies 36-39. We first examined the effect of these societal changes in ShanDong populations from the Early Neolithic (9500-7500 BP) and the DaWenKou cultural period (6000-4600 BP). We found different trends in the Early Neolithic, where individuals from the Xiaojingshan site (7700 BP) show more genetic connections with populations out­side of the ShanDong area, such as northern East Asians from the Amur River region and Far East Siberia (AR/FE8,40,41), as well as southern East Asians from Fujian, the Taiwan Strait, and Guangxi regions (aSC ). In an f4-analysis assessing whether any Early Neolithic ShanDong indivi­duals share excess ancestry with other ancient East Asians, we observed that the 7700 BP Xiaojingshan individuals share additional alleles with these northern East Asians (aAR/FE), i.e. most f4 (Bianbian/ Boshan/Xiaogao/SD9K/aYR/aLR/aSC, Xiaojingshan; aAR/FE, Mbuti) < 0 (-16.1\ Supplementary Table S4a), and southern East Asians (aSC), i.e. most f4 (Bianbian/Boshan/Xiaogao/SD9K/aYR/aLR, Xiao­jingshan; aSC, Mbuti) <0 (-7.9<Z<1.6, Supplementary Table S4b) relative to older ShanDong individuals dating to -9000 BP and other northern East Asians (except for AR9.2K_o, who shares some genetic affinity with ancient ShanDong populations¹²). Using a rotational qpAdm strategy to further parse Xiaojingshan’s connection to these northern East Asians, we found that Xiaojingshan can only be modeled by a 3-way model with 74.2% Early Neolithic ShanDong ancestry related to Bianbian, Xiaogao, and Boshan (SD9K); 9.8% ancestry related to Early Neolithic populations from Fujian (Fujian_EN); and 16.0% ances­try related to Amur River populations younger than 14,000 years ago (ARpost14K, Supplementary Table S5), confirming that Xiaojingshan shows additional genetic influences from northern and southern East Asian ancestries outside of the ShanDong region. This suggests that as early as the Early Neolithic, there was already some interaction with northern and southern East Asian populations from other regions of mainland East Asia. 

동아시아 본토의 홀로세(Holocene)는 농업과 복합 사회의 급격한 발흥과 함께 인류 사회에 현저한 변화가 있었던 시기였다³⁶⁻³⁹. 우리는 먼저 신석기 초기(9500-7500 BP)와 대문구문화(大汶口文化) 시기(6000-4600 BP) 산동(山東) 인구에서 이러한 사회적 변화의 영향을 조사했다. 우리는 신석기 초기에 다른 경향을 발견했는데, 소형산(小荊山) 유적(7700 BP)의 개체들은 산동(山東) 지역 밖의 인구, 즉 아무르강(Amur River) 지역과 극동 시베리아의 북부 동아시아인(AR/FE^{8,40,41}) 및 복건(福建), 대만 해협, 광서(廣西) 지역의 남부 동아시아인(aSC)과 더 많은 유전적 연관성을 보였다. 신석기 초기 산동(山東) 개체들이 다른 고대 동아시아인들과 초과 혈통을 공유하는지 평가하는 f4 분석에서, 우리는 7700 BP의 소형산(小荊山) 개체들이 이들 북부 동아시아인(aAR/FE)과 추가적인 대립유전자를 공유한다는 것을 관찰했다. 즉, 대부분의 f4(편편(扁扁)/박산(博山)/소고(小高)/SD9K/aYR/aLR/aSC, 소형산(小荊山); aAR/FE, 음부티(Mbuti)) < 0 (-16.1\ 보충 표 S4a)이었고, 남부 동아시아인(aSC)과도 추가 대립유전자를 공유했다. 즉, 대부분의 f4(편편(扁扁)/박산(博山)/소고(小高)/SD9K/aYR/aLR, 소형산(小荊山); aSC, 음부티(Mbuti)) < 0 (-7.9<Z<1.6, 보충 표 S4b)이었으며, 이는 약 9000년 전의 더 오래된 산동(山東) 개체들 및 다른 북부 동아시아인들(고대 산동 인구와 일부 유전적 유사성을 공유하는 AR9.2K_o 제외¹²)과 비교했을 때 그렇다. 회전식 qpAdm 전략을 사용하여 소형산(小荊山)과 이들 북부 동아시아인 간의 연관성을 더 분석한 결과, 우리는 소형산(小荊山)이 편편(扁扁), 소고(小高), 박산(博山)과 관련된 신석기 초기 산동(山東) 혈통(SD9K) 74.2%, 복건(福建)의 신석기 초기 인구와 관련된 혈통(Fujian_EN) 9.8%, 그리고 14,000년보다 젊은 아무르강(Amur River) 인구와 관련된 혈통(ARpost14K) 16.0%의 3방향 모델로만 모델링될 수 있다는 것을 발견했다(보충 표 S5). 이는 소형산(小荊山)이 산동(山東) 지역 외부의 북부 및 남부 동아시아 혈통으로부터 추가적인 유전적 영향을 받았음을 확인시켜 준다. 이는 신석기 초기만큼 이른 시기에도 이미 동아시아 본토의 다른 지역 출신 북부 및 남부 동아시아 인구와 약간의 상호작용이 있었음을 시사한다. 

Fig. 2 Genetic relationships of ShanDong popualtions to other ancient East Asians. A Pairwise outgroup f3-statistics for ancient East Asians. A lighter color (yellow) indicates that more alleles are shared between the two populations, which is calculated as f3 (X, Y; Outgroup), where X and Y denote ancient East Asian populations, and the outgroup is chosen to be Mbuti, a present-day population from central Africa. B A maximum likelihood phylogeny allowing three migration events using the Treemix software. The branches of the tree convey the proximity of ancient East Asians to each other and arrows indicate putative gene flow events. Red numbers indicate the confidence rate for each branch, calculated from 1000 bootstrap trees. We computed the maximum likelihood phylogeny allowing for 0-6 mixing events, see Supplementary Fig. S5. C ADMIXTURE analysis showing stratified components of ancient East Asians for K=5. 

그림 2 | 산동(山東) 인구와 다른 고대 동아시아인 간의 유전적 관계. A 고대 동아시아인에 대한 쌍별 외부군 f3-통계량. 더 밝은 색(노란색)은 두 인구 간에 더 많은 대립유전자가 공유됨을 나타내며, 이는 f3(X, Y; 외부군)으로 계산된다. 여기서 X와 Y는 고대 동아시아 인구를, 외부군은 중앙아프리카의 현대 인구인 음부티(Mbuti)를 선택했다. B 트리믹스(Treemix) 소프트웨어를 사용하여 세 번의 이주 사건을 허용하는 최대우도 계통도. 트리의 가지는 고대 동아시아인들 간의 근접성을 전달하고 화살표는 추정되는 유전자 흐름 사건을 나타낸다. 빨간색 숫자는 1000개의 부트스트랩 트리에서 계산된 각 가지의 신뢰도를 나타낸다. 우리는 0-6개의 혼합 사건을 허용하는 최대우도 계통도를 계산했다(보충 그림 S5 참조). C K=5에 대한 고대 동아시아인의 층화된 구성 요소를 보여주는 애드믹스처(ADMIXTURE) 분석.

 

Two pulses of gene flow from inland to coastal populations in northern East Asia

북부 동아시아에서 내륙에서 해안 인구로의 두 차례 유전자 흐름

We next investigated genetic relationships during the Middle and Late Neolithic between coastal ShanDong populations (6000-4600 BP) associated with the DaWenKou culture and inland Yellow River populations (7000-5000 BP) associated with the YangShao culture. In the PCA (Fig. 1C, D), we observed that the three DaWenKou ShanDong populations, from the more inland GangShang site (GSGroup) to the more coastal BeiQian (BQGroup) and Fujia (FJGroup) sites, are shifted away from the Early Neolithic ShanDong populations (ShanDong EN), and toward YangShao-related Yellow River (YR) populations. It can be observed that the three populations from the DaWenkou period dis­tributed along this axis (from ShanDong EN to YR) show different affinities to YR populations. Specifically, the relatively inland GSGroup clusters with YR populations, whereas the coastal BQGroup and FJGroup fall between the YR and Early Neolithic ShanDong populations (Fig. 1C, D). To further determine whether DaWenkou populations show additional YR ancestry relative to Early Neolithic ShanDong popula­tions, we employed a rotational qpAdm strategy to estimate ancestral components found in the DaWenkou populations. A total of 11 representative East Asian populations (e.g. ARpost14K, aFujian_EN) were rotated as potential source ancestries for the three DaWenkou groups (Supplementary Table SS). Using this strategy, only those populations that fit the mixture model are considered as ancestral source populations (i.e. Tail_prob >0.05, each ancestral mixture pro­portion >standard error, pnest <0.05, Supplementary Table S5). With the rotational qpAdm strategy, we found that the DaWenkou popu­lations (BQGroup and GSGroup) can be modeled as a mixture of ancestry related to Early Neolithic ShanDong populations (ShanDon­g.EN, -29-87%) and YR populations (YR, -13-71%), while FJGroup are best described by a single source ancestry related to ShanDong EN (“1-way” model, Tail_prob =0.08 or the BQGroup (Tail_prob =0.47 Fig. 3A, Supplementary Table S5). Consistent with previous observation that the three sampled DaWenkou populations show different affinities to the YR populations, the mixture proportion calculated by qpAdm for YR ancestry in 6000-4600 BP ShanDong populations varies, with the GSGroup showing the highest levels of YR ancestry (-50-71%, Fig. 3A, Supple­mentary Table S5), followed by the BQGroup (-13%, Fig. 3A, Supple­mentary Table S5) and the FJGroup (-0-13%, Fig. 3A, Supplementary Table S5). In an ADMIXTURE analysis, the GSGroup shows a higher proportion of a YR-related component (orange) compared to other DaWenkou populations (Fig. 2C). Based on our finding of greater YR-related ancestry in the inland GSGroup relative to the coastal BQGroup and FJGroup, we suspect that YR-related ancestry had decreasing impact with proximity to the coast. With only three DWK sites repre­sented, however, finer sampling of DWK sites in Shandong is needed to confirm this hypothesis. Collectively, these patterns suggest that ancestry related to YR populations impacted populations in the ShanDong region during the DaWenKou cultural period (Fig. 3B).

우리는 다음으로 신석기 중기와 후기 동안 대문구문화(大汶口文化)와 관련된 해안 산동(山東) 인구(6000-4600 BP)와 앙소문화(仰韶文化)와 관련된 내륙 황하(黃河) 인구(7000-5000 BP) 사이의 유전적 관계를 조사했다. PCA(그림 1C, D)에서, 우리는 더 내륙인 강상(崗上) 유적지(GSGroup)에서부터 더 해안인 북천(北阡)(BQGroup) 및 부가(傅家)(FJGroup) 유적지에 이르는 세 대문구(大汶口) 산동(山東) 인구가 신석기 초기 산동(山東) 인구(ShanDong EN)로부터 멀어지고 앙소(仰韶) 관련 황하(黃河) (YR) 인구 쪽으로 이동하는 것을 관찰했다. 대문구(大汶口) 시기의 세 인구가 이 축(ShanDong EN에서 YR까지)을 따라 분포하며 YR 인구에 대해 서로 다른 친화도를 보임을 관찰할 수 있다. 구체적으로, 상대적으로 내륙인 GSGroup은 YR 인구와 군집을 이루는 반면, 해안의 BQGroup과 FJGroup은 YR과 신석기 초기 산동(山東) 인구 사이에 위치한다(그림 1C, D). 대문구(大汶口) 인구가 신석기 초기 산동(山東) 인구에 비해 추가적인 YR 혈통을 보이는지 더 확인하기 위해, 우리는 회전식 qpAdm 전략을 사용하여 대문구(大汶口) 인구에서 발견되는 조상 구성 요소를 추정했다. 총 11개의 대표적인 동아시아 인구(예: ARpost14K, aFujian_EN)가 세 대문구(大汶口) 그룹의 잠재적 출처 혈통으로 회전되었다(보충 표 S5). 이 전략을 사용하면, 혼합 모델에 맞는 인구만이 조상 출처 인구로 간주된다(즉, Tail_prob > 0.05, 각 조상 혼합 비율 > 표준 오차, pnest < 0.05, 보충 표 S5). 회전식 qpAdm 전략으로, 우리는 대문구(大汶口) 인구(BQGroup 및 GSGroup)가 신석기 초기 산동(山東) 인구(ShanDong.EN, ~29-87%)와 YR 인구(YR, ~13-71%) 관련 혈통의 혼합으로 모델링될 수 있는 반면, FJGroup은 ShanDong EN(“1-way” 모델, Tail_prob = 0.08) 또는 BQGroup(Tail_prob = 0.47) 관련 단일 출처 혈통으로 가장 잘 설명된다는 것을 발견했다(그림 3A, 보충 표 S5). 세 개의 샘플링된 대문구(大汶口) 인구가 YR 인구에 대해 서로 다른 친화도를 보인다는 이전 관찰과 일관되게, 6000-4600 BP 산동(山東) 인구에서 qpAdm으로 계산된 YR 혈통의 혼합 비율은 다양하며, GSGroup이 가장 높은 수준의 YR 혈통(~50-71%, 그림 3A, 보충 표 S5)을 보이고, 그 다음으로 BQGroup(~13%, 그림 3A, 보충 표 S5), FJGroup(~0-13%, 그림 3A, 보충 표 S5) 순이다. 애드믹스처(ADMIXTURE) 분석에서 GSGroup은 다른 대문구(大汶口) 인구에 비해 YR 관련 구성 요소(주황색)의 비율이 더 높게 나타난다(그림 2C). 내륙의 GSGroup에서 해안의 BQGroup 및 FJGroup에 비해 더 큰 YR 관련 혈통을 발견한 것에 근거하여, 우리는 YR 관련 혈통이 해안에 가까워질수록 영향력이 감소했을 것으로 추정한다. 그러나 세 개의 대문구(大汶口) 유적지만 대표되었으므로, 이 가설을 확인하기 위해서는 산동(山東)의 대문구(大汶口) 유적지에 대한 더 정밀한 샘플링이 필요하다. 종합적으로, 이러한 패턴들은 YR 인구와 관련된 혈통이 대문구문화(大汶口文化) 시기 동안 산동(山東) 지역의 인구에 영향을 미쳤음을 시사한다(그림 3B). 

Between 4600-4000 BP, the archaeological record shows high cultural assimilation in YR and ShanDong populations, resulting in a shared culture across these inland and coastal regions denoted the LongShan culture . To explore population dynamics during this cul­tural transition, we investigated shifts in genetic ancestry of the coastal ShanDong population during this time period, particularly in popula­tions from the YinjiaCheng (YJCGroup) and ChengZiYa (CZYGroup) sites. We first found that the genetic influence of YR populations persisted in ShanDong populations of the Late Neolithic who are associated with the LongShan cultural period (YJCGroup and CZYGroup). In a PCA, similar to the DaWenkou GSGroup, both Yin­JiaCheng and ChengZiYa individuals clustered with Yellow River indi­viduals (Fig. 1C, D). In an ADMIXTURE analysis, individuals from the YJCGroup and CZYGroup show a component related to inland YR populations, and the proportion of a YR-related component in these two groups is within a range that overlaps with the proportion observed in the three DaWenKou populations (GSGroup, BQGroup, and FJGroup, Fig. 2C). We then explored whether this YR-related component was introduced from additional admixture from YR populations using an f4-analysis. We found that f4 (ShanDong DWK, ShanDong LS; YR, Mbuti)-0 (-2.3<Z<3.3, with only one “Z-value” >3 when the ShanDong DWK was GSGroup, Supplementary Table S6), which suggests that LongShan populations did not share more genetic connections with YR populations than DaWenkou populations. Using a rotational qpAdm analysis (Fig. 3A, Supplementary Table S5), we found that both LongShan populations can only be modeled as a mixture of ancestry related to the GSGroup (50-71% YR) – the DaWenkou population with elevated YR ancestry – and another DaWenkou population (BQGroup) or an Early Neolithic ShanDong population (21-32%, Fig. 3A, Supplementary Table S5). Interestingly, our result suggests different patterns of admixture in LongShan and DaWenkou populations. The LongShan populations cannot be mod­eled using a mixture of “ShanDong-related ancestors” and a “YR population”, but only as a mixture of two ShanDong populations. This suggests that rather than continued admixture from YR-related populations, there was genetic continuity between the LongShan and older ShanDong populations. Overall, our results support LongShan populations as a mixture of ancestry related to the older DaWenkou populations from both the more coastal and inland regions of Shan­Dong, with no additional influence from YR-related populations. 

4600-4000 BP 사이에, 고고학 기록은 YR과 산동(山東) 인구에서 높은 문화적 동화를 보여주며, 이는 이들 내륙과 해안 지역에 걸쳐 용산문화(龍山文化)로 명명된 공유 문화를 낳았다. 이 문화적 전환기 동안의 인구 동역학을 탐구하기 위해, 우리는 이 시기 해안 산동(山東) 인구의 유전적 혈통 변화를 조사했으며, 특히 윤가성(尹家城)(YJCGroup)과 성자애(城子崖)(CZYGroup) 유적지 인구에 초점을 맞췄다. 우리는 먼저 YR 인구의 유전적 영향이 용산문화(龍山文化) 시기(YJCGroup 및 CZYGroup)와 관련된 신석기 후기 산동(山東) 인구에 지속되었음을 발견했다. PCA에서, 대문구(大汶口) GSGroup과 유사하게, 윤가성(尹家城)과 성자애(城子崖) 개체들 모두 황하(黃河) 개체들과 군집을 이루었다(그림 1C, D). 애드믹스처(ADMIXTURE) 분석에서, YJCGroup과 CZYGroup의 개체들은 내륙 YR 인구와 관련된 구성 요소를 보이며, 이 두 그룹에서 YR 관련 구성 요소의 비율은 세 대문구(大汶口) 인구(GSGroup, BQGroup, FJGroup)에서 관찰된 비율과 겹치는 범위 내에 있다(그림 2C). 그런 다음 f4-분석을 사용하여 이 YR 관련 구성 요소가 YR 인구로부터의 추가적인 혼합으로 도입되었는지 탐색했다. 우리는 f4(ShanDong DWK, ShanDong LS; YR, 음부티(Mbuti))~0 (-2.3<Z<3.3, ShanDong DWK가 GSGroup일 때 단 하나의 “Z-값” > 3, 보충 표 S6)임을 발견했으며, 이는 룡산(龍山) 인구가 대문구(大汶口) 인구보다 YR 인구와 더 많은 유전적 연결을 공유하지 않았음을 시사한다. 회전식 qpAdm 분석(그림 3A, 보충 표 S5)을 사용하여, 우리는 두 룡산(龍山) 인구 모두 상승된 YR 혈통을 가진 대문구(大汶口) 인구인 GSGroup(50-71% YR) 관련 혈통과 다른 대문구(大汶口) 인구(BQGroup) 또는 신석기 초기 산동(山東) 인구(21-32%) 관련 혈통의 혼합으로만 모델링될 수 있음을 발견했다(그림 3A, 보충 표 S5). 흥미롭게도, 우리의 결과는 룡산(龍山)과 대문구(大汶口) 인구에서 서로 다른 혼합 패턴을 시사한다. 룡산(龍山) 인구는 “산동(山東) 관련 조상”과 “YR 인구”의 혼합으로 모델링될 수 없고, 오직 두 산동(山東) 인구의 혼합으로만 모델링된다. 이는 YR 관련 인구로부터의 지속적인 혼합보다는 룡산(龍山)과 더 오래된 산동(山東) 인구 사이에 유전적 연속성이 있었음을 시사한다. 전반적으로, 우리의 결과는 룡산(龍山) 인구가 YR 관련 인구로부터의 추가적인 영향 없이, 산동(山東)의 더 해안 및 내륙 지역 출신의 더 오래된 대문구(大汶口) 인구 관련 혈통의 혼합임을 뒷받침한다. 

Fig. 3 | Gene flow related to the ShanDong populations. A qpAdm analysis showing the proportions of each ancestral source component calculated for ancient ShanDong populations from the DaWenKou (DWK, BQ=BQGroup. GS=GSGroup, FJ FJGroup), LongShan (LS, CZY CZYGroup, YJC YJCGroup), and Chinese dynastic (CD, HL HLGroup, LJZ=LJZGroup, XC XCGroup, TL TLGroup, XZ=XZGroup. YX YXGroup) cultural periods. The measure of centers (junction of two rectangles) are the average values, and the error bars represent 1x standard error. When calculating ancestry components, we used a rotational strategy informed by chronological data from the ancient East Asian populations, where younger groups could not be used as potential sources for modeling older groups. Colors represent different ancestral sources (ShanDong EN (SD9K/Xiaojingshan), BQGroup, GSGroup, CZYGroup, and YR (YR_MN/YR_LN)). Numbers indicate the larger ancestry proportion in a two-source qpAdm analysis. Exact values of the qpAdm analysis are shown in Supplementary Table S5a. B Figure depiction sum­marizing major findings of gene flow associated with the ShanDong region from this study. Blue and red arrows indicate gene flow into ShanDong populations as early as 7700 BP from northern East Asia (NEA) and southern East Asia (SEA). Orange and yellow arrows indicate gene flow from the Yellow River region into ShanDong populations, which occurred at least twice during the DaWenkou (6000-4600 BP) and early Chinese dynastic (younger than 3500 BP) cultural periods. No evidence for gene flow back into Yellow River populations was observed. The green arrow (dashed line) indicates gene flow from the ShanDong region into the Nagabaka population in the Ryukyu Islands at least after 2800 years ago. 

그림 3 | 산동(山東) 인구와 관련된 유전자 흐름. A 대문구(大汶口)(DWK, BQ=BQGroup, GS=GSGroup, FJ=FJGroup), 룡산(龍山)(LS, CZY=CZYGroup, YJC=YJCGroup), 그리고 중국 왕조(CD, HL=HLGroup, LJZ=LJZGroup, XC=XCGroup, TL=TLGroup, XZ=XZGroup, YX=YXGroup) 문화 시기의 고대 산동(山東) 인구에 대해 계산된 각 조상 출처 구성 요소의 비율을 보여주는 qpAdm 분석. 중앙값(두 사각형의 접합부)은 평균값이며, 오차 막대는 1x 표준 오차를 나타낸다. 혈통 구성 요소를 계산할 때, 우리는 고대 동아시아 인구의 연대기 데이터를 기반으로 한 회전 전략을 사용했으며, 더 젊은 그룹은 더 오래된 그룹을 모델링하기 위한 잠재적 출처로 사용될 수 없었다. 색상은 다른 조상 출처(산동(山東) EN (SD9K/소형산(小荊山)), BQGroup, GSGroup, CZYGroup, 및 YR (YR_MN/YR_LN))를 나타낸다. 숫자는 2-출처 qpAdm 분석에서 더 큰 혈통 비율을 나타낸다. qpAdm 분석의 정확한 값은 보충 표 S5a에 나와 있다. B 본 연구에서 산동(山東) 지역과 관련된 유전자 흐름의 주요 발견을 요약한 그림. 파란색과 빨간색 화살표는 빠르면 7700 BP부터 북동아시아(NEA)와 남동아시아(SEA)에서 산동(山東) 인구로의 유전자 흐름을 나타낸다. 주황색과 노란색 화살표는 황하(黃河) 지역에서 산동(山東) 인구로의 유전자 흐름을 나타내며, 이는 대문구(大汶口)(6000-4600 BP) 및 초기 중국 왕조(3500 BP 이후) 문화 시기 동안 적어도 두 번 발생했다. 황하(黃河) 인구로의 역유전자 흐름에 대한 증거는 관찰되지 않았다. 녹색 화살표(점선)는 적어도 2800년 전 이후에 산동(山東) 지역에서 류큐 제도(琉球諸島)의 나가바카(長墓) 인구로의 유전자 흐름을 나타낸다. 

We next examined genetic changes in the ShanDong region dur­ing the early dynastic period of China, starting around 3500 BP with the establishment of the Shang Dynasty. Using a rotational qpAdm strategy (Fig. 3A, Supplementary Table S5) for early dynastic Shan­Dong populations, we found that they can be modeled by three dif­ferent admixture patterns: (1) The HouLi (HLGroup), LiuJiaZhuang (LJZGroup), and XiChen (XCGroup) populations can be modeled as a single ancestry related to the LongShan “CZYGroup”, with no addi­tional connections to YR-related ancestry beyond that observed in LongShan populations. (2) The TongLin (TLGroup) and XinZhi (XZGroup) populations can only be modeled by a single source ancestry related to the “GSGroup”, the DaWenKou population who showed an elevated YR-related ancestry (50-71%). This suggests that the two populations may share more YR-related ancestry, more similar to DaWenkou populations than LongShan populations. However, it is important to note that, apart from the level of YR-related ancestry, the ancient ShanDong populations are overall highly similar to each other. Two possible scenarios could have given rise to the observed qpAdm model for the TLGroup and XZGroup: (a) genetic continuity between the GSGroup and these two early dynastic groups, or (b) additional YR-related admixture leading to genetic similarity between the GSGroup and these two groups. The major difference between these two sce­narios is the timing of when the YR-related ancestry was introduced into the population. (3) Lastly, we found that the YiXi population (YXGroup) is best modeled as a mixture of YR-related ancestry (-75-92%) and ancestry related to another ShanDong population (e.g., -25% CZYGroup, or -9% SD9K, Supplementary Table S5). 

우리는 다음으로 상(商) 왕조의 성립과 함께 약 3500 BP에 시작된 중국 초기 왕조 시대 동안 산동(山東) 지역의 유전적 변화를 조사했다. 초기 왕조 시대 산동(山東) 인구에 대해 회전식 qpAdm 전략(그림 3A, 보충 표 S5)을 사용하여, 우리는 그들이 세 가지 다른 혼합 패턴으로 모델링될 수 있음을 발견했다: (1) 후리(後李)(HLGroup), 류가장(劉家莊)(LJZGroup), 서진(西陳)(XCGroup) 인구는 룡산(龍山) “CZYGroup”과 관련된 단일 혈통으로 모델링될 수 있으며, 룡산(龍山) 인구에서 관찰된 것 이상의 추가적인 YR 관련 혈통 연결은 없다. (2) 동림(銅林)(TLGroup)과 신치(辛置)(XZGroup) 인구는 상승된 YR 관련 혈통(50-71%)을 보였던 대문구(大汶口) 인구인 “GSGroup”과 관련된 단일 출처 혈통으로만 모델링될 수 있다. 이는 이 두 인구가 룡산(龍山) 인구보다 대문구(大汶口) 인구와 더 유사하게, 더 많은 YR 관련 혈통을 공유할 수 있음을 시사한다. 그러나 YR 관련 혈통 수준을 제외하고는 고대 산동(山東) 인구들이 전반적으로 서로 매우 유사하다는 점에 유의하는 것이 중요하다. TLGroup과 XZGroup에 대해 관찰된 qpAdm 모델을 야기했을 수 있는 두 가지 가능한 시나리오가 있다: (a) GSGroup과 이 두 초기 왕조 그룹 간의 유전적 연속성, 또는 (b) GSGroup과 이 두 그룹 간의 유전적 유사성을 초래한 추가적인 YR 관련 혼합. 이 두 시나리오의 주요 차이점은 YR 관련 혈통이 인구에 도입된 시점이다. (3) 마지막으로, 우리는 기서(沂西) 인구(YXGroup)가 YR 관련 혈통(~75-92%)과 다른 산동(山東) 인구 관련 혈통(예: ~25% CZYGroup, 또는 ~9% SD9K, 보충 표 S5)의 혼합으로 가장 잘 모델링된다는 것을 발견했다. 

To explore what happened to these three early dynastic ShanDong populations (XZGroup, YXGroup and TLGroup), we estimated the timing of admixture using DATES, and found that these three populations could be modeled as a mixture of ancestry related to ShanDong populations older than 3500 BP and ancestry related to YR populations (YR_MN/YR_LN), with an estimated date of admixture around 4.6-18.9 generations prior to the dynastic period, or -2880-2030 BP (Supplementary Table S7). This finding suggests a second wave of admixture, where these three populations may have been genetically influenced by a second YR-related population after the LongShan cultural period, unique from the admixture event associated with the DaWenKou populations (at least 6000-4600 BP). In an ADMIXTURE analysis, we observed that indivi­duals from the TLGroup, XZGroup, and YXGroup show a higher pro­portion of a component found in Yellow River populations (orange) compared with other ShanDong populations (Fig. 2C). Unlike the previous wave during the DaWenKou cultural period that affected all sampled ShanDong populations, the second wave may have only influenced a subset of the early dynastic ShanDong populations. 

이 세 초기 왕조 산동(山東) 인구(XZGroup, YXGroup, TLGroup)에 무슨 일이 일어났는지 탐구하기 위해, 우리는 데이츠(DATES)를 사용하여 혼합 시기를 추정했고, 이 세 인구가 3500 BP보다 오래된 산동(山東) 인구 관련 혈통과 YR 인구(YR_MN/YR_LN) 관련 혈통의 혼합으로 모델링될 수 있으며, 추정된 혼합 시점은 왕조 시대 이전 약 4.6-18.9세대, 즉 약 2880-2030 BP라는 것을 발견했다(보충 표 S7). 이 발견은 두 번째 혼합 물결을 시사하며, 여기서 이 세 인구는 용산문화(龍山文化) 시기 이후에 두 번째 YR 관련 인구에 의해 유전적으로 영향을 받았을 수 있으며, 이는 대문구(大汶口) 인구와 관련된 혼합 사건(최소 6000-4600 BP)과는 별개이다. 애드믹스처(ADMIXTURE) 분석에서, 우리는 TLGroup, XZGroup, YXGroup의 개체들이 다른 산동(山東) 인구에 비해 황하(黃河) 인구에서 발견되는 구성 요소(주황색)의 비율이 더 높다는 것을 관찰했다(그림 2C). 모든 샘플링된 산동(山東) 인구에 영향을 미쳤던 대문구문화(大汶口文化) 시기의 이전 물결과는 달리, 두 번째 물결은 초기 왕조 산동(山東) 인구의 일부에만 영향을 미쳤을 수 있다. 

As population interactions can be bidirectional, we also tested whether Yellow River populations were influenced by ShanDong populations. Using an f4-analysis, we found that ancient Yellow River populations are similarly related to ShanDong populations, i.e. f4 (aYR, aYR; 6000-1500 BP ShanDong, Mbuti)-0 (−3.0Z3.0, Supplementary Table S8), suggesting that Yellow River populations were not differentially influenced by ancestry related to ShanDong populations (Fig. 3B). 

인구 상호작용은 양방향일 수 있으므로, 우리는 황하(黃河) 인구가 산동(山東) 인구에 의해 영향을 받았는지도 테스트했다. f4-분석을 사용하여, 우리는 고대 황하(黃河) 인구가 산동(山東) 인구와 유사하게 관련되어 있음을 발견했다. 즉, f4(aYR, aYR; 6000-1500 BP 산동(山東), 음부티(Mbuti))~0 (−3.0Z3.0, 보충 표 S8)이며, 이는 황하(黃河) 인구가 산동(山東) 인구 관련 혈통에 의해 차별적으로 영향을 받지 않았음을 시사한다(그림 3B). 

 

Introduction of ancestry related to ShanDong coastal East Asians in Ryukyu Islanders at least after 2800 BP

적어도 2800 BP 이후 류큐(琉球) 제도민에게 산동(山東) 해안 동아시아인 관련 혈통 도입

To examine the relationship of ShanDong populations to those who lived in the Japanese archipelago, we next compared our newly sampled individuals to previously published ancient Japanese popu­lations. In the PCA, ancient Japanese populations form two main clusters, where younger populations dating to the post-Yayoi period are intermediate between the BQGroup, GSGroup, and FJGroup ShanDong populations from the DaWenkou cultural period, and older Jomon hunter-gatherer populations (Fig. 1C, Supplementary Fig. S2A, B). In an ADMIXTURE analysis, younger Japanese populations, especially the Yayoi, Kofun, and historical Nagabaka populations, possess genetic components that are widely distributed among ShanDong populations younger than 6000 BP, confirming a strong connection between ShanDong populations associated with the DaWenKou cultural period and more recent populations from Japan (Fig. 2C). This connection was further confirmed by f4 statistics, where most f4(>3000 BP aJapanese, <3000 BP aJapanese; 6000-1500 BP ShanDong populations, Mbuti) <0 (-21.7<Z<3.1, Supplementary Table S9), showing more shared alleles between the <3000 BP post Yayoi Japanese populations and 6000-1500 BP ShanDong populations compared with the older Jomon hunter-gatherers (Supplementary Table S9).

산동(山東) 인구와 일본 열도에 거주했던 인구와의 관계를 조사하기 위해, 우리는 새로 샘플링한 개체들을 이전에 발표된 고대 일본 인구와 비교했다. PCA에서, 고대 일본 인구는 두 개의 주요 군집을 형성하며, 야요이(弥生) 이후 시기에 해당하는 더 젊은 인구는 대문구문화(大汶口文化) 시기의 BQGroup, GSGroup, FJGroup 산동(山東) 인구와 더 오래된 조몬(縄文) 수렵채집인 인구의 중간에 위치한다(그림 1C, 보충 그림 S2A, B). 애드믹스처(ADMIXTURE) 분석에서, 더 젊은 일본 인구, 특히 야요이(弥生), 고훈(古墳), 그리고 역사시대 나가바카(長墓) 인구는 6000 BP보다 젊은 산동(山東) 인구 사이에 널리 분포하는 유전적 구성 요소를 가지고 있어, 대문구문화(大汶口文化) 시기와 관련된 산동(山東) 인구와 더 최근의 일본 인구 사이에 강한 연관성이 있음을 확인시켜 준다(그림 2C). 이 연관성은 f4 통계량에 의해 더욱 확인되었는데, 대부분의 f4(>3000 BP 고대일본인, <3000 BP 고대일본인; 6000-1500 BP 산동(山東) 인구, 음부티(Mbuti)) < 0 (-21.7<Z<3.1, 보충 표 S9)으로, 3000 BP 이후의 야요이(弥生) 시대 이후 일본 인구와 6000-1500 BP 산동(山東) 인구 사이에 더 오래된 조몬(縄文) 수렵채집인과 비교하여 더 많은 공유 대립유전자를 보여주었다(보충 표 S9). 

To determine whether this connection is specific to 6000-1500 BP ShanDong populations instead of other northern East Asians, we next tested whether the ShanDong populations could be described as a necessary ancestral source population for different recent Japanese populations (Nagabaka_2800BP, Kofun, Nagabaka_historic) in a rota­tional qpAdm analysis. We found three major patterns: (1) We found that the Nagabaka population dating to 2800 BP can be modeled as solely ancestry related to the Jomon (Supplementary Table S5). (2) Then, we found that the historical Nagabaka population could only be modeled as a mixture of two ancestries, related to the -4600 to 3500 BP CZYGroup and YJCGroup (75.0-75.2%) from the LongShan cultural period in ShanDong and -3900 to 3700 BP individuals from the Late Jõōmon (24.8-25.0%, Supplementary Table S5). We also found that the YR_LN, the LongShan ShanDong (YJCGroup/CZYGroup), and the Jomon populations were included in the best three-ancestry model (but when comparing with the two-ancestry model, pnest =0.04, Supplementary Table S5). The three-ancestry and two-ancestry models do not contradict each other, because these ShanDong populations (CZYGroup and YJCGroup) already carry northern inland East Asian (YR-related) and coastal East Asian components, where the coastal East Asian component is specific to ShanDong populations and was not identified in previously sampled ancient East Asian populations. Pre­vious analysis of the historical Nagabaka population showed that they were best described by a three-ancestry model composed of Jomon ancestry, northern East Asian ancestry, and an ambiguous ancestry related to present-day Han populations. Here we found that a coastal East Asian ancestry related to the ShanDong population better repre­sents the ancestry represented previously by the Han, where the his­torical Nagabaka population is best described by a three-ancestry model as a mixture of Jomon ancestry, northern inland East Asian ancestry related to YR populations, and additional northern coastal East Asian ancestry related to ShanDong populations. (3) The genetic influence of ancient ShanDong populations is limited to the Ryukyu islands and is not observed in the Kofun population in Hondo. That is, in a qpAdm analysis, the Kofun could not be modeled as car­rying any ShanDong-related ancestry, and a working three-ancestry model shows Jōmon ancestry, northern inland East Asian related to YR populations, and an ambiguous northern East Asian-related ancestry (Supplementary Table S5). 

이 연관성이 다른 북부 동아시아인 대신 6000-1500 BP 산동(山東) 인구에 특이적인지를 결정하기 위해, 우리는 다음으로 회전식 qpAdm 분석에서 산동(山東) 인구가 다른 최근 일본 인구(나가바카_2800BP(Nagabaka_2800BP), 고훈(Kofun), 역사시대 나가바카(Nagabaka_historic))에 대한 필수적인 조상 출처 인구로 기술될 수 있는지 테스트했다. 우리는 세 가지 주요 패턴을 발견했다: (1) 2800 BP에 해당하는 나가바카(長墓) 인구는 오직 조몬(縄文)과 관련된 혈통으로만 모델링될 수 있음을 발견했다(보충 표 S5). (2) 그 다음, 역사시대 나가바카(長墓) 인구는 산동(山東)의 용산문화(龍山文化) 시기(약 4600-3500 BP)의 CZYGroup과 YJCGroup(75.0-75.2%) 및 후기 조몬(縄文) 시기(약 3900-3700 BP) 개체들(24.8-25.0%)과 관련된 두 가지 혈통의 혼합으로만 모델링될 수 있음을 발견했다(보충 표 S5). 우리는 또한 YR_LN, 룡산(龍山) 산동(山東)(YJCGroup/CZYGroup), 그리고 조몬(縄文) 인구가 최적의 3중-혈통 모델에 포함되었음을 발견했다(그러나 2중-혈통 모델과 비교할 때 pnest = 0.04, 보충 표 S5). 이 산동(山東) 인구(CZYGroup 및 YJCGroup)는 이미 북부 내륙 동아시아(YR 관련) 및 해안 동아시아 구성 요소를 가지고 있기 때문에 3중-혈통 모델과 2중-혈통 모델은 서로 모순되지 않는다. 여기서 해안 동아시아 구성 요소는 산동(山東) 인구에 특이적이며 이전에 샘플링된 고대 동아시아 인구에서는 확인되지 않았다. 역사시대 나가바카(長墓) 인구에 대한 이전 분석은 그들이 조몬(縄文) 혈통, 북부 동아시아 혈통, 그리고 현대 한족(漢族)과 관련된 모호한 혈통으로 구성된 3중-혈통 모델로 가장 잘 설명된다고 보여주었다. 여기서 우리는 산동(山東) 인구와 관련된 해안 동아시아 혈통이 이전에 한족(漢族)으로 대표되었던 혈통을 더 잘 나타낸다는 것을 발견했으며, 역사시대 나가바카(長墓) 인구는 조몬(縄文) 혈통, YR 인구와 관련된 북부 내륙 동아시아 혈통, 그리고 산동(山東) 인구와 관련된 추가적인 북부 해안 동아시아 혈통의 혼합으로서 3중-혈통 모델로 가장 잘 설명된다. (3) 고대 산동(山東) 인구의 유전적 영향은 류큐(琉球) 제도에 국한되며 혼도(本島)의 고훈(古墳) 인구에서는 관찰되지 않는다. 즉, qpAdm 분석에서, 고훈(古墳) 인구는 어떤 산동(山東) 관련 혈통도 가진 것으로 모델링될 수 없었으며, 작동하는 3중-혈통 모델은 조몬(縄文) 혈통, YR 인구와 관련된 북부 내륙 동아시아 혈통, 그리고 모호한 북부 동아시아 관련 혈통을 보여준다(보충 표 S5). 

We also observed differences in genetic linkage between the Nagabaka and Kofun populations and ShanDong populations in an f4-test. We observed that most ShanDong populations, particularly the 6000 BP BQGroup, tends to share more alleles with the historical Nagabaka group than other northern East Asians, i.e. many f4(WLR/YR/ AR, 6000-1500 BP ShanDong populations; Nagabaka_historic, Mbuti) <0 (Z<-2.5, Fig. 4, Supplementary Table S10), while most f4 (WLR/YR, 6000-1500 BP ShanDong populations; Japan_Kofun, Mbuti) -0 (IZ <3, Fig. 4, Supplementary Table S10). 

우리는 또한 f4-테스트에서 나가바카(長墓) 및 고훈(古墳) 인구와 산동(山東) 인구 간의 유전적 연관성 차이를 관찰했다. 우리는 대부분의 산동(山東) 인구, 특히 6000 BP의 BQGroup이 다른 북부 동아시아인들보다 역사시대 나가바카(長墓) 그룹과 더 많은 대립유전자를 공유하는 경향이 있음을 관찰했다. 즉, 많은 f4(WLR/YR/AR, 6000-1500 BP 산동(山東) 인구; Nagabaka_historic, 음부티(Mbuti)) < 0 (Z < -2.5, 그림 4, 보충 표 S10)인 반면, 대부분의 f4(WLR/YR, 6000-1500 BP 산동(山東) 인구; Japan_Kofun, 음부티(Mbuti)) ~ 0 (|Z| < 3, 그림 4, 보충 표 S10)이었다. 

To further analyze the northern coastal ancestry in the historical Nagabaka population and connect it to ShanDong populations, we designed a simulation test to use with the f4-analysis . We found two major patterns: (1) First, the simulation analysis further confirms that there is an additional genetic connection between the historical Nagabaka and ShanDong populations. We tested f4 (X, Nagabaka_his­toric; SDEN/Xiaojingshan/BQGroup, Mbuti), where X was a simulated population ((1-x)% Jomon+x% LongShan ShanDong populations (YJCGroup, CZYGroup), Supplementary Fig. S8). In all two sets of simulation tests (ShanDong populations = SDEN/Xiaojingshan), when x % is within the range of the proportion of the LongShan ShanDong population (-75%) calculated using the rotational qpAdm strategy, the value of the f4-tests approximate zero (between the blue lines, Sup­plementary Fig. S8). This supports the rotational qpAdm mixture model for the historical Nagabaka population containing a northern coastal population component related to ShanDong populations. In the set of simulation tests (ShanDong population = BQGroup), when x % is within the range of -87% of the proportion of the LongShan ShanDong population calculated by qpAdm (-0.87 75%, between the yellow lines), the value of f4 is approximately zero. This is because the BQGroup population is a mixture of -87% ShanDong-related ancestry and -13% YR-related ancestry. These patterns support that there were additional genetic connections between ShanDong populations and the historical Nagabaka population beyond general northern East Asian connections. (2) In order to test for the additional contribution of a northern coastal component related to ShanDong populations in the historical Nagabaka population compared to the Kofun popula­tion, we tested f4 (X, Nagabaka_historical; Kofun, Mbuti), where X was a simulated population ((1-x)% Kofun+x% ShanDong populations, sample size = 30, Supplementary Fig. S9). In all four sets of simulation tests, f4 values gradually decreased in all four groups as the different ShanDong components in population X increased, suggesting that the historical Nagabaka population does share additional genetic con­nections with the ShanDong population compared to the Kofun population. In addition, because it was not possible to model the Nagabaka population using the Kofun population as the ancestral source in the rotational qpAdm analysis, the values of f4-tests approximately equal to 0 was not observed. 

역사시대 나가바카(長墓) 인구의 북부 해안 혈통을 더 분석하고 이를 산동(山東) 인구와 연결하기 위해, 우리는 f4-분석과 함께 사용할 시뮬레이션 테스트를 설계했다. 우리는 두 가지 주요 패턴을 발견했다: (1) 첫째, 시뮬레이션 분석은 역사시대 나가바카(長墓)와 산동(山東) 인구 사이에 추가적인 유전적 연결이 있음을 다시 한번 확인시켜 준다. 우리는 f4(X, Nagabaka_historic; SDEN/소형산(小荊山)/BQGroup, 음부티(Mbuti))를 테스트했는데, 여기서 X는 시뮬레이션된 인구((1-x)% 조몬(縄文) + x% 룡산(龍山) 산동(山東) 인구 (YJCGroup, CZYGroup), 보충 그림 S8)였다. 두 세트의 시뮬레이션 테스트(산동(山東) 인구 = SDEN/소형산(小荊山)) 모두에서, x%가 회전식 qpAdm 전략을 사용하여 계산된 룡산(龍山) 산동(山東) 인구의 비율(~75%) 범위 내에 있을 때, f4-테스트 값은 0에 근사했다(파란색 선 사이, 보충 그림 S8). 이는 역사시대 나가바카(長墓) 인구가 산동(山東) 인구와 관련된 북부 해안 인구 구성 요소를 포함한다는 회전식 qpAdm 혼합 모델을 지지한다. 시뮬레이션 테스트 세트(산동(山東) 인구 = BQGroup)에서, x%가 qpAdm으로 계산된 룡산(龍山) 산동(山東) 인구 비율의 ~87% 범위 내에 있을 때(~0.8775%, 노란색 선 사이), f4 값은 약 0이다. 이는 BQGroup 인구가 ~87%의 산동(山東) 관련 혈통과 ~13%의 YR 관련 혈통의 혼합이기 때문이다. 이러한 패턴들은 일반적인 북부 동아시아 연결을 넘어 산동(山東) 인구와 역사시대 나가바카(長墓) 인구 사이에 추가적인 유전적 연결이 있었음을 뒷받침한다. (2) 역사시대 나가바카(長墓) 인구에서 고훈(古墳) 인구와 비교하여 산동(山東) 인구와 관련된 북부 해안 구성 요소의 추가적인 기여를 테스트하기 위해, 우리는 f4(X, Nagabaka_historical; Kofun, 음부티(Mbuti))를 테스트했는데, 여기서 X는 시뮬레이션된 인구((1-x)% 고훈(古墳) + x% 산동(山東) 인구, 표본 크기 = 30, 보충 그림 S9)였다. 네 세트의 시뮬레이션 테스트 모두에서, 인구 X의 다른 산동(山東) 구성 요소가 증가함에 따라 네 그룹 모두에서 f4 값이 점차 감소했으며, 이는 역사시대 나가바카(長墓) 인구가 고훈(古墳) 인구에 비해 산동(山東) 인구와 추가적인 유전적 연결을 공유함을 시사한다. 또한, 회전식 qpAdm 분석에서 고훈(古墳) 인구를 조상 출처로 사용하여 나가바카(長墓) 인구를 모델링하는 것이 불가능했기 때문에, f4-테스트 값이 약 0과 같은 경우는 관찰되지 않았다. 

Here, since there is no component related to ShanDong popula­tions in the Nagabaka population of 2800 BP (in both ADMIXTURE and f4 results, Fig. 2C and Fig. 4), we have inferred that admixture related to northern coastal ancestry into the Nagabaka population from the Ryu­kyu Islands happened at least after 2800 BP. We next estimated the time of admixture integrating ShanDong ancestry into the historical Naga­baka population using DATES. A consistent admixture time of -102-43 generations ago is obtained using the ShanDong populations (CZYGroup, LJZGroup, XCGroup, HLGroup) to represent northern coastal populations and the West Liao River populations (WLR_LN, WLR BA) to represent northern inland populations as mainland East Asian sources, and the Jomon as another source (Supplementary Table S7). The most likely timing of the admixture is estimated to be 1600-1400 BP assuming one generation is 28 years (LJZGroup is the best fit for the ancestral source, with the smallest nrmsd = 0.180, mean = 43.3, Supplementary Table S7). This can potentially be linked to population interactions between the Sui Dynasty (around 1400 BP) and the Ryukyu Islands populations that are known to have occurred according to historical documents (e.g. “Sui Shu”, “Chuzan-sefu” and “Chuzan-sekan”)”; the specific historical events associated needs further support from archaeological study. 

여기서, 2800 BP의 나가바카(長墓) 인구에는 산동(山東) 인구와 관련된 구성 요소가 없으므로(애드믹스처(ADMIXTURE)와 f4 결과 모두에서, 그림 2C와 그림 4), 우리는 북부 해안 혈통과 관련된 혼합이 류큐(琉球) 제도 출신의 나가바카(長墓) 인구로 들어간 것은 적어도 2800 BP 이후에 일어났다고 추론했다. 우리는 다음으로 데이츠(DATES)를 사용하여 산동(山東) 혈통이 역사시대 나가바카(長墓) 인구에 통합된 혼합 시점을 추정했다. 북부 해안 인구를 대표하기 위해 산동(山東) 인구(CZYGroup, LJZGroup, XCGroup, HLGroup)를, 북부 내륙 인구를 대표하기 위해 서요하(西遼河) 인구(WLR_LN, WLR_BA)를 본토 동아시아 출처로 사용하고, 조몬(縄文)을 또 다른 출처로 사용하여 약 102-43세대 전이라는 일관된 혼합 시점을 얻었다(보충 표 S7). 한 세대를 28년으로 가정할 때 가장 가능성 있는 혼합 시점은 1600-1400 BP로 추정된다(LJZGroup이 조상 출처에 가장 적합하며, 가장 작은 nrmsd = 0.180, 평균 = 43.3, 보충 표 S7). 이는 잠재적으로 역사 기록(예: 《수서(隋書)》, 《중산세보(中山世譜)》, 《중산세감(中山世鑑)》)에 따라 발생한 것으로 알려진 수(隋) 왕조(약 1400 BP)와 류큐(琉球) 제도 인구 간의 인구 상호작용과 연결될 수 있다. 관련된 구체적인 역사적 사건은 고고학 연구의 추가적인 뒷받침이 필요하다. 

Fig. 4 | F4-statistics depicting the relationship of the BQGroup from ShanDong to ancient mainland East Asians and post-Yayoi populations from the Japanese archipelago. Results of f4(Y, BQGroup: Japanese_after_2800BP, Mbuti), where Y represents ancient northern East Asians from the Amur River (blue), Yellow River (orange), and West Liao River regions (purple). This f4 was used to test whether alleles shared between the DaWenKou ShanDong populations (i.e. BQGroup) and post-Yayoi island populations (Nagabaka, Kofun) contain genetic components that are not present in these ancient northern East Asians. The measure of centers (circles) are the average values of f4, and the error bars represent 2.5x standard error. A solid circle indicates that the f4 value is significant, while a hollow circle indicates that the f4 value is not significant. 

그림 4 | 산동(山東) 출신 BQGroup과 고대 동아시아 본토인 및 일본 열도의 야요이(弥生) 이후 인구와의 관계를 보여주는 F4-통계량. f4(Y, BQGroup; Japanese_after_2800BP, 음부티(Mbuti))의 결과, 여기서 Y는 아무르강(Amur River)(파란색), 황하(黃河)(주황색), 서요하(西遼河)(보라색) 지역의 고대 북부 동아시아인을 나타낸다. 이 f4는 대문구(大汶口) 산동(山東) 인구(즉, BQGroup)와 야요이(弥生) 이후 섬 인구(나가바카(長墓), 고훈(古墳)) 간에 공유된 대립유전자가 이들 고대 북부 동아시아인에게는 존재하지 않는 유전적 구성 요소를 포함하는지 테스트하는 데 사용되었다. 중앙값(원)은 f4의 평균값이며, 오차 막대는 2.5x 표준 오차를 나타낸다. 채워진 원은 f4 값이 유의미함을, 빈 원은 f4 값이 유의미하지 않음을 나타낸다. 

 

논의 Discussion

Through sampling of ancient individuals from the northern coastal region of ShanDong in East Asia, we reconstructed fine-scale popula­tion dynamics from the ShanDong region over the past 9000 years, allowing us to answer several long-standing questions on not only population interaction and change during formative cultural periods in northern East Asia, but also the source of mainland East Asian ancestry into the Japanese archipelago. 

동아시아 산동(山東) 북부 해안 지역의 고대인 샘플링을 통해, 우리는 지난 9000년간 산동(山東) 지역의 미세한 규모의 인구 동역학을 재구성했다. 이를 통해 우리는 북부 동아시아의 형성기 문화 동안의 인구 상호작용과 변화뿐만 아니라, 일본 열도로 유입된 본토 동아시아 혈통의 출처에 대한 몇 가지 오래된 질문에 답할 수 있었다. 

First, we reconstructed the population history of mainland East Asians, focusing particularly on interactions across major cultural peri­ods associated with the Neolithic. We found that before the emergence of the coastal DaWenKou culture, by at least 7700 BP, some ShanDong populations were influenced by populations from further north and south, about 3000 years earlier than that estimated in previous studies. Later, with the establishment of two major Neolithic cultures in East Asia, the YangShao and DaWenKou cultures, we observed gene flow related to inland YangShao populations from the Yellow River region into the coastal DaWenkou populations from the ShanDong region, a pattern consistent with cultural interactions observed in the archae­ological record16-18,20,49,50, We observed different interaction patterns during three major cultural periods since 6000 BP. First, we observed admixture from Yellow River-related populations to ShanDong popula­tions during the DaWenKou cultural period, likely associated with the expansion of the YangShao culture during 6000-4600 BP7,20,21 Second, we observed little to no gene flow from external regions into the ShanDong region from 4600-4000 BP, when both the Yellow River and ShanDong regions experienced similar cultural changes that led to the LongShan cultural period 20,15. This pattern suggests that during this time period, within-region population continuity was predominant in the ShanDong region. Finally, in the early dynastic period after 3500 BP, we observed a second wave of gene flow from Yellow River-related populations to some ShanDong populations, potentially associated with increased trade and conflict between the Shang Dynasty and Dongyi populations, which was shown in the historical record to have been driven by demand for sea salt52. During the dynastic period, the establishment of socioeconomic structure may have contributed to a second wave of Yellow River-related ancestry into the ShanDong region. The different patterns of gene flow that occurred during the DaWenkou, LongShan, and early dynastic cultural periods show the history of how the genetic structure of the ShanDong populations was formed between 6000 and 1500 BP. 

첫째, 우리는 신석기 시대와 관련된 주요 문화 시기에 걸친 상호작용에 특히 초점을 맞춰 동아시아 본토인의 인구 역사를 재구성했다. 우리는 해안의 대문구문화(大汶口文化)가 출현하기 전, 적어도 7700 BP까지 일부 산동(山東) 인구가 더 북쪽과 남쪽의 인구로부터 영향을 받았음을 발견했으며, 이는 이전 연구에서 추정된 것보다 약 3000년 더 이른 시점이다. 이후 동아시아에 앙소(仰韶)와 대문구(大汶口)라는 두 주요 신석기 문화가 확립되면서, 우리는 황하(黃河) 지역의 내륙 앙소(仰韶) 인구 관련 유전자 흐름이 산동(山東) 지역의 해안 대문구(大汶口) 인구로 유입되는 것을 관찰했는데, 이는 고고학 기록에서 관찰된 문화적 상호작용과 일치하는 패턴이다¹⁶⁻¹⁸˒²⁰˒⁴⁹˒⁵⁰. 우리는 6000 BP 이래 세 주요 문화 시기 동안 서로 다른 상호작용 패턴을 관찰했다. 첫째, 우리는 대문구문화(大汶口文化) 시기 동안 황하(黃河) 관련 인구로부터 산동(山東) 인구로의 혼합을 관찰했는데, 이는 6000-4600 BP 동안의 앙소문화(仰韶文化) 확장과 관련이 있을 가능성이 높다⁷˒²⁰˒²¹. 둘째, 우리는 4600-4000 BP 동안 외부 지역에서 산동(山東) 지역으로의 유전자 흐름이 거의 또는 전혀 없음을 관찰했다. 이 시기에는 황하(黃河)와 산동(山東) 지역 모두 용산문화(龍山文化) 시대로 이어진 유사한 문화적 변화를 경험했다²⁰˒¹⁵. 이 패턴은 이 기간 동안 산동(山東) 지역 내에서 지역 내 인구 연속성이 우세했음을 시사한다. 마지막으로, 3500 BP 이후의 초기 왕조 시대에, 우리는 황하(黃河) 관련 인구로부터 일부 산동(山東) 인구로의 두 번째 유전자 흐름 물결을 관찰했는데, 이는 잠재적으로 상(商) 왕조와 동이(東夷) 인구 간의 교역 및 갈등 증가와 관련이 있으며, 역사 기록에 따르면 이는 바다 소금에 대한 수요에 의해 주도되었다⁵². 왕조 시대 동안 사회경제적 구조의 확립이 산동(山東) 지역으로 황하(黃河) 관련 혈통의 두 번째 물결에 기여했을 수 있다. 대문구(大汶口), 룡산(龍山), 초기 왕조 문화 시기 동안 발생한 서로 다른 유전자 흐름 패턴은 6000년에서 1500년 전 사이에 산동(山東) 인구의 유전적 구조가 어떻게 형성되었는지의 역사를 보여준다. 

Further studies have shown that post-Yayoi populations from the Japanese archipelago (e.g. Nagabaka_2800 BP, Kofun, and Nagaba­ka_historic) derive ancestry from at least three sources: Jomon hunter-gatherers, a northern East Asian ancestry likely associated with Yayoi migrants, and a mainland East Asian ancestry that entered Japan after the Yayoi period associated with the present-day Han.7.9.10. However, the provenance of the mainland East Asian ancestry and the timing of the related admixture was not known. Here, we identified the pre­viously unknown East Asian ancestry associated with the Han as a coastal East Asian ancestry that was also found in ancient ShanDong populations (e.g. CZYGroup, YJCGroup, and LJZGroup), and we esti­mated that this ancestry was introduced through admixture -1600 to 1400 BP using a DATES analysis. Interestingly, this model can only explain the unknown genetic component in Ryukyu islanders, and the mainland East Asian ancestry found in Hondo Japanese popula­tions remains unclear. Therefore, while the genetics of recent popu­lations from Japan fits a model of three ancestries related to the Jōmon, northern inland East Asians (analogous to the northern East Asian ancestry associated with the Yayoi previously proposed), and northern coastal East Asian ancestry (analogous to mainland East Asian ancestry associated with the post-Yayoi previously proposed), northern coastal East Asian ancestry can be further differentiated within different populations of the Japanese archipelago. This observation also fits the population structure previously observed in present-day Japanese, and highlights the complex population history within different regions of Japan. 

추가 연구들은 일본 열도의 야요이(弥生) 이후 인구(예: 나가바카_2800 BP, 고훈(古墳), 역사시대 나가바카(長墓))가 적어도 세 가지 출처로부터 혈통을 물려받았음을 보여주었다: 조몬(縄文) 수렵채집인, 야요이(弥生) 이주민과 관련 있을 가능성이 높은 북부 동아시아 혈통, 그리고 야요이(弥生) 시대 이후 일본에 들어온 현대 한족(漢族)과 관련된 본토 동아시아 혈통이다⁷·⁹·¹⁰. 그러나 본토 동아시아 혈통의 출처와 관련 혼합의 시점은 알려져 있지 않았다. 여기서 우리는 이전에 알려지지 않았던 한족(漢族) 관련 동아시아 혈통을 고대 산동(山東) 인구(예: CZYGroup, YJCGroup, LJZGroup)에서도 발견된 해안 동아시아 혈통으로 식별했으며, 데이츠(DATES) 분석을 사용하여 이 혈통이 약 1600년에서 1400년 전(BP)에 혼합을 통해 도입되었다고 추정했다. 흥미롭게도, 이 모델은 류큐(琉球) 제도민의 알려지지 않은 유전적 구성 요소만을 설명할 수 있으며, 혼도(本島) 일본 인구에서 발견되는 본토 동아시아 혈통은 여전히 불분명하다. 따라서, 일본의 최근 인구 유전학은 조몬(縄文), 북부 내륙 동아시아인(이전에 제안된 야요이(弥生) 관련 북부 동아시아 혈통과 유사), 그리고 북부 해안 동아시아 혈통(이전에 제안된 야요이(弥生) 이후 관련 본토 동아시아 혈통과 유사)과 관련된 세 가지 혈통 모델에 부합하지만, 북부 해안 동아시아 혈통은 일본 열도의 다른 인구 내에서 더 세분화될 수 있다. 이 관찰은 또한 현대 일본인에게서 이전에 관찰된 인구 구조와도 부합하며, 일본의 다른 지역 내 복잡한 인구 역사를 강조한다.

 

연구방법 Methods

Ethics and inclusion statement

윤리 및 포함 진술

Permission to test for ancient DNA in the human specimens from this study was obtained through discussions with local archaeologists who excavated them, with final approval granted by the institutes in Shan­dong where they are managed and cared for, the Shandong Provincial Institute of Cultural Relics and Archaeology and Shandong University. Additional oversight and approval were obtained from the Institutional Review Board at the Institute of Vertebrate Paleontology and Paleoan­thropology of the Chinese Academy of Sciences to sample the genomes of the ancient humans included in this study (202310250014). Protocols used to sample the genomes follow the highest standards used in archaeogenomic research. The work was done in collaboration with several local archaeologists, who were included as co-authors for their contributions to collation of archaeological material, dating of speci­mens, and/or discussions that contributed to the connections made to archaeological research cited in this study.

본 연구의 인골 표본에 대한 고대 DNA 테스트 허가는 해당 유물을 발굴한 현지 고고학자들과의 논의를 통해 얻었으며, 최종 승인은 유물을 관리하고 보관하는 산동(山東)의 기관인 산동성문물고고연구원(山東省文物考古硏究院)과 산동대학(山東大學)에서 부여했다. 추가적인 감독 및 승인은 중국과학원 고척추동물여고인류연구소(中國科學院 古脊椎動物與古人類硏究所)의 기관생명윤리위원회(Institutional Review Board)로부터 본 연구에 포함된 고대인의 유전체 샘플링에 대해 받았다(202310250014). 유전체 샘플링에 사용된 프로토콜은 고고유전체학 연구에서 사용되는 최고 수준의 표준을 따른다. 본 연구는 여러 현지 고고학자들과의 협력으로 수행되었으며, 이들은 고고학 자료의 대조, 표본의 연대 측정 및/또는 본 연구에 인용된 고고학 연구와의 연결에 기여한 공로로 공동 저자로 포함되었다. 

Ancient DNA extraction, sequencing, and data processing

고대 DNA 추출, 시퀀싱 및 데이터 처리

For ancient DNA extraction, we primarily selected temporal bone fragments and teeth from human skeletal remains from ancient sites in the ShanDong region and drilled for bone powder. For each specimen, about 100 mg of bone or tooth powder was extracted. In order to avoid inter-sample contamination, use of a disposable drill bit for each specimen was strictly followed during the sampling process. For temporal bone samples, two drilling methods were employed: when we could isolate the temporal bone, we drilled a small hole on the inner side of the temporal bone to obtain bone powder. When we could not isolate the temporal bone from the intact cranial bone, we drilled from the bottom of the cranial bone, in order to protect the recognizable morphological features on the surface of the cranial bone. 

고대 DNA 추출을 위해, 우리는 주로 산동(山東) 지역의 고대 유적지에서 나온 인골 유해의 측두골 조각과 치아를 선택하고 뼈 분말을 얻기 위해 드릴링했다. 각 표본에 대해 약 100mg의 뼈 또는 치아 분말을 추출했다. 표본 간 오염을 피하기 위해, 샘플링 과정에서 각 표본마다 일회용 드릴 비트를 사용하는 것을 엄격히 준수했다. 측두골 샘플의 경우 두 가지 드릴링 방법을 사용했다: 측두골을 분리할 수 있을 때는 측두골 안쪽에 작은 구멍을 뚫어 뼈 분말을 얻었다. 온전한 두개골에서 측두골을 분리할 수 없을 때는, 두개골 표면의 식별 가능한 형태학적 특징을 보호하기 위해 두개골 바닥에서부터 드릴링했다. 

For DNA library construction, single-stranded DNA libraries (SS) were constructed 7.58 for samples from the GangShang and XiChen sites, and these libraries were not subjected to uracil-DNA glycosylase treatment (non-UDG) (Supplementary Data 1). For samples from the other nine sites, double-stranded DNA libraries (DS) were constructed 58.59, and partial uracil-DNA glycosylase treatment was used (half-UDG). Amplification of DNA libraries was carried out by the AccuPrimepfx DNA enzyme in a polymerase chain reaction (PCR), and libraries were amplified for 35 cycles. The amplification process involved 35 cycles to ensure that enough ancient DNA was available for capture, followed by the addition of P5 and P7 primers to specific libraries. A NanoDrop2000 spectrometer was used to measure the amount of DNA extracted from each sample. 

DNA 라이브러리 구축을 위해, 강상(崗上) 및 서진(西陳) 유적지의 샘플에 대해서는 단일 가닥 DNA 라이브러리(SS)를 구축했으며⁷·⁵⁸, 이 라이브러리들은 우라실-DNA 글리코실라아제 처리(non-UDG)를 받지 않았다(보충 데이터 1). 다른 아홉 유적지의 샘플에 대해서는 이중 가닥 DNA 라이브러리(DS)를 구축했으며⁵⁸·⁵⁹, 부분적인 우라실-DNA 글리코실라아제 처리(half-UDG)가 사용되었다. DNA 라이브러리의 증폭은 중합효소연쇄반응(PCR)에서 AccuPrimepfx DNA 효소에 의해 수행되었고, 라이브러리는 35 사이클 동안 증폭되었다. 증폭 과정은 캡처에 충분한 고대 DNA를 확보하기 위해 35 사이클을 포함했으며, 이후 특정 라이브러리에 P5 및 P7 프라이머를 추가했다. 각 샘플에서 추출된 DNA의 양을 측정하기 위해 NanoDrop2000 분광계를 사용했다. 

Sequencing and reads alignment

시퀀싱 및 리드 정렬

Oligonucleotide probes designed for ancient nuclear whole genome SNP capture was used, which focused on -1,240,000 SNPs (1240 K SNP array1-63) (Supplementary Data 1). The enriched captured DNA frag­ments were sequenced on Illumina Hiseq2500 and HiSeq X platforms. generating end-paired fragments of 2times100 bp and 2times150 bp in length. Primer fragments were removed from the original sequences using the leeHom software, and forward and reverse sequences with at least 11 base pairs of overlap were screened and merged into a single sequence. BWA software aligned the merged sequence with the hg19 human reference genome with parameters set to “-n 0.01 -1 16500”. According to criterion that the mapping quality of the comparison should be greater than or equal to 30, the fragments that did not meet the criterion were filtered. Duplicated sequence fragments, i.e. frag­ments with the same sequence orientation and same start and end positions, were excluded, where the fragment with the highest quality was retained for further processing. 

약 1,240,000개의 SNP(1240 K SNP 어레이¹⁻⁶³)에 초점을 맞춘 고대 핵 전체 유전체 SNP 캡처용으로 설계된 올리고뉴클레오티드 프로브를 사용했다(보충 데이터 1). 농축된 캡처 DNA 단편은 Illumina Hiseq2500 및 HiSeq X 플랫폼에서 시퀀싱되었다. 이로써 2times100 bp 및 2times150 bp 길이의 양말단 쌍(end-paired) 단편을 생성했다. leeHom 소프트웨어를 사용하여 원본 서열에서 프라이머 단편을 제거했으며, 최소 11개의 염기쌍 중첩을 가진 정방향 및 역방향 서열을 스크리닝하여 단일 서열로 병합했다. BWA 소프트웨어는 병합된 서열을 hg19 인간 참조 유전체에 “-n 0.01 -l 16500” 매개변수로 정렬했다. 비교의 매핑 품질이 30 이상이어야 한다는 기준에 따라, 기준을 충족하지 않는 단편은 필터링했다. 중복된 서열 단편, 즉 동일한 서열 방향과 동일한 시작 및 끝 위치를 가진 단편은 제외했으며, 가장 높은 품질의 단편을 추가 처리를 위해 유지했다. 

Test for contamination and genotyping

오염 테스트 및 유전자형 분석

The C-T substitution rate of each individual terminal nucleotide was calculated. A relatively high C-T substitution rate at the terminal nucleotide is characteristic of ancient DNA, suggesting that the sequence read represents genetic material from the ancient human sampled. The mitochondrial contamination rate of each individual was assessed by comparing the sequenced fragments with the mitochon­drial genomes of 311 present-day humans from around the world using ContamMix software. For one male individual where mtDNA was not captured, we used an X chromosome contamination test”. Libraries with estimated mitochondrial contamination levels greater than 5.0% were reprocessed to retain only damaged fragments containing pat­terns typical of ancient DNA, i.e. they exhibit damage patterns not found in modern DNA. Damaged fragments were obtained by filter­ing out fragments containing at least one C-T substitution in the first three positions of the 5′ end and in the last three positions of the 3′ end using pmdtools0.60 and the “–customterminus” parameter”, and the individuals corresponding to these damage-restricted libraries were labeled with “_d” for subsequent analyses (Supplementary Table S1). For SNP loci that have reads covered at least once in each individual, a random read was selected to determine the allele for that individual, leading to pseudohaploid genome-wide data for downstream popu­lation genetic analyses. 

각 개체의 말단 뉴클레오티드의 C-T 치환율을 계산했다. 말단 뉴클레오티드에서 상대적으로 높은 C-T 치환율은 고대 DNA의 특징으로, 해당 시퀀스 리드가 샘플링된 고대인의 유전 물질을 나타냄을 시사한다. 각 개체의 미토콘드리아 오염률은 ContamMix 소프트웨어를 사용하여 시퀀싱된 단편을 전 세계 311명의 현대인의 미토콘드리아 유전체와 비교하여 평가했다. mtDNA가 캡처되지 않은 한 명의 남성 개체에 대해서는 X 염색체 오염 테스트를 사용했다. 추정된 미토콘드리아 오염 수준이 5.0%보다 큰 라이브러리는 고대 DNA의 전형적인 패턴을 포함하는 손상된 단편만 유지하도록 재처리되었다. 즉, 현대 DNA에서는 발견되지 않는 손상 패턴을 나타내는 단편이다. 손상된 단편은 pmdtools0.60과 “–customterminus” 매개변수를 사용하여 5′ 말단의 첫 세 위치와 3′ 말단의 마지막 세 위치에서 최소 하나의 C-T 치환을 포함하는 단편을 필터링하여 얻었으며, 이러한 손상-제한 라이브러리에 해당하는 개체는 후속 분석을 위해 “_d”로 라벨링되었다(보충 표 S1). 각 개체에서 적어도 한 번 이상 리드가 커버된 SNP 위치에 대해, 무작위 리드를 선택하여 해당 개체의 대립유전자를 결정했으며, 이는 후속 집단유전학 분석을 위한 유사-반수체(pseudohaploid) 전장 유전체 데이터로 이어졌다. 

Principal components analysis, Umap dimensionality reduction, t-sne dimensionality reduction

주성분 분석, Umap 차원 축소, t-SNE 차원 축소

Principal Component Analysis (PCA) was performed using the smartpca program from the EIGENSOFT package, in which we used published present-day humans (34 present-day populations from the HO project, and 17 Tibetan and Han populations differentiated according to region in their published studies) to determine the principal components (PCl=5.5, PC2=3.6, Supple­mentary Fig. SI). We then projected ancient ShanDong individuals sampled in this study, as well as previously published ancient individuals 3.4.6-8,41,42 (Fig. IC). We then assessed PCI through PC10, collapsing the data through new eigenvalues onto a two-dimensional plane using Umap” and t-sne. Compared to PCA, Umap and t-sne can visualize all 10 PCs on a two-dimensional plane, where Umap (Supplementary Fig. S2) focuses more on global structure, and t-sne (Supplementary Fig. S3) focuses more on local structure. 

주성분 분석(PCA)은 EIGENSOFT 패키지의 smartpca 프로그램을 사용하여 수행되었으며, 여기서 우리는 발표된 현대인(HO 프로젝트의 34개 현대 인구, 그리고 발표된 연구에서 지역에 따라 구별된 17개의 티베트 및 한족 인구)을 사용하여 주성분을 결정했다(PC1=5.5, PC2=3.6, 보충 그림 SI). 그런 다음 본 연구에서 샘플링된 고대 산동(山東) 개체들과 이전에 발표된 고대 개체들을 투영했다³,⁴,⁶⁻⁸,⁴¹,⁴²(그림 IC). 그 후 PC1부터 PC10까지를 평가하여, Umap³¹과 t-SNE³²를 사용하여 새로운 고유값을 통해 데이터를 2차원 평면에 축소했다. PCA와 비교하여, Umap과 t-SNE는 10개의 PC 모두를 2차원 평면에 시각화할 수 있으며, 여기서 Umap(보충 그림 S2)은 전역 구조에 더 초점을 맞추고, t-SNE(보충 그림 S3)는 지역 구조에 더 초점을 맞춘다. 

F3- and f4-analyses F3- 및 f4-분석

To determine genetic relationships among East Asian populations, the outgroup-f3 and f4 analyses found in the the software package Admixtools were used. Raghavan et al. first proposed the outgroup f3-analysis, which uses an f-statistic of the form f3(Outgroup; X, Y), where the Outgroup is an outgroup population to X and Y. We used the modern Central African population Mbuti as the Outgroup, and ancient East Asians from this and previously published studies as X and Y populations. In practice, we used the qp3Pop software from the Admix Tools package and plotted heatmaps using the matplotlib package for Python 3.7 (Fig. 2A). X and Y populations that share a high f3 value show high genetic similarity between these two populations. Similarity due to shared ancestry versus admixture can be further differentiated using the f4 analysis. We used the qpDstat software in the AdmixTools package to perform f4 analyses and evaluate the relative degree of allele sharing between ancient individuals in East Asia. The f4 statistic takes the form f4(P1, P2; P3, P4), where P4 is generally fixed as an outgroup to P1, P2, and P3. We used the Central African population Mbuti as P4, which is outgroup to East Asian populations. In an f4 analysis, f40 ( (Z2.5 or more strictly Z3 indicates that the number of alleles shared between the P1 and P3 populations is greater than the number of alleles shared between the P2 and P3 populations. f4\<0 (Z\<-2.5 or more strictly z\<-3) indicates that the number of alleles shared between the P1 and P3 populations is less than the number of alleles shared between the P2 and P3 populations, and f4-0 (Z< 2.5 or more strictly Z <131) indicates that the number of alleles shared by P3 with P1 and P2 is approximately equal. 

동아시아 인구 간의 유전적 관계를 결정하기 위해, 소프트웨어 패키지 Admixtools에 있는 외부군-f3 및 f4 분석을 사용했다. 라가반(Raghavan) 등은 f3(외부군; X, Y) 형태의 f-통계량을 사용하는 외부군 f3-분석을 처음 제안했는데, 여기서 외부군은 X와 Y에 대한 외부군 인구이다. 우리는 현대 중앙아프리카 인구인 음부티(Mbuti)를 외부군으로, 본 연구 및 이전에 발표된 연구의 고대 동아시아인을 X와 Y 인구로 사용했다. 실제로는 Admix Tools 패키지의 qp3Pop 소프트웨어를 사용하고 Python 3.7용 matplotlib 패키지를 사용하여 히트맵을 그렸다(그림 2A). 높은 f3 값을 공유하는 X와 Y 인구는 이 두 인구 간에 높은 유전적 유사성을 보인다. 공유 조상으로 인한 유사성과 혼합으로 인한 유사성은 f4 분석을 사용하여 추가로 구별할 수 있다. 우리는 AdmixTools 패키지의 qpDstat 소프트웨어를 사용하여 f4 분석을 수행하고 동아시아의 고대 개체들 간의 상대적인 대립유전자 공유 정도를 평가했다. f4 통계량은 f4(P1, P2; P3, P4) 형태를 취하며, 여기서 P4는 일반적으로 P1, P2, P3에 대한 외부군으로 고정된다. 우리는 동아시아 인구에 대한 외부군인 중앙아프리카 인구 음부티(Mbuti)를 P4로 사용했다. f4 분석에서, f40 (Z2.5 또는 더 엄격하게 Z3)은 P1과 P3 인구 간에 공유된 대립유전자 수가 P2와 P3 인구 간에 공유된 대립유전자 수보다 많음을 나타낸다. f4\<0 (Z\<-2.5 또는 더 엄격하게 z\<-3)은 P1과 P3 인구 간에 공유된 대립유전자 수가 P2와 P3 인구 간에 공유된 대립유전자 수보다 적음을 나타내며, f4~0 (|Z|<2.5 또는 더 엄격하게 |Z|<3|)은 P3이 P1 및 P2와 공유하는 대립유전자 수가 거의 같음을 나타낸다. 

Kinship analyses 친족 관계 분석

In order to exclude the influence of kinship on population genetics analysis, READ (Relationship Estimation from Ancient DNA) software was used to analyze the kinship between human individuals from ancient sites in ShanDong . READ software was specially developed for use with ancient DNA, as the low content of endogenous DNA, fragmentation, terminal damage and other characteristics of aDNA can make estimating kinship difficult. The principle is (1) to divide the genome into non-overlapping windows of 1 Mbp; (2) calculate the proportion of mismatched alleles (PO) for each window for each pair of individuals; (3) randomly select the expected value of a pair of unre­lated individuals in the same population to normalize PO; and finally, (4) classify the kinship between samples according to the threshold value. After processing through the READ analysis, each pair of indi­viduals may be categorized into one of the following four types of kinship: (1) identical individuals/identical twins; (2) first-generation kinship: parents and children, siblings; (3) second-generation kinship: maternal/grandparents and grandchildren, aunts/uncles and nieces/ nephews, half-siblings; and (4) unrelated individuals: the distance of kinship is greater than the second-generation range. Because individuals within two generations of kinship share similar genetic characteristics that can bias population genetics ana­lyses that assume independence of data, we filtered the newly sampled individuals to exclude related individuals in population genetic ana­lyses. That is, for any kinship groups, we retained the individual with the highest data quality. We ultimately excluded 15 individuals (Bei­Qian=13 TongLin = 1, GangShang = 1) from downstream population genetics analyses and marked the excluded individuals with the suffix “_k” (Supplementary Table S2). 

집단유전학 분석에 대한 친족 관계의 영향을 배제하기 위해, READ(고대 DNA로부터의 관계 추정) 소프트웨어를 사용하여 산동(山東)의 고대 유적지에서 나온 인간 개체들 간의 친족 관계를 분석했다. READ 소프트웨어는 내인성 DNA의 낮은 함량, 단편화, 말단 손상 및 기타 고대 DNA의 특성으로 인해 친족 관계 추정이 어려울 수 있으므로 고대 DNA 사용을 위해 특별히 개발되었다. 그 원리는 (1) 유전체를 1 Mbp의 겹치지 않는 창으로 나누고, (2) 각 개체 쌍의 각 창에 대해 불일치 대립유전자 비율(PO)을 계산하며, (3) 동일 집단 내 관련 없는 개체 쌍의 기대값을 무작위로 선택하여 PO를 정규화하고, 마지막으로 (4) 임계값에 따라 샘플 간의 친족 관계를 분류하는 것이다. READ 분석을 거친 후, 각 개체 쌍은 다음 네 가지 친족 관계 유형 중 하나로 분류될 수 있다: (1) 동일 개체/일란성 쌍둥이; (2) 1세대 친족 관계: 부모와 자녀, 형제자매; (3) 2세대 친족 관계: 외/조부모와 손자/손녀, 숙모/삼촌과 조카/조카딸, 이복형제; (4) 관련 없는 개체: 친족 관계의 거리가 2세대 범위를 초과함. 2세대 이내의 친족 관계에 있는 개체들은 데이터의 독립성을 가정하는 집단유전학 분석을 편향시킬 수 있는 유사한 유전적 특징을 공유하기 때문에, 우리는 새로 샘플링된 개체들을 필터링하여 집단유전학 분석에서 관련된 개체들을 제외했다. 즉, 어떤 친족 그룹에 대해서든 데이터 품질이 가장 높은 개체를 유지했다. 우리는 최종적으로 15명의 개체(북천(北阡)=13, 동림(銅林)=1, 강상(崗上)=1)를 후속 집단유전학 분석에서 제외하고 제외된 개체에 “_k” 접미사를 표시했다(보충 표 S2). 

Grouping analysis based on Pairwise D method 

쌍별 D(Pairwise D) 방법을 기반으로 한 그룹화 분석

To group individuals within sites, we focused on comparing differ­ences between individuals within the same site using the Pairwise D method. Pairwise D entails using the functionality of the f4 analysis in the AdmixTools software package, with the formula D(ind1, ind2; Pop, Mbuti), where ind1 and ind2 are two different individuals from the same site, and Pop is a published ancient individual or present-day population. A higher number of D-statistics where ∣Z∣3 indicates genetic differences between ind1 and ind2 that suggest ind1 and ind2 may not share enough genetic similarities to be grouped together. In this study, 107 representative ancient 40,42,70-73 and present-day 43.67 populations were rotated into the Pop position, and the number of D-statistics for each (ind1, ind2) pairing where ∣Z∣3 was determined. If there were greater than five D-statistics where ∣Z∣3, then the ancient individuals were divided into subgroups or outliers as appropriate (Supplementary Fig. S3). From the grouping analysis using Pairwise D, BQ4628 and BQ4610 were classified as outliers at the BeiQian site, YJC4658 was classified as an outlier at the YinJiaCheng site, XZ3470 was classified as an outlier at the XinZhi site, and HL4788 was classified as an outlier at the Houli site. Outliers were labeled with the suffix “_o”, and the remaining individuals from that site were grouped together for downstream population genetic analysis (BQGroup of BeiQian site, GSGroup of GangShang site, FJGroup of Fujia site, YJCGroup of YinJiaCheng site, CZYGroup of ChengZiYa site, HLGroup of HouLi site, LJZGroup of LiuJiaZhuang site, XCGroup of XiChen site, XZGroup of XinZhi site, YXGroup of YiXi site, TLGroup of TongLin site).

유적지 내 개체들을 그룹화하기 위해, 우리는 쌍별 D 방법을 사용하여 동일 유적지 내 개체들 간의 차이를 비교하는 데 초점을 맞췄다. 쌍별 D는 AdmixTools 소프트웨어 패키지의 f4 분석 기능을 사용하는 것을 수반하며, 공식은 D(ind1, ind2; Pop, 음부티(Mbuti))이다. 여기서 ind1과 ind2는 동일한 유적지의 두 다른 개체이고, Pop은 발표된 고대 개체 또는 현대 인구이다. ∣Z∣3인 D-통계량의 수가 많을수록 ind1과 ind2 사이에 유전적 차이가 있음을 나타내며, 이는 ind1과 ind2가 함께 그룹화될 만큼 충분한 유전적 유사성을 공유하지 않을 수 있음을 시사한다. 본 연구에서는 107개의 대표적인 고대⁴⁰˒⁴²˒⁷⁰⁻⁷³ 및 현대⁴³·⁶⁷ 인구가 Pop 위치에 회전되었고, 각 (ind1, ind2) 쌍에 대해 ∣Z∣3인 D-통계량의 수가 결정되었다. ∣Z∣3인 D-통계량이 5개보다 많으면, 고대 개체들은 적절하게 하위 그룹이나 특이치(outlier)로 분리되었다(보충 그림 S3). 쌍별 D를 사용한 그룹화 분석 결과, 북천(北阡) 유적지에서 BQ4628과 BQ4610이 특이치로 분류되었고, 윤가성(尹家城) 유적지에서 YJC4658이, 신치(辛置) 유적지에서 XZ3470이, 후리(後李) 유적지에서 HL4788이 특이치로 분류되었다. 특이치는 “_o” 접미사로 라벨링되었고, 해당 유적지의 나머지 개체들은 후속 집단유전학 분석을 위해 함께 그룹화되었다(북천(北阡) 유적지의 BQGroup, 강상(崗上) 유적지의 GSGroup, 부가(傅家) 유적지의 FJGroup, 윤가성(尹家城) 유적지의 YJCGroup, 성자애(城子崖) 유적지의 CZYGroup, 후리(後李) 유적지의 HLGroup, 류가장(劉家莊) 유적지의 LJZGroup, 서진(西陳) 유적지의 XCGroup, 신치(辛置) 유적지의 XZGroup, 기서(沂西) 유적지의 YXGroup, 동림(銅林) 유적지의 TLGroup). 

Phylogeny modeling with Treemix

트리믹스(Treemix)를 이용한 계통 발생 모델링

Treemix v1.13 was used to determine the phylogenetic relationships of various ancient East Asians 3,4,6,7,41,42,63, allowing for admixture events. We rooted the tree using the Central African Mbuti (with the option “-root Mbuti”) and used blocks of 500 SNPs at a time (with the option “-k 500”). We ran 1000 replicates for each tree, adding the options “-bootstrap -q”. The 1000 bootstrap trees were assessed in Phylip v3.695 using the “consense” program. With that, we could assess the robustness of each clade in the tree (Supplementary Table S3). Results for m=0 to m=6, and a heatmap of the residuals were determined (Supplementary Figs. S4 and S5), and the tree for m=3 is visualized in Fig. 2B. 

다양한 고대 동아시아인³,⁴,⁶,⁷,⁴¹,⁴²,⁶³의 계통 발생 관계를 결정하기 위해 Treemix v1.13을 사용했으며, 혼합 사건을 허용했다. 우리는 중앙아프리카 음부티(Mbuti)를 사용하여 트리의 뿌리를 설정하고(“-root Mbuti” 옵션 사용), 한 번에 500개의 SNP 블록을 사용했다(“-k 500” 옵션 사용). 각 트리에 대해 1000개의 복제본을 실행했으며, “-bootstrap -q” 옵션을 추가했다. 1000개의 부트스트랩 트리는 Phylip v3.695에서 “consense” 프로그램을 사용하여 평가되었다. 이를 통해 우리는 트리의 각 분기군(clade)의 견고성을 평가할 수 있었다(보충 표 S3). m=0에서 m=6까지의 결과와 잔차의 히트맵이 결정되었고(보충 그림 S4 및 S5), m=3에 대한 트리는 그림 2B에 시각화되었다. 

Admixture analysis 애드믹스처(ADMIXTURE) 분석

We applied the program ADMIXTURES to compute stratified compo­nents in different East Asian populations based on its likelihood model with a block relaxation algorithm to estimate individual ancestry and cross-validate the estimated population structure. We used PLINK v1.90b3.40 to prune the dataset to minimize linkage disequilibrium, with the parameter “–indep-pairwise 200 25 0.4”. We included present-day and ancient populations used in the PCA analysis. Twenty repli­cates for each of K=2 to K=G were performed, using different random seeds. The lowest CV was for K=2 (Supplementary Fig. S6), with similarly low CVs for K=3 to K = 5 (0.4452-0.4471). By comparing the results from K=2 to K=5 (Supplementary Fig. S7), we found that the first separation of components is between North and South East Asians (K=2), the second separation distinguishes continental and island populations amongst northern East Asians (K=3), the third separation distinguishes the Amur River populations (and populations further north) from Yellow River populations (K=4), and the final separation distinguishes Yellow River (inland) and ShanDong (coastal) popula­tions (K=5). These separations across K=2 to K=5 mirror the popu­lation relationships observed in the Treemix analysis (Fig. 2B). We visualized the results for K=5 in Fig. 2C. 

우리는 애드믹스처(ADMIXTURE) 프로그램을 적용하여, 개별 혈통을 추정하고 추정된 인구 구조를 교차 검증하기 위해 블록 완화 알고리즘을 사용한 우도 모델을 기반으로 서로 다른 동아시아 인구의 층화된 구성 요소를 계산했다. 우리는 연관 불균형을 최소화하기 위해 PLINK v1.90b3.40을 사용하여 데이터 세트를 가지치기했으며, “–indep-pairwise 200 25 0.4” 매개변수를 사용했다. PCA 분석에 사용된 현대 및 고대 인구를 포함했다. K=2에서 K=6까지 각각에 대해 20개의 복제본을 다른 무작위 시드를 사용하여 수행했다. 가장 낮은 CV(교차 검증 오차)는 K=2에 대해 나타났으며(보충 그림 S6), K=3에서 K=5까지도 유사하게 낮은 CV를 보였다(0.4452-0.4471). K=2에서 K=5까지의 결과를 비교함으로써(보충 그림 S7), 우리는 구성 요소의 첫 번째 분리가 북부와 남부 동아시아인 사이에서 일어나고(K=2), 두 번째 분리는 북부 동아시아인 중에서 대륙과 섬 인구를 구별하며(K=3), 세 번째 분리는 아무르강(Amur River) 인구(및 더 북쪽의 인구)를 황하(黃河) 인구와 구별하고(K=4), 마지막 분리는 황하(黃河)(내륙)와 산동(山東)(해안) 인구를 구별함(K=5)을 발견했다. K=2에서 K=5에 걸친 이러한 분리는 트리믹스(Treemix) 분석에서 관찰된 인구 관계를 반영한다(그림 2B). 우리는 K=5에 대한 결과를 그림 2C에 시각화했다. 

Admixture modeling with qpAdm. qpAdm을 이용한 혼합 모델링

To model ancestry proportions for any target population, we used qpAdm in Admix Tools with the parameter “allsnps”: default”. We utilized python scripts to implement a rotational strategy to examine the potential ancestral origins of the target population in one-, two-, and three-way mixing scenarios. In the rotational strategy, a standard outgroup “Yamnaya_Samara” was added to the “right population”. The possible ancestral source populations are categorized into two groups, “rotating” and “no rotating” (Supplementary Table S4): (1) Populations in the “rotating” group who are not used as a source in the “left population” are incorporated into the “right population”. The identification of a set of best-fitting mixture models is a major advan­tage of a rotational qpAdm analysis. Compared to qpAdm without rotation, in a rotational qpAdm analysis, each potential source popu­lation is sequentially included as the left_population, where all unused potential sources in that qpAdm analysis are included in the right-population. Finding successful mixture models for one or a few potential sources highlights the optimal sources relative to the other potential sources (where Tail_prob >0.05, each ancestral mixture proportion >standard error, pnest <0.05). Using this exhaustive strategy, combined with a smaller number of source populations, tends to reveal optimal combinations of sources, because the source populations can only be identified when they outperform the rest of the tested potential source populations. Therefore, by this method, we can find the most suitable combination of source populations among all combinations of source populations. (2) Populations in the “non-rotating” group who are not used as a source for the “left population” are not included in the “right population” to avoid situa­tions where the ‘right population’ contains groups that are younger in age than the target population. See Supplementary Table S4 for details. 

임의의 대상 인구에 대한 혈통 비율을 모델링하기 위해, 우리는 Admix Tools의 qpAdm을 “allsnps: default” 매개변수와 함께 사용했다. 우리는 1방향, 2방향, 3방향 혼합 시나리오에서 대상 인구의 잠재적 조상 기원을 조사하기 위해 회전 전략을 구현하는 파이썬 스크립트를 활용했다. 회전 전략에서, 표준 외부군 “Yamnaya_Samara”가 “오른쪽 인구(right population)”에 추가되었다. 가능한 조상 출처 인구는 “회전”과 “비회전” 두 그룹으로 분류된다(보충 표 S4): (1) “왼쪽 인구(left population)”에서 출처로 사용되지 않는 “회전” 그룹의 인구는 “오른쪽 인구”에 통합된다. 가장 잘 맞는 혼합 모델 세트를 식별하는 것이 회전식 qpAdm 분석의 주요 장점이다. 회전 없는 qpAdm과 비교하여, 회전식 qpAdm 분석에서는 각 잠재적 출처 인구가 순차적으로 left_population으로 포함되며, 해당 qpAdm 분석에서 사용되지 않은 모든 잠재적 출처는 right-population에 포함된다. 하나 또는 몇 개의 잠재적 출처에 대한 성공적인 혼합 모델을 찾는 것은 다른 잠재적 출처에 비해 최적의 출처를 강조한다(Tail_prob > 0.05, 각 조상 혼합 비율 > 표준 오차, pnest < 0.05). 더 적은 수의 출처 인구와 결합된 이 철저한 전략을 사용하면 최적의 출처 조합을 밝혀내는 경향이 있는데, 이는 출처 인구가 테스트된 나머지 잠재적 출처 인구를 능가할 때만 식별될 수 있기 때문이다. 따라서 이 방법을 통해 우리는 모든 출처 인구 조합 중에서 가장 적합한 조합을 찾을 수 있다. (2) ‘오른쪽 인구’가 대상 인구보다 나이가 어린 그룹을 포함하는 상황을 피하기 위해, “왼쪽 인구”의 출처로 사용되지 않는 “비회전” 그룹의 인구는 “오른쪽 인구”에 포함되지 않는다. 자세한 내용은 보충 표 S4를 참조하라. 

The admixture proportions calculated using qpAdm were strati­fied using the age of the sources, i.e. ShanDong EN was used as an ancestral source for ShanDong_DWK, ShanDong DWK was used as an ancestral source for ShanDong LS, and ShanDong LS was used as an ancestral source for ShanDong CD. Thus, to calculate the proportion of the YR component in ShanDong LS populations, we weighted the ShanDong EN and YR components based on the ShanDong DWK proportion observed in each ShanDong LS population. We used the same method for the ShanDong_CD populations, using the propor­tions for the ShanDong LS populations. The results of this re-estimate of proportions was used to visualize the changes in the proportion of YR components in ShanDong populations over the past 6000 years (Fig. 3B). 

qpAdm을 사용하여 계산된 혼합 비율은 출처의 연대를 사용하여 층화되었다. 즉, 산동(山東) EN은 산동_DWK의 조상 출처로, 산동_DWK는 산동_LS의 조상 출처로, 산동_LS는 산동_CD의 조상 출처로 사용되었다. 따라서 산동_LS 인구에서 YR 구성 요소의 비율을 계산하기 위해, 우리는 각 산동_LS 인구에서 관찰된 산동_DWK 비율을 기반으로 산동_EN 및 YR 구성 요소를 가중했다. 우리는 산동_LS 인구의 비율을 사용하여 산동_CD 인구에 대해서도 동일한 방법을 사용했다. 이 비율 재추정 결과는 지난 6000년 동안 산동(山東) 인구에서 YR 구성 요소 비율의 변화를 시각화하는 데 사용되었다(그림 3B). 

Estimating admixture time of ancestral source components with DATES 

데이츠(DATES)를 이용한 조상 출처 구성 요소의 혼합 시기 추정

The timing of admixture events among populations of interest in East Asia was estimated using DATES v40100 (https://github.com/ MoorjaniLab/DATES_v4010). The genetic distance was set to 0.45 CM using “lovafit: 0.45”, and the maximum genetic distance was set to Morgan’s maximum using “maxdis: 1” to ensure that it was larger than the confounding LD block. The recommended optimal subgroup size of 0.001 molecules was used (“binsize: 0.001”). Standard errors were estimated by a weighted block jackknife method with the parameter ‘jackknife: Yes’. We considered all results with NRMSD < 0.7, Z >2, and generations < 200, and assumed that each “generation” corresponds to 28 years” in order to convert generations to years (Supplementary Table S5).

동아시아의 관심 인구 간 혼합 사건의 시점은 데이츠(DATES) v40100 (https://github.com/MoorjaniLab/DATES_v4010)을을) 사용하여 추정되었다. 유전적 거리는 “lovafit: 0.45″를 사용하여 0.45 cM으로 설정되었고, 최대 유전적 거리는 교란 요인인 연관 불균형(LD) 블록보다 크도록 보장하기 위해 “maxdis: 1″을 사용하여 모건(Morgan)의 최댓값으로 설정되었다. 권장되는 최적 하위 그룹 크기인 0.001 모건이 사용되었다(“binsize: 0.001”). 표준 오차는 ‘jackknife: Yes’ 매개변수를 사용한 가중 블록 잭나이프 방법으로 추정되었다. 우리는 NRMSD < 0.7, Z > 2, 세대 < 200인 모든 결과를 고려했으며, 각 “세대”가 28년에 해당한다고 가정하여 세대를 연도로 변환했다(보충 표 S5). 

F4-test based on the simulation method

시뮬레이션 방법을 기반으로 한 F4-테스트

We included a simulation to test the possible connections between the tested population (Population A) and the possible ancestral compo­nents in related populations (Population C), which leverages the linear relation between the proportion of arbitrary components in the simulated population (Population B) and the value of f4. The line where a series of f4 values are located will pass through the zero point when the ratio of the two components is consistent with that of the population being tested 4.45.

  • Further mathematical derivation omitted for this translation as it describes the method’s principles, not empirical results.

 우리는 테스트 대상 인구(인구 A)와 관련 인구(인구 C)의 가능한 조상 구성 요소 사이의 가능한 연결을 테스트하기 위한 시뮬레이션을 포함했다. 이는 시뮬레이션된 인구(인구 B)의 임의 구성 요소 비율과 f4 값 사이의 선형 관계를 활용한다. 일련의 f4 값이 위치한 선은 두 구성 요소의 비율이 테스트 대상 인구의 비율과 일치할 때 영점을 통과한다⁴·⁴⁵.

  • 방법론의 원리를 설명하는 수학적 유도 과정은 경험적 결과가 아니므로 번역에서 생략함. 

Data availability 데이터 이용 가능성

The raw sequence reads and aligned BAM files generated in this study have been deposited in the in the Genome Sequence Archive (Geno­mics, Proteomics & Bioinformatics 2021) in the National Genomics Data Center, China National Center for Bioinformation / Beijing Insti­tute of Genomics, Chinese Academy of Sciences. under accession code HRA008755 (BioProject accession number: PRJCA026441) (https://ngdc.cncb.ac.cn/gsa-human/browse/HRA008755). The pseudo-diploid genotype calls (Eigenstrat format) generated in this study have been deposited in OMIX, China National Center for Bioin­formation / Beijing Institute of Genomics, Chinese Academy of Sciences 78.79 under accession code OMIX007544 (BioProject accession number: PRJCA026441) (https://ngdc.cncb.ac.cn/omix/release/ ΟΜΙX007544). All data needed to evaluate the conclusions in the paper are present in the paper and/or the Supplementary Materials. 

본 연구에서 생성된 원시 시퀀스 리드와 정렬된 BAM 파일은 중국과학원 북경게놈연구소/국가생물정보센터, 국가유전체데이터센터의 유전체 서열 아카이브(Genome Sequence Archive)에 기탁되었다. 접속 코드 HRA008755 (바이오프로젝트 접속 번호: PRJCA026441) (https://ngdc.cncb.ac.cn/gsa-human/browse/HRA008755). 본 연구에서 생성된 유사-이배체 유전자형 호출(Eigenstrat 형식)은 중국과학원 북경게놈연구소/국가생물정보센터의 OMIX에 기탁되었다⁷⁸·⁷⁹. 접속 코드 OMIX007544 (바이오프로젝트 접속 번호: PRJCA026441) (https://ngdc.cncb.ac.cn/omix/release/ΟΜΙX007544). 논문의 결론을 평가하는 데 필요한 모든 데이터는 논문 및/또는 보충 자료에 제시되어 있다.

 

참고문헌 (References)

  1. Hung, H.-C. Early Maritime Navigation and Cultures in Coastal Southern China, Taiwan, and Island Southeast Asia, 6000–500 BCE. In: The Cambridge History of the Pacific Ocean: Volume 1: The Pacific Ocean to 1800 (eds Jones, R. T. & Matsuda, M. K.) (Cambridge University Press, 2023).
  2. Hugh, M. et al. The prehistoric peopling of Southeast Asia. Science 361, 88–92 (2018).
  3. Wang, T. et al. Human population history at the crossroads of East and Southeast Asia since 11,000 years ago. Cell 184, 3829–e3821 (2021).
  4. Yang, M. A. et al. Ancient DNA indicates human population shifts and admixture in northern and southern China. Science 369, 282–288 (2020).
  5. Liu, Y. et al. Maternal genetic history of southern East Asians over the past 12,000 years. Genet Genomics 48, 899–907 (2021).
  6. Robbeets, M. et al. Triangulation supports agricultural spread of the Transeurasian languages. Nature 599, 616–621 (2021).
  7. Cooke, N. P. et al. Ancient genomics reveals tripartite origins of Japanese populations. Adv. 7, eabh2419 (2021).
  8. Wang, C. C. et al. Genomic insights into the formation of human populations in East Asia. Nature 591, 413–419 (2021).
  9. Cooke, N. P. et al. Genomic insights into a tripartite ancestry in the Southern Ryukyu Islands. Hum. Sci. 5, e23 (2023).
  10. Liu, X. etal.Decodingtriancestral origins, archaic introgression, and natural selection in the Japanese population by whole-genome sequencing. Adv. 10, eadi8419 (2024).
  11. Okada, Y. et al. Deep whole-genome sequencing reveals recent selection signatures linked to evolution and disease risk of Japanese. Commun. 9, 1631 (2018).
  12. Sakaue, S. et al. Dimensionality reduction reveals fine-scale structure in the Japanese population with consequences for polygenic risk prediction. Commun. 11, 1569 (2020).
  13. Yamaguchi-Kabata, Y. et al. Japanese population structure, based on SNP genotypes from 7003 individuals compared to other ethnic groups: effects on population-based association studies. J. Hum. Genet 83, 445–456 (2008).
  14. Du, J. An experimental study of the Yingshui type of the Dawenkou culture (in Chinese). Archaeology 157–169, 181 (1992).
  15. Jin, S. The patterns, pathways and historical background of prehistoric cultural exchanges between Hailuo and Haidai Areas (in Chinese). J. Zhongzhou 170–175 (2010).
  16. Luan, F. Dongyi Archaeology (in Chinese). (Shandong University Press, 1996).
  17. Luan, F. An experimental study of the relationship between the East and the Central Plains in the YangShao Era (in Chinese). Archaeology 45–58 (1996).
  18. Wu, J. A brief discussion on the Dawenkou culture discovered in Henan Province (in Chinese). Archaeology 261–265 (1981).
  19. Xu, Y. A preliminary study of the phenomenon of cultural migration around 5,000 years ago (in Chinese). Archaeological J. 38, (2010).
  20. Zhang, C. LongShanization, the LongShan Period, and the Long-Shan Era – Re-reading LongShan Culture and the LongShan Era. Cultural Relics in Southern China. (in Chinese) 62–69 (2021).
  21. Yan, W. & Long, S. Culture and LongShan Period. Cultural Relics, 41–48 (in Chinese) (1981).
  22. Wang, X. An Experimental Study of the Archaeological Culture of the Oriental Region during the Xia and Shang Dynasties. Peking Univ. 57–70 (in Chinese) (1989).
  23. He, Y. Research on “Foreign Cultural Factors” in Yin Ruins. Cultural Relics of Central China, 33-49+128 (in Chinese) (2020).
  24. Li, X. in Xia, Shang and Zhou and ShanDong S. J. (in Chinese) 332–337 (Yantai Univ., 2002).
  25. Li, L. Cultural integration between merchants and Eastern barbarians in the late early Shang to Yinxu periods (in Chinese). Zhengzhou Inst. Aeronautical Ind. Manag. 28, 46–49 (2009).
  26. Fu, Q. et al. DNA analysis of an early modern human from Tianyuan Cave, China. Natl Acad. Sci. USA 110, 2223–2227 (2013).
  27. Korneliussen, T. S., Albrechtsen, A. & Nielsen, R. ANGSD: Analysis of Next Generation Sequencing Data. BMC Bioinforma. 15, 356 (2014).
  28. Briggs, A. W. et al. Patterns of damage in genomic DNA sequences from a Neandertal. Natl Acad. Sci. USA 104, 14616–14621 (2007).
  29. Skoglund, P. et al. Separating endogenous ancient DNA from modern day contamination in a Siberian Neandertal. Natl Acad. Sci. USA 111, 2229–2234 (2014).
  30. Patterson, N., Price, A. L. & Reich, D. Population structure and eigenanalysis. PLoS Genet 2, e190 (2006).
  31. Mcinnes, L. & Healy, J. UMAP: Uniform Manifold Approximation and Projection for Dimension Reduction. Open Source Softw. 3, 861 (2018).
  32. Maaten, L. J. P. V. D. & Hinton, G. E. Visualizing High-Dimensional Data using t-SNE. Mach. Learn. Res. 9, 2579–2605 (2008).
  33. Raghavan,M. et al. Upper Palaeolithic Siberian genome reveals dual ancestry of Native Americans. Nature 505, 87–91 (2014).
  34. Pickrell, J. K. & Pritchard, J. K. Inference of population splits and mixtures from genome-wide allele frequency data. PLoS Genet 8, e1002967 (2012).
  35. Alexander, D. H., Novembre, J. & Lange, K. Fastmodel-based estimation of ancestry in unrelated individuals. Genome Res 19, 1655–1664 (2009).
  36. Wang, F. et al. Briefing on the 2007 excavations at Beiqian Site, Jimo City, ShanDong, China (in Chinese). Archaeology 3–23, 197–100 (2011). 113.
  37. Fan, Y. A Trial Analysis of the Health Condition of the Dawenkou Culture Period Residents at the Beiqian Site (in Chinese). (Shandong Univ., 2013).
  38. Wu, R. Research on the Biotechnology Economy of the Dawenkou Culture (in Chinese). (Shandong Univ., 2018).
  39. Zhu, C. et al. Dawenkou culture burial ground, Gangshang Site South, Tengzhou City, ShanDong, China (in Chinese). Archaeology 62–64, 165–181 (2023). 128122.
  40. Fu, Q. et al. Genome sequence of a 45,000-year-old modern human from western Siberia. Nature 514, 445–449 (2014).
  41. Ning, C. et al. Ancient genomes from northern China suggest links between subsistence changes and human migration. Commun. 11, 2700 (2020).
  42. Mao, X. et al. The deep population history of northern East Asia from the Late Pleistocene to the Holocene. Cell 184, 3256–e3213 (2021).
  43. Patterson, N. et al. Ancient admixture in human history. Genetics 192, 1065–1093 (2012).
  44. Bai, F. et al. Ancient genomes revealed the complex human interactions of the ancient western Tibetans. Biol. 34, 2594–2605.e2597 (2024).
  45. van de Loosdrecht,M. et al. Pleistocene North African genomes link Near Eastern and sub-Saharan African human populations. Science 360, 548–552 (2018).
  46. Chintalapati, M., Patterson, N. & Moorjani, P. The spatiotemporal patterns of major human admixture events during the European Holocene. Elife 11, e77625 (2022).
  47. Li, X. Ryukyu: Ryukyu Kingdom, China, and Japan. J. 18, 56–64 (2010).
  48. Liu, J. et al. Maternal genetic structure in ancient Shandong between 9500 and 1800 years ago. Bull. 66, 1129–1135 (2021).
  49. Zhang, X. Research on the Dawenkou Culture (in Chinese). (Jilin Univ., 2015).
  50. Zhao, Y. et al. Westward migration of the inhabitants of the Dawenkou culture from human bone materials (in Chinese). Southeast Culture 56–65 (2019).
  51. Liang, S. LongShan Culture – One of the Prehistoric Periods of Chinese Civilization. J., 5–14 (in Chinese) (1954).
  52. Zhang, K. Archaeological Study of the Eastern Barbarian Culture (in Chinese). (Chinese Academy of Social Sciences (CASS), 2010).
  53. Yan, W. On the Copper and Stone Age in China (in Chinese). Prehistory 36–44+, 35 (1984).
  54. Yan, W. A brief discussion of the origins of Chinese Civilization (in Chinese). Cultural Relics 40–49+, 25 (1992).
  55. Pinhasi, R. et al. Optimal Ancient DNA Yields fromthe Inner Ear Part of the Human Petrous Bone. PLoS One 10, e0129102 (2015).
  56. Pinhasi, R., Fernandes, D.M., Sirak, K. & Cheronet, O. Isolating the human cochlea to generate bone powder for ancient DNA analysis. Protoc. 14, 1194–1205 (2019).
  57. Kircher, M., Sawyer, S. & Meyer, M. Double indexing overcomes inaccuracies in multiplex sequencing on the Illumina platform. Nucleic Acids Res. 40, e3 (2012).
  58. Meyer,M. et al. A high-coverage genome sequence from an archaic Denisovan individual. Science 338, 222–226 (2012).
  59. Gansauge, M. T. & Meyer, M. Single-stranded DNA library preparation for the sequencing of ancient or damaged DNA. Protoc. 8, 737–748 (2013).
  60. Rohland, N., Harney, E., Mallick, S., Nordenfelt, S. & Reich, D. Partial uracil-DNA-glycosylase treatment for screening of ancient DNA. Trans. R. Soc. Lond. B Biol. Sci. 370, 20130624 (2015).
  61. Fu, Q. et al. An early modern human from Romania with a recent Neanderthal ancestor. Nature 524, 216–219 (2015).
  62. Haak, W. et al. Massive migration from the steppe was a source for Indo-European languages in Europe. Nature 522, 207–211 (2015).
  63. Yang, M. A. et al. 40,000-Year-Old Individual from Asia Provides Insight into Early Population Structure in Eurasia. Biol. 27, 3202–3208.e3209 (2017).
  64. Renaud, G., Stenzel, U. & Kelso, J. leeHom: adaptor trimming and merging for Illumina sequencing reads. Nucleic Acids Res. 42, e141 (2014).
  65. Li, H. & Durbin, R. Fast and accurate short read alignment with Burrows-Wheeler transform. Bioinformatics 25, 1754–1760 (2009).
  66. Sawyer, S., Krause, J., Guschanski, K., Savolainen, V. & Pääbo, S. Temporal patterns of nucleotide misincorporations and DNA fragmentation in ancient DNA. PLoS One 7, e34131 (2012).
  67. Lu, D. et al. Ancestral Origins and Genetic History of Tibetan Highlanders. J. Hum. Genet 99, 580–594 (2016).
  68. Durand, E. Y., Patterson, N., Reich, D. & Slatkin, M. Testing for ancient admixture between closely related populations. Biol. Evol. 28, 2239–2252 (2011).
  69. Monroy Kuhn, J.M., Jakobsson, M. & Günther, T. Estimating genetic kin relationships in prehistoric populations. PLoS One 13, e0195491 (2018).
  70. Allentoft, M. E. et al. Population genomics of Bronze Age Eurasia. Nature 522, 167–172 (2015).
  71. de Barros Damgaard, P. et al. The first horse herders and the impact of early Bronze Age steppe expansions into Asia. Science 360, eaar7711 (2018).
  72. Mondal, M. et al. Genomic analysis of Andamanese provides insights into ancient human migration into Asia and adaptation. Genet. 48, 1066–1070 (2016).
  73. Yu, H. et al. Paleolithic to Bronze Age Siberians Reveal Connections with First Americans and across Eurasia. Cell 181, 1232–e1220 (2020).
  74. Purcell, S. et al. PLINK: a tool set for whole-genome association and population-based linkage analyses. J. Hum. Genet. 81, 559–575 (2007).
  75. Patterson, N. et al. Large-scalemigration into Britain during the Middle to Late Bronze Age. Nature 601, 588–594 (2022).
  76. Yüncü, E. et al. False discovery rates of qpAdm-based screens for genetic admixture. bioRxiv, https://www.biorxiv.org/content/10. 1101/2023.04.25.538339v1 (2023).
  77. Moorjani, P. et al. A genetic method for dating ancient genomes provides a direct estimate of human generation interval in the last 45,000 years. Natl Acad. Sci. USA 113, 5652–5657 (2016).
  78. Database Resources of the National Genomics Data Center, China National Center for Bioinformation in 2024. Nucleic Acids Res. 52, D18–d32 (2024).
  79. Chen, T. et al. The Genome Sequence Archive Family: Toward Explosive Data Growth and Diverse Data Types. Genomics Proteomics Bioinformatics, 19, 578–583 (2021).