중국 북부 고대 게놈으로 본 생계 변화와 인간 이주의 연관성
영초(寧超)¹,², 이천교(李天嬌)¹, 왕가(汪珂)², 장범(張帆)¹, 이도(李濤)²,³, 오서연(吳西燕)¹, 고시주(高詩柱)⁴, 장전초(張全超)⁵, 장해(張海)⁶, 마크 J. 허드슨(Mark J. Hudson)², 동광휘(董廣輝)⁷, 오사호(吳思昊)¹, 방연명(房燕明)⁸, 유침(劉琛)⁹, 풍춘연(馮春燕)¹⁰, 이위(李偉)⁶, 한도(韓濤)⁵, 이약(李若)⁷, 위견(魏堅)¹¹, 주영강(朱永剛)⁵, 주아위(周亞威)¹², 왕전초(王傳超)¹³, 범생영(范生穎)¹⁴, 웅증룡(熊增龍)¹⁴, 손주용(孫周勇)¹⁵, 엽무림(葉茂林)¹⁶, 손뢰(孫蕾)⁸, 오소홍(吳小紅)⁶, 양법위(梁法偉)⁶, 조염붕(曹豔朋)⁵, 위흥도(魏興濤)⁶, 주泓(朱泓)¹⁸, 주혜(周慧)¹¹,⁵, 요하네스 크라우제(Johannes Krause)², 마르티너 로베이츠(Martine Robbeets)²,⁴, 정충원(Choongwon Jeong)²,¹⁷ & 최은추(崔銀秋)¹,⁵,¹⁸
중국 북부는 황하(黃河)와 서요하(西遼河) 유역의 두 주요 중심지에서 조 농사를 기반으로 한 세계 최초의 복합 사회가 있던 곳이다. 지금까지 이 지역의 유전학적 역사는 거의 알려지지 않았다. 본 연구는 황하(YR), 서요하(WLR), 흑룡강(AR) 지역의 7500-1700 BP(현재로부터 년 전)에 해당하는 55개 고대 게놈을 제시한다. 흑룡강(AR) 지역의 유전적 안정성과는 대조적으로, 황하(YR)와 서요하(WLR)의 유전적 프로필은 시간에 따라 상당히 변화했다. 황하(YR) 집단은 시간이 지남에 따라 현재의 중국 남부 및 동남아시아인과의 유전적 유사성이 단조롭게 증가하는 것을 보여준다. 서요하(WLR)에서는 신석기 후기 농업의 강화가 황하(YR)와의 유사성 증가와 관련 있었고, 청동기 시대에 목축 경제가 포함된 것은 흑룡강(AR)과의 유사성 증가와 관련 있었다. 우리의 결과는 생계 전략의 변화와 인간 이주 사이의 연관성을 시사하며, 과거 인간 이주의 고고언어학적 특징에 대한 논쟁을 촉발한다.
¹ 길림대학교(吉林大學校) 생명과학부, 장춘(長春) 130012, 중국.
² 막스 플랑크 인류사 과학 연구소, 07745 예나, 독일.
³ 무한대학교(武漢大學校) 역사대학 고고학과, 무한(武漢) 430072, 중국.
⁴ 길림대학교(吉林大學校) 약학대학, 장춘(長春) 130021, 중국.
⁵ 길림대학교(吉林大學校) 중국변강고고연구센터, 길림대학교, 장춘(長春) 130012, 중국.
⁶ 북경대학교(北京大學校) 고고학 및 박물관학과, 북경(北京) 100871, 중국.
⁷ 난주대학교(蘭州大學校) 지구 및 환경과학대학, 중국 서부 환경 시스템 교육부 핵심 연구소, 난주(蘭州) 730000, 중국.
⁸ 하남성(河南省) 문물고고연구원, 정주(鄭州) 450000, 중국.
⁹ 루하(漯河)시 문물연구소, 루하(漯河) 462000, 중국.
¹⁰ 초작(焦作)시 문물연구소, 초작(焦作) 454000, 중국.
¹¹ 중국인민대학교(中國人民大學校) 역사학부, 북경(北京) 100872, 중국.
¹² 정주대학교(鄭州大學校) 역사학부, 정주(鄭州) 450066, 중국.
¹³ 하문대학교(廈門大學校) 인류학 및 민족학과, 하문(廈門) 361005, 중국.
¹⁴ 요녕성(遼寧省) 문물고고연구소, 심양(瀋陽) 110003, 중국.
¹⁵ 섬서성(陝西省) 고고학연구원, 서안(西安) 710054, 중국.
¹⁶ 중국사회과학원 고고학연구소, 북경(北京) 100710, 중국.
¹⁷ 서울대학교 생명과학부, 서울 08826, 대한민국.
¹⁸ 동북아시아 고대 생물 및 환경 진화 핵심 연구소(길림대학교), 교육부, 장춘(長春) 130021, 중국.
이메일: krause@shh.mpg.de; robbeets@shh.mpg.de; cwjeong@snu.ac.kr, cuiyq@jlu.edu.cn
[리뷰] 중화 쇼비니즘 경사도 평가: 4/10
15. Ning, C., Li, T., Wang, K. et al. (2020) ‘Ancient genomes from northern China suggest links between subsistence changes and human migration’, Nature Communications, 11, 2700. https://www.nature.com/articles/s41467-020-16557-2?error=cookies_not_supported&code=69b878ac-3611-43b4-861a-fc4175cc6763.
(1) 연구 개요 및 저자의 주장
이 연구는 황하(YR), 서요하(WLR), 아무르강(AR) 유역의 고대인 55명의 유전체를 분석하여, 생업 방식의 변화가 인구 이동 및 혼합과 어떻게 연결되는지를 규명했다. 아무르강 유역의 유전적 안정성과는 대조적으로, 서요하 유역에서는 뚜렷한 변화가 관찰되었다. 후기 신석기 시대에 농경이 강화되면서 황하 농경민(YR)과의 유전적 유사성이 증가했고, 청동기 시대에 목축 경제가 도입되면서는 다시 북방 아무르강(AR) 계통과의 유사성이 증가하는 ‘왕복형’ 혼합 패턴을 발견했다.
(2) 편향성 분석 (중화 쇼비니즘 경사도: 4/10)
이 연구는 서요하와 중원의 ‘상호작용’을 명확히 보여줌으로써 단선적 ‘화살’ 모델을 약화시켰으나, 데이터의 한계로 해양 회랑의 역할은 충분히 다루지 못했다.
- 서사 프레이밍 (낮은 편향성): ‘상호작용’과 ‘연결’을 핵심 키워드로 사용하여, 중원을 유일한 중심이 아닌 여러 행위자 중 하나로 다루는 ‘매트릭스’ 모델에 부합하는 서사를 구축했다.
- 모델 선택과 반례 취급 (중간 편향성): 데이터에 섬과 연안 표본이 부족하여, 타기도와 같은 해양 중심의 반례를 직접적으로 다루지는 못했다.
- 지리·환경 제약 반영 (중간 편향성): 연구의 초점이 내륙에서의 상호작용에 맞춰져 있어, 연안 회랑의 독립적인 동학은 충분히 드러나지 않았다.
- 유전자–문화 결합 가정 (낮은 편향성): 유전적 변화를 특정 문화가 아닌 ‘생업 방식’의 변화와 연결함으로써, 문화와 유전자의 관계를 보다 유연하게 해석했다.
(3) 결론 재구성
결론의 방향성은 이미 객관적이다. 이를 보강하기 위해서는, 연구 결과에 타기도와 같은 도서·연해 데이터를 추가하여 내륙에서의 상호작용과 연안·도서 회랑에서의 교류가 서로 다른 시간과 방식으로 병렬적으로 진행되었음을 명시해야 한다.
[논문요약]
고대 중국 DNA 분석: ‘밥상’도 바뀌고 ‘사람’도 바뀌었다
과학자들은 고대 중국 북부 사람들의 DNA를 분석해, 수천 년에 걸친 인류 역사의 거대한 수수께끼 하나를 풀었다. 바로 ‘사람들의 생활 방식(특히, 농사)이 바뀔 때, 새로운 기술만 전파된 것일까, 아니면 아예 다른 지역 사람들이 이주해 온 것일까?’라는 질문이다. 결론부터 말하면, 생활 방식의 큰 변화는 새로운 사람들의 이주와 혼혈이 결정적인 원인이었다. 연구진은 크게 세 지역의 고대인 유골 55구에서 DNA를 분석했다. 연구 대상이 된 유적지와 유골의 정보는 아래 지도 및 표와 같다.

그림 1. 연구 대상 고대인 유골이 발굴된 유적지(a)와 연대(b)
이 지도는 연구가 진행된 황하(YR), 서요하(WLR), 흑룡강(AR) 유역과 각 유적지의 위치를 보여준다.

표 1. 연구에 사용된 고대인 샘플 요약
유전체 분석 결과는 각 지역 집단이 뚜렷하게 구분됨을 보여주며, 연구진은 이를 통해 다음과 같은 흥미로운 사실들을 발견했다.

그림 2. 고대인과 현대인 유전체 비교 분석 (PCA 및 ADMIXTURE)
이 유전체 분석(PCA) 지도는 고대 북중국인들이 크게 세 그룹, 즉 흑룡강(AR, 원형), 서요하(WLR, 사각형), 황하(YR, 삼각형) 그룹으로 나뉘는 것을 명확하게 보여준다. 흑룡강 그룹은 북쪽에, 황하 그룹은 남쪽에 위치하며 서요하 그룹이 그 중간에 자리한다.
1. 북쪽의 수렵채집인 (흑룡강 유역): 수천 년간 큰 변화가 없었다
- 중국 동북쪽 끝 흑룡강(Amur River) 유역의 사람들은 유전적으로 매우 안정적이었다.
- 수천 년이 지나도 그들의 DNA는 거의 변하지 않았고, 오늘날 이 지역에 사는 퉁구스계 민족과도 비슷했다.
- 이들은 주로 수렵, 어로, 채집에 의존하며 비교적 일관된 생활 방식을 유지했는데, 이는 유전적 안정성과도 일치하는 결과이다.
2. 남쪽의 농부들 (황하 유역): 남방계 유전자가 서서히 섞여들다
- 중국 문명의 발상지로 알려진 황하(Yellow River) 유역은 일찍부터 ‘조’를 재배한 농업 중심지였다.
- 이곳 사람들의 DNA를 시대순으로 분석하니, 시간이 흐를수록 중국 남부(양자강 유역 등) 사람들과 유전적으로 점점 더 가까워지는 경향이 뚜렷하게 나타났다.
- 연구진은 이것이 남쪽의 ‘벼’ 농사 기술이 북쪽으로 확산된 것과 관련이 깊다고 본다. 즉, 벼 농사를 짓던 남쪽 사람들이 황하 유역으로 이주해 기존의 조 농사꾼들과 섞이면서 유전적 변화를 일으킨 것이다.
3. 역동적인 교차로 (서요하 유역): 생활 방식에 따라 유전자가 바뀌다
이 연구의 가장 흥미로운 부분은 흑룡강과 황하 사이에 있던 서요하(West Liao River) 유역이다. 이곳은 생활 방식의 변화가 유전적 구성의 변화와 직접적으로 맞물리는 역동적인 모습을 보였다. 아래 그림은 서요하 유역 사람들의 유전자가 시대에 따라 북방계(AR)와 남방계(YR) 사이에서 어떻게 변했는지를 명확히 보여준다.

그림 3. 서요하(WLR) 유역 고대인의 유전적 구성 변화
이 그래프는 서요하 유역 사람들이 시대가 흐름에 따라 남쪽 황하(YR) 농업인과 북쪽 흑룡강(AR) 수렵채집인의 유전적 특성 사이를 오갔음을 보여준다. 신석기 중기(HMMH_MN, HS_MN)에 비해 후기(LXJD_LN)에는 북방계 유전자 비율이 급격히 감소했다가, 청동기 시대(UXJD_BA)에 다시 증가하는 모습이 나타난다.
- 농업 강화 → 남쪽(황하) DNA 증가: 신석기 후기에 이 지역 사람들이 조 농사를 더 발전시키자, 유전적으로 남쪽의 황하 농부들과 매우 비슷해졌다. 이는 황하 유역의 농업 인구가 북쪽으로 이주해 왔다는 강력한 증거이다.
- 목축 전환 → 북쪽(흑룡강) DNA 증가: 이후 기후가 건조해져 농사가 어려워지자, 이들은 청동기 시대에 유목과 목축의 비중을 늘렸다. 놀랍게도 이 시기 사람들의 DNA는 다시 북쪽의 흑룡강 수렵채집인들과 더 가까워졌다. 이는 북방의 목축인들이 남하하여 이 지역에 새로운 유전자를 남긴 것이다.
이 연구는 고대 중국 북부에서 생계 수단(밥상)의 변화가 인구 집단의 교체(사람)와 직접적으로 연결되어 있음을 유전학적으로 명확히 보여준다. 새로운 농사 기술이나 생활 양식은 단순히 아이디어만 퍼진 것이 아니라, 그 기술을 가진 사람들이 대규모로 이주하고 기존 사람들과 혼혈되면서 전파되었던 것이다. 결국 “당신이 먹는 것이 바로 당신 자신”이라는 말이 유전적 수준에서도 사실이었음을 증명한 셈이다.
[논문번역]
서론
중국은 세계에서 가장 오래된 곡물 작물화의 독립적인 중심지 중 하나로, 근동 다음으로 중요한 지역이다. 중국 남부의 양자강(揚子江) 유역에서는 우기 벼농사가 이루어졌고¹,² , 북부에서는 건조지 조 농사가 이루어졌다²⁻⁶. 중국 북부는 중원(中原)의 중하류 황하(黃河) 유역을 포함하는 넓은 지리적 지역으로, 신석기 시대 이래 잘 알려진 황하(黃河) 문명의 발상지이다. 그러나 중국 북부는 중원(中原)을 훨씬 넘어, 뚜렷한 생태 지역에 여러 다른 주요 강 체계를 포함한다(그림 1). 특히, 현재 중국 동북부의 서요하(西遼河) 지역(그림 1)은 조 농사의 채택과 확산에서 황하(黃河) 지역과는 다른 중요한 역할을 했다는 것이 잘 받아들여지고 있다³,⁶. 기장(Setaria italica)과 조(Panicum miliaceum)는 기원전 6000년 이래 서요하(WLR)와 황하(YR) 하류 유역에서 처음으로 재배되었다³,⁶. 이후 5천 년 동안 중국 북부에서 작물화된 조는 동부 유라시아 전역과 그 너머로 퍼져나갔다. 조는 특히 16-17세기에 옥수수와 고구마가 도입되기 전까지 동북아시아의 주요 식량 중 하나였다²⁻⁷. 황하(YR)와 서요하(WLR)는 모두 조 농사에 상당 부분 의존했던 풍부한 고고학적 문화로 알려져 있다⁸,⁹. 중기 신석기(대략 기원전 4000년)까지 서요하(WLR)의 홍산(紅山) 문화(기원전 4500-3000년)¹⁰,¹¹와 황하(YR)의 앙소(仰韶) 문화(기원전 5000-3000년) 유역¹¹에서 조 농사에 상당하게 의존하는 복합 사회가 발전했다. 예를 들어, 서요하(WLR)의 홍산(紅山) 사회 발굴에서는 우하량(牛河梁) 유적의 “여신묘(女神廟)”가 가장 유명한데, 수많은 옥 장신구를 포함한 상당한 제물이 있는 공공 의례 제단이 발견되었다¹⁰,¹². 중기 신석기 복합 사회의 성립은 급속한 인구 증가와 문화 혁신과 관련 있었던 것으로 보이며, 황하(YR)에서 기원한 한장(漢藏)어족¹³,¹⁴과 서요하(WLR)에서 기원한 트랜스유라시아어족¹⁵이라는 두 주요 어족의 확산과 연관되었을 수 있다. 후자의 계통적 통일성에 대해서는 일부 학자들이 논쟁한다¹⁶,¹⁷.
중기 신석기까지 작물 재배가 이미 지배적인 생계 전략의 지위를 차지한 황하(YR) 지역과 비교하여, 서요하(WLR) 지역의 작물 의존 수준은 기후와 고고학적 문화의 변화와 함께 자주 변했다. 예를 들어, 고식물학 및 동위원소 증거는 서요하(WLR) 사람들의 식단에서 조의 기여도가 흥륭와(興隆窪) 문화에서 홍산(紅山) 문화, 그리고 하가점하층(夏家店下層) 문화(기원전 2200-1600년)로 갈수록 꾸준히 증가했음을 시사한다¹⁸. 그러나 이후 하가점상층(夏家店上層) 문화(기원전 1000-600년)에서는 유목 목축으로 부분적으로 대체되었다. 많은 고고학자들이 이 생계 방식의 전환을 기후 변화에 대한 반응으로 연관 지었지만¹⁹,²⁰, 상당한 인간 이주가 이러한 변화를 매개했는지 여부는 아직 조사되어야 한다. 서요하(WLR) 지역은 북동쪽으로 흑룡강(AR) 지역과 인접해 있으며, 그곳의 사람들은 역사 시대까지 조, 보리, 콩의 일부 재배와 함께 수렵, 어로, 축산업에 계속 의존했다²¹,²². 황하(YR)와 서요하(WLR) 사회 간의 접촉과 상호작용이 중국 북부와 주변 지역에 걸친 조 농사의 확산에 어느 정도 영향을 미쳤는지는 거의 알려지지 않았다. 더 일반적으로, 지금까지 고대 인간 게놈의 가용성이 제한적이어서, 선사 시대의 인간 이주와 접촉, 그리고 그것이 현재 인구에 미치는 영향은 이 지역에서 여전히 잘 이해되지 않고 있다.
여기에서 우리는 중기 신석기 이후 중국 북부 전역의 주요 고고학 문화를 대표하는 다양한 고고학 유적지에서 나온 55개 고대 인간 게놈의 유전 분석을 제시한다. 그들의 유전적 프로필을 시공간적으로 비교함으로써, 우리는 이 지역의 과거 인간 이주와 혼합 사건에 대한 개요를 제공하고 이를 생계 전략의 변화와 비교한다.
결과
고대 게놈 데이터 생산
우리는 처음에 중국 북부 전역의 107명 고대인을 대상으로 개별적으로 하나의 일루미나 시퀀싱 라이브러리를 얕은 샷건 시퀀싱하여 스크리닝했다(보충 데이터 1). 이 샘플들은 흑룡강(AR) 유역(3개 유적; 기원전 5525년 ~ 서기 250년), 서요하(WLR) 유역(4개 유적; 기원전 3694년 ~ 기원전 350년), 황하(YR) 유역(10개 유적; 기원전 3550년 ~ 기원전 50년)의 19개 고고학 유적지와 섬서성(陝西省)의 중간 지역(1개 유적; 기원전 2250년 ~ 기원전 1950년) 및 내몽고(內蒙古) 자치구(1개 유적; 기원전 3550년 ~ 기원전 3050년)의 유적지에서 나왔으며, 남북으로 약 2300km의 지리적 지역을 포괄하고 6천 년의 기간을 아우른다(그림 1 및 표 1).
그림 1: 고대인 유적의 지리적 위치와 연대
a. 본 연구의 고대인 55명을 포함하는 19개 고고학 유적지의 위치다 .
각 기호는 특정 지역의 유적지에 해당한다: 원(흑룡강/AR), 사각형(서요하/WLR), 삼각형(황하/YR), 다이아몬드(내몽고/內蒙古 또는 섬서/陝西 유적지) (자세한 내용은 표 1 참고). 러시아 극동에서 발표된 초기 신석기 게놈(“악마의 문_EN”)도 표시했다. 중국 북부의 세 주요 강 유역은 다른 색상 음영으로 표시했다. 즉, 흑룡강(Amur River) 유역은 연두색, 서요하(West Liao River) 유역은 분홍색, 황하(Yellow River) 유역은 하늘색이다. 기본 지도는 ArcGIS 데스크톱 표준 v. 9.2에 포함된 ArcGIS “World Terrain Base”에서 제작했다. ArcGIS 사용자 라이선스는 막스 플랑크 인류사 과학 연구소(MPI-SHH, 예나, 독일)가 구매하고 허가받았다.
b. 본 연구에 사용된 고대 시료의 방사성 탄소 연대 측정 결과(보정 연대)와 상대 연대다.
고고학 유적지는 위치에 따라 순서대로 배열했다. SX와 IM은 각각 중국의 섬서성(陝西省)과 내몽고(內蒙古) 자치구를 의미한다. 이들의 지리적 위치는 서요하(WLR)와 황하(YR)의 중간이다. 색상은 각기 다른 시대를 나타낸다: EN(초기 신석기), MN(중기 신석기), LN(후기 신석기), BA(청동기), LBIA(후기 청동기 및 철기), IA(철기).

표 1: 본 연구에서 보고된 고대 시료 요약
AR: 흑룡강(Amur River) 유역, WLR: 서요하(West Liao River) 유역, YR: 황하(Yellow River) 유역.
a: 각 그룹에서 이용 가능한 모든 개체의 보정된 ¹⁴C 연대(2-시그마 범위)와 고고학적 맥락에서 추정된 연대를 종합한 것이다.
개별 연대는 보충 표 1에서 확인할 수 있다.
우리는 DNA 보존 상태가 충분한 55명의 개체를 상염색체 커버리지 0.03-7.53배로 추가 시퀀싱했다(표 1, 보충 표 1, 및 보충 데이터 1). 우리는 여러 척도를 통해 게놈 데이터의 진위성을 검증했다. 모든 샘플은 고대 DNA의 특징인 사후 화학적 손상을 보였다(보충 그림 1 및 보충 표 2). 샘플들은 낮은 수준의 현대인 오염을 보였다. 모든 개체의 미토콘드리아 추정치는 4% 미만이었고, 커버리지가 낮은 한 개체(커버리지 0.07배에서 6.3% 오염)를 제외한 모든 남성의 핵 추정치는 5% 미만이었다(보충 표 1 및 2). 각 샘플에 대해, Affymetrix “HumanOrigins” 플랫폼에 포함된 593,124개의 상염색체 단일염기다형성(SNP)과 “1240k-Illumina” 데이터 세트의 249,162개 SNP에 대해 단일 고품질 염기를 무작위로 샘플링하여 반수체 유전자형을 생성했다. 그런 다음 이를 발표된 고대 게놈 데이터(보충 데이터 2) 및 “HumanOrigins” 또는 “1240k-Illumina” 데이터 세트²³,²⁴의 현생 인류(보충 데이터 3)와 병합했다. 본 연구의 고대 개체는 “HumanOrigins” 패널에서 11,690-586,085개의 SNP를, “1240k-Illumina” 패널²⁵⁻²⁷에서 4,481-244,000개의 SNP를 포괄한다(보충 표 1). 그룹 기반 분석을 위해, 우리는 주로 고대 개체를 시기, 지리적 지역, 고고학적 맥락 및 유전적 프로필을 기반으로 그룹화했다(그림 2 및 표 1). 우리는 그룹 기반 분석에서 1촌 관계의 친족을 제거하여 샘플 독립성을 보장했다(보충 노트 2 및 보충 그림 2, 3).

그림 2: 고대 및 현생 동아시아 인구 집단의 유전적 프로필 요약
• a. 2077명의 현생 유라시아인으로부터 구성된 첫 두 개의 주성분 분석(PCA) 결과다.
고대인 개체들을 첫 두 주성분(PC)에 투영했다. 색으로 채워진 도형은 고대인을 나타내며, 색과 도형의 조합은 그림 1에서 사용된 것과 같다. 불투명한 원은 주성분 계산에 사용된 현생 인류 개체를 나타낸다. 퉁구스어족(Tungusic-speaking)과 한족(Han Chinese)은 각각 녹색과 보라색 음영으로 표시했다. 다른 인구 집단의 개체는 회색 음영으로 표시했다. 현생 인류 개체의 집단 라벨은 보충 그림 4에 제공된다.
• b. a에 나타난 서요하(WLR)와 황하(YR) 클러스터의 확대 시각 자료다.
• c. “1240k-Illumina” 데이터 세트에 포함된 9개 동아시아 현생 인구 집단의 개체들로 계산한 첫 두 개의 주성분 분석 결과다 .
현생 인류 개체들은 각자의 인구 집단 이름으로 표시했다.
• d. K=5일 때 “1240k-Illumina” 데이터 세트에 대한 ADMIXTURE 분석 결과다.
동아시아 인구 집단만 표시했다. 현생 인구 집단은 그들의 어족에 따라 정렬하고 색을 입혔다.
중국 북부 고대인의 유전적 그룹화
“HumanOrigins” 데이터 세트²³,²⁴에 있는 2077명의 현생 유라시아인에 대한 주성분 분석(PCA)은 중국 북부의 고대인들이 뚜렷한 그룹으로 분리됨을 보여준다(그림 2a, b 및 보충 그림 4). 고대인들은 PC1을 따라 현생 동부 유라시아인 내에 위치한다. 마찬가지로, 그들은 현생 동아시아인의 특징이며 잠재적으로 적응적 표현형과 관련된 파생 대립 유전자를 보유하고 있다²⁸⁻³⁰(보충 노트 2 및 보충 표 11). 그러나 그들은 동부 유라시아인을 대체로 남북으로 분리하는 PC2에서 다른 위치에 놓인다(북부 시베리아의 응가나산인이 맨 위에, 대만의 오스트로네시아어족 화자가 맨 아래에 위치). 본 연구의 고대인들은 세 개의 큰 클러스터를 형성한다. 흑룡강(AR) 개체는 위쪽에, 황하(YR) 개체는 아래쪽에, 서요하(WLR) 개체는 그 사이에 위치하며, 이는 대체로 그들의 지리적 기원을 반영한다. 동아시아인 내의 변이를 집중적으로 보기 위해, 우리는 고지대 티베트인을 다수 포함하는 “1240k-Illumina” 데이터 세트²⁵⁻²⁷의 9개 현생 동아시아 인구 패널을 사용했다. 첫 두 개의 주성분은 퉁구스어족 화자(예: 오로촌족, 허저족, 시버족), 티베트인, 그리고 저지대 동아시아 인구(예: 한족, 투가족)를 분리한다(그림 2c). 여기서 고대인, 특히 황하(YR)와 서요하(WLR)에서 온 사람들의 세밀한 클러스터링은 유라시아 PCA에서보다 더 잘 보인다. 비지도 ADMIXTURE 분석은 유사한 패턴을 보여준다(K=5; 그림 2d 및 보충 그림 5, 6). 모든 고대인들은 세 가지 조상 구성 요소를 가지고 있으며, 동일한 강 유역의 고대인들은 PCA 위치와 일치하는 유사한 유전적 구성을 공유한다.
흑룡강(AR) 집단의 장기적 유전적 안정성
유라시아 및 동아시아 PCA 모두에서, 상류 흑룡강(AR) 출신의 초기 신석기 수렵-채집인 2명(“AR_EN”)과 철기 시대 개인 3명(“AR_Xianbei_IA”; 서기 2세기; 선비(鮮卑) 문화) 및 유목 목축 맥락의 청동기 시대 서요하(WLR) 개인 1명(“WLR_BA_o”)은 현생 흑룡강(AR) 인구 범위 내에 속하는 긴밀한 클러스터를 형성하며, 이들은 대부분 퉁구스어족 화자이다(그림 2 및 보충 그림 4). 한 개인(AR_IA)은 흑룡강(AR) 클러스터에서 벗어나 PCA에서 PC1을 따라 몽골어족 화자 쪽으로 약간 이동했지만(그림 2a, b 및 보충 그림 4), 이는 그의 낮은 커버리지(약 0.068배)와 소량의 오염(6.3pm6.4, 점 추정치 ± 1 표준 오차 측정, s.e.m.; 보충 표 1 및 2)으로 인한 인공물일 가능성이 높다. 고대 및 현생 흑룡강(AR) 집단은 ADMIXTURE³¹ 분석에서도 유사한 유전적 프로필을 보여준다(그림 2d 및 보충 그림 6). 흑룡강(AR) 집단 쌍 사이에서, 고대인과 하류 흑룡강(AR)의 현생 샘플 모두에서 그들의 가까운 유전적 친연성을 뒷받침하는 큰 외집단-f₃ 통계량이 관찰된다(보충 그림 7, 8). 더 나아가, 우리는 그들이 대체로 서로 분기군을 형성한다는 것을 공식적으로 확인한다. 첫째, 통계량 f₄(AR₁, AR₂; X, Mbuti)는 두 현생 시베리아 인구(응가나산인 및 이텔멘인; 보충 그림 9, 10)를 제외한 대부분의 외집단 인구(X)에 대해 비유의적이다(Z < 3). 이 두 시베리아 인구는 흑룡강(AR) 관련 유전자 풀과 역사적 유전 교류를 경험했을 수 있다. 둘째, qpWave 분석은 외집단에 대한 친연성 측면에서 흑룡강(AR) 인구 쌍을 구별할 수 없다(p > 0.05; 보충 표 3A). 흑룡강(AR) 집단은 흑룡강(AR) 외부 집단과의 친연성에서 시간에 따른 상당한 변화를 보이지 않지만, 가장 엄격한 의미³²의 유전적 연속성 테스트는 본 연구의 고대 흑룡강(AR) 집단이 현생 집단의 직접적인 조상이라는 가설을 기각한다(보충 표 3B). 이는 흑룡강(AR) 유전자 풀 내의 계층화와 현생 집단 형성 과정에서 흑룡강(AR) 집단 간의 유전자 흐름이 있었을 가능성을 시사한다.
황하(YR) 유전 프로필의 시간적 변화
중원(中原) 지역의 고대 황하(YR)인들은 PCA에서 흑룡강(AR)인들과 구별되는 클러스터를 형성하며, ADMIXTURE 분석에서도 유사한 유전 프로필을 공유한다(그림 2 및 보충 그림 4). 그러나 우리는 그들 사이에 작지만 유의미한 차이점도 관찰한다. 후기 신석기 용산(龍山) 문화인(“YR_LN”)은 초기 중기 신석기 앙소(仰韶) 문화인(“YR_MN”)보다 현생 중국 남부 및 동남아시아(“SC-SEA”) 인구와 유전적으로 더 가깝다. 이는 f₄(YR_LN, YR_MN; X, Mbuti)가 양의 값을 보이는 것으로 측정된다 (X=아미족(Ami)일 때 +3.7 s.e.m.; 보충 그림 11). 이는 중기 신석기 앙소(仰韶) 문화와 후기 신석기 용산(龍山) 문화 시기 사이에 중하류 황하(YR) 지역에서 벼농사가 유의미하게 증가했다는 우리의 관찰과 유전적 유사성을 제공한다(보충 노트 2 및 보충 그림 12). 우리는 후기 청동기/철기 시대인(“YR_LBIA”)에서 더 이상의 변화를 감지하지 못했으며, 이는 비유의적인 f₄(YR_LN, YR_LBIA; X, Mbuti) 값으로 나타난다(|Z| < 3; 보충 그림 13). 흑룡강(AR) 지역과 달리, 우리는 YR_LBIA와 분기군을 형성하는 현생 인구를 찾지 못했다(보충 그림 14). 현재 중원(中原)에 거주하는 주요 민족인 한족(漢族)은 SC-SEA 인구와 분명히 추가적인 친연성을 보인다(최대 |Z| = 10.3 s.e.m.). 중국 남서부의 티베트-버마어파를 사용하는 나시족(納西族)은 고대 황하(YR) 인구와 훨씬 감소했지만 여전히 유의미한 차이를 보인다(최대 |Z| = 4.0 s.e.m.; 보충 그림 15). 이러한 결과는 시간을 초월한 황하(YR) 인구 간의 장기적인 유전적 연관성을 시사하지만, 중국 남부(예: 양자강(揚子江)) 인구의 이주에 의한 벼농사의 북방 확산과 관련될 수 있는 외인성 유전적 기여라는 중요한 축이 있음을 시사한다. 중원(中原) 주변 지역의 신석기 게놈은 황하(YR) 유전 프로필이 넓은 지리적 분포를 가졌음을 보여준다. 황하(YR)와 서요하(WLR) 사이에 위치한 중기 신석기 내몽고(內蒙古)(“Miaozigou_MN”)와 후기 신석기 섬서성(陝西省)(“Shimao_LN”)의 게놈은 서로 유전적으로 유사하며 고대 황하(YR) 인구와도 유사하다(그림 2 및 보충 그림 16, 17). 제가(齊家) 문화와 관련된 상류 황하(YR)의 후기 신석기인(“Upper_YR_LN”)도 유사한 패턴을 보인다(보충 그림 16, 17). 우리는 이 그룹들을 황하(YR) 농부와 흑룡강(AR) 수렵-채집인의 혼합으로 모델링하며, 대다수 조상(약 80%)이 황하(YR)에서 유래했다(pge0.278; 보충 표 4). 상류 황하(YR) 지역의 철기 시대 게놈(“Upper_YR_IA”)은 훨씬 더 높은 황하(YR) 기여도를 보이며, 100% 황하(YR) 조상과 호환된다(94.7pm5.3; 보충 표 4). 고고학 연구는 제가(齊家) 문화가 위치했던 티베트 고원 북동쪽 가장자리의 중고도 지역이 기원전 1600년경 이후 고원의 영구적인 인간 거주에 중추적인 역할을 했음을 시사한다³³. 더 넓게는, 최근 언어학 연구는 한장(漢藏)어족의 북방 기원설을 지지하며, 앙소(仰韶) 문화를 그 가능성 있는 기원으로 제시한다¹³,¹⁴. 우리는 혼합 모델링을 사용하여 현생 한장(漢藏)어족과 고대 황하(YR) 인구 간의 유전적 연관성을 탐구했다. 티베트인은 셰르파와 Upper_YR_LN의 혼합으로 모델링되지만, 다른 출처도 가능하다(보충 표 5). 이는 이전에 보고된 혼합 신호²⁵,³⁴에 대한 가능성 있는 지역적 출처를 제공한다. 우리 데이터 세트의 다른 한장(漢藏)어족 화자 중 나시족(納西族)과 이족(彝族)은 우리의 해상도로는 YR_MN과 구별할 수 없는 반면, 라후족(拉祜族), 투가족(土家族), 한족(漢族)은 SC-SEA 인구와 관련된 유전자 풀의 지배적인 영향을 보인다(보충 표 6). 우리의 결과는 위에서 언급한 언어학적, 고고학적 시나리오와 양립 가능하지만, 우리의 유전 데이터 해상도로 인해 다른 모델들도 한계적으로 작동함을 발견했다(보충 표 5, 6).
서요하(WLR)의 유전자와 생계 방식의 상관 변화
황하(YR)와 흑룡강(AR) 사이에 위치한 서요하(WLR) 지역은 시간에 따라 빈번한 유전적 변화를 보인다. 중기 신석기 서요하(WLR)인들은 PCA에서 흑룡강(AR)과 황하(YR) 클러스터 사이에 위치한다. 홍산(紅山) 문화에 속하는 3명(“WLR_MN”)은 황하(YR) 클러스터에 더 가깝고, 인근 유적지 출신의 1명(“HMMH_MN”)은 흑룡강(AR) 클러스터에 더 가깝게 위치한다(그림 2a-c). F₄ 통계는 두 그룹 모두 각각 AR_EN과 YR_MN으로 대표되는 흑룡강(AR)과 황하(YR) 그룹의 중간에 위치함을 확인한다(보충 그림 18). 우리는 두 그룹 모두를 흑룡강(AR)과 황하(YR) 그룹의 혼합으로 적절히 모델링하며, HMMH_MN에 대한 흑룡강(AR) 기여도가 더 높다(WLR_MN과 HMMH_MN에 대해 각각 $39.8\pm5.7%$와 75.1pm8.9; 보충 표 4). 동시대 내몽고(內蒙古)의 묘자구(Miaozigou)_MN을 고려하면, 중기 신석기 동안 약 600km 거리 내에서 주로 황하(YR) 관련 유전 프로필에서 흑룡강(AR) 관련 유전 프로필로 급격한 전환이 관찰된다(그림 3a). 언어학적으로, 서요하(WLR) 분지는 트랜스유라시아 어족의 기원과 관련이 있으며, 흑룡강(AR)과 황하(YR) 그룹 간의 혼합은 트랜스유라시아 언어 하위 그룹과 중국어 그룹 간의 차용에서 상관관계를 찾을 수 있고, 이는 청동기 시대부터 더욱 심화되었다³⁵.

그림 3: 북중국 고대 인구 집단의 qpAdm 모델링
• 고대 인구 집단을 YR_MN(황하 중기 신석기인)과 AR_EN(흑룡강 초기 신석기인)의 혼합으로 모델링했다.
• a. 본 연구의 중기 신석기 인구 집단이다 .
X축은 YR_MN 유적지로부터의 대권 거리를, Y축은 AR 관련 조상(AR_EN으로 대표됨) 비율의 추정치를 보여준다.
• b. 중기 신석기부터 청동기 시대까지의 서요하(WLR) 인구 집단이다 .
검은 사각형은 점 추정치를 나타낸다. 수직 막대는 5cM 블록 잭나이핑으로 추정된 ±1 표준 오차(s.e.m.) 범위를 나타낸다.
중기 신석기 서요하(WLR) 주변의 이러한 유전적 이질성 외에도, 서요하(WLR) 내의 시간적 비교는 흥미로운 유전적 변화 패턴을 보여준다. 첫째, 하가점하층(夏家店下層) 문화와 관련된 후기 신석기 게놈(“WLR_LN”)은 PCA에서 고대 황하(YR) 클러스터와 겹치며, WLR_MN에 비해 시베리아 인구와의 친연성이 낮다(그림 2 및 보충 그림 19). QpAdm 모델링은 주요 황하(YR) 기여도를 추정한다. AR_EN 또는 WLR_MN이 2차 출처로 사용될 때 각각 88% 또는 74%로, 이는 중기 신석기와 후기 신석기 사이에 황하(YR) 관련 인구로부터 상당한 북향 유입이 있었음을 시사한다(그림 3b 및 보충 표 4). 흥미롭게도, 하가점상층(夏家店上層) 문화와 관련된 청동기 시대 서요하(WLR)인(“WLR_BA”)은 중기-후기 신석기와는 반대 방향으로 다시 유전적 변화를 보이며, 한 개인(“WLR_BA_o”)은 고대 흑룡강(AR)인과 구별할 수 없다(보충 그림 9, 10). AR_EN과 비교하여, 그는 후기 흑룡강(AR)인(“AR_Xianbei_IA”)과 여러 현생 퉁구스어족 화자와 추가적인 친연성을 가진다(보충 그림 20). 우리는 이 개인이 흑룡강(AR) 관련 유전자 풀에서 서요하(WLR)로의 최근 이주를 의미할 수 있다고 추측한다. 실제로 나머지 두 개인(“WLR_BA”)은 WLR_LN과 WLR_BA_o의 혼합으로 모델링되며, 후자로부터 $21\pm7%$의 기여를 받았다(그림 3b 및 보충 표 7). 이전의 고고학 연구는 하가점하층(夏家店下層)에서 상층으로의 전환이 조 농사에 덜 유리한 건조한 환경으로의 기후 변화와 관련 있었고, 서요하(WLR) 지역 내에서 남향 인구 이주를 초래했다고 시사한다²⁰. 우리의 결과는 과정의 다른 측면을 강조한다. 기후 변화는 목축 경제를 더 유리하게 만들었고, 이미 이를 실행하던 사람들의 유입을 초래했을 수 있다.
토론
본 연구에서 우리는 중국 북부의 모든 주요 고고학 문화를 다루지는 못했지만, 많은 문화를 포괄하는 고대 게놈에 대한 대규모 조사를 제시한다. 특히, 우리 연구는 중국 북부 최초의 복합 사회, 즉 각각 황하(YR)와 서요하(WLR)의 앙소(仰韶) 및 홍산(紅山) 문화에 살았던 사람들에 대한 첫 번째 게놈적 시각을 제공한다. 이 지역들에서 게놈 시계열을 제공함으로써, 우리는 각 지역의 시간에 따른 유전적 변화를 감지하고 이를 외부 유전적 출처 및 사회문화적, 환경적 변화와 연관시킬 수 있었다.
제한적인 식량 생산을 했던 흑룡강(AR) 인구의 유전 프로필의 장기적인 안정성과는 대조적으로, 우리는 지난 6천 년 동안 중국 북부의 복합 조 농사 사회의 두 중심지인 황하(YR)와 서요하(WLR)에서 빈번한 유전적 변화를 관찰한다. 서요하(WLR) 유전 프로필은 생계 전략의 변화와 밀접하게 연관되어 시간에 따라 변한다. 더 구체적으로, 중기-후기 신석기 사이에 조 농사에 대한 의존도 증가는 후기 신석기 서요하(WLR)에서 더 높은 황하(YR) 유전적 친연성과 관련이 있으며, 청동기 시대 하가점상층(夏家店上層) 문화에서 목축으로의 부분적 전환은 더 낮은 황하(YR) 친연성과 관련이 있다. 중기 신석기 시대에 우리는 서요하(WLR) 주변에서 황하(YR) 관련 유전 프로필에서 흑룡강(AR) 관련 유전 프로필로의 급격한 전환을 관찰한다. 이러한 공간적 유전적 이질성은 청동기 및 철기 시대 동안 서요하(WLR)에서 지속되었을 수 있지만, 현재 우리의 데이터는 그러한 가설을 테스트하기에 충분하지 않다. 황하(YR)의 중기-후기 신석기 유전적 변화는 또한 중원(中原)에서의 벼농사 강화와 일치하며, 이는 인구 확산을 통한 생계 전략 변화의 또 다른 사례를 제공할 수 있다. 우리는 현재 데이터 세트에 중원(中原)으로 벼농사를 가져왔을 수 있는 후보 원천 인구의 고대 게놈이 부족하다는 점을 인정하며, 특히 산동(山東) 및 양자강(揚子江) 하류 지역의 신석기 시대 사람들에 대한 고고유전학 연구를 촉구한다. 중국 전역, 특히 최초 농부들의 게놈에 대한 향후 연구는 본 연구에서 보고된 게놈의 대표성을 테스트하고, 우리가 감지한 유전적 변화를 더 미세한 유전적, 고고학적, 지리적 규모에서 이해하며, 고고학적 문화, 언어, 유전자 간의 진화적 상관관계를 테스트하는 데 중요할 것이다.
연구 방법
실험실 절차
우리는 처음에 107개의 고대 샘플(보충 데이터 1)을 중국 길림대학교(吉林大學校)의 고대 DNA 연구소 전용 청정 시설에서 DNA 추출 및 라이브러리 준비에 관한 기존 프로토콜에 따라 스크리닝했다³⁶,³⁷. 샘플링 전에 모든 골격 요소를 5% 표백제로 닦고 각 면에서 30분 동안 자외선을 조사했다. 치과용 드릴(Dremel, 미국)을 사용하여 치아를 뚫어 미세 분말을 얻었다. 우리는 먼저 샌드블라스터(Renfert, 독일)를 사용하여 외부 부분을 제거한 다음, 믹서 밀(Retsch, 독일)로 깨끗한 내부 부분을 미세 분말로 분쇄하여 측두골 암양부의 조밀한 부분을 샘플링했다. 분말(50-100mg)을 900µl의 0.5M EDTA(Sigma-Aldrich), 16.7µl의 단백질 분해효소 K(Sigma-Aldrich), 83.3µl의 ddH₂O(Thermo Fisher, 미국)에 넣고 37°C에서 18시간 동안 분해했다. 그 후 상층액을 13ml의 맞춤형 결합 버퍼[5M 구아니딘 염산염(MW 95.53), 40% 이소프로판올, 90mM 아세트산 나트륨(3M), 0.05% Tween-20]와 완전히 혼합한 후 MinElute 실리카 스핀 컬럼(QIAGEN, 독일)으로 옮기고 PE 버퍼(80% 에탄올)로 두 번 세척했다. 그런 다음 DNA를 100µl의 TET 버퍼(QIAGEN, 독일)로 용출했다. 각 추출물의 20µl 분취액에서 이중 가닥 이중 인덱스 라이브러리 하나를 준비했다. T4 폴리뉴클레오티드 키나아제(0.5U˜/mul; Thermo Fisher)와 T4 DNA 중합효소(0.08U; Thermo Fisher)를 첨가하여 DNA 단편의 무딘 말단을 복구하고, 25°C에서 15분간 배양했다. 복구된 DNA 단편을 표준 MinElute 정제 단계(Qiagen, 독일)를 사용하여 회수한 다음, 18µl의 TET(Qiagen, 독일)로 용출했다. 총 반응 부피 40µl에서 1X Quick Ligase(New England Biolabs, NEB)를 사용하여 일루미나 어댑터(0.25µM 어댑터 혼합물)를 무딘 말단에 연결한 후, 또 다른 MinElute 정제 단계를 수행했다. 최종 채움 단계는 1X 등온 버퍼, 0.4U/mul Bst 중합효소(NEB) 및 250µM dNTP 혼합물(Thermo Fisher)을 첨가하여 수행했으며, 37°C에서 30분간 배양한 후 80°C에서 20분간 배양했다. 그런 다음 고유하게 결합된 이중 인덱스로 라이브러리에 인덱스를 추가했다. 인덱싱된 산물을 AMPure XP 비드(Beckman Coulter Ltd)를 사용하여 정제했다. 정제된 라이브러리는 Qubit 2.0(Thermo Fisher)으로 정량화했다. 그런 다음 라이브러리를 중국의 Annoroad Company에서 Illumina HiSeq X10 기기를 사용하여 150bp 페어드 엔드 시퀀싱 설계로 시퀀싱했다.
서열 데이터 처리
두 개의 8bp 인덱스 서열 각각에서 하나의 불일치를 허용하여 서열 리드를 디멀티플렉싱했다. AdapterRemoval v2.2.0³⁸을 사용하여 일루미나 시퀀싱 어댑터를 잘라냈다. 병합된 리드를 인간 참조 게놈(hs37d5; GRCh37 및 디코이 서열)에 BWA v0.7.12³⁹를 사용하여 매핑했다. DeDup v0.12.2⁴⁰를 사용하여 PCR 중복을 제거했다. 사후 DNA 손상이 유전자형 분석에 미치는 영향을 최소화하기 위해, 각 라이브러리의 DNA 오결합 패턴을 기반으로 bamUtils v1.0.13⁴¹의 trimbam 기능을 사용하여 각 리드의 양쪽 끝에서 최대 10bp까지 소프트 마스킹하여 추가적인 “트림된” BAM 파일을 준비했다. “1240k” 패널⁴²,⁴³의 SNP에 대해, pileupCaller 프로그램(https://github.com/stschiff/sequenceTools)을을) 사용하여 단일 고품질 염기(Phred 스케일 염기 품질 점수 30 이상)를 무작위로 샘플링하여 유사 이배체 유전자형으로 만들었다. C/T 및 G/A SNP의 경우 트림된 BAM 파일을 사용했다. 나머지 SNP의 경우 트림되지 않은 BAM 파일을 사용했다.
참조 데이터 세트
우리는 고대 개체를 두 가지 전 세계 유전자형 패널 세트와 비교했다. 하나는 Affymetrix HumanOrigins Axiom Genome-wide Human Origins 1 어레이(“HumanOrigins”; 상염색체 SNP 593,124개)²³를 기반으로 하고, 다른 하나는 여러 Illumina 어레이 플랫폼을 교차하는 것(‘1240k-Illumina’; 상염색체 SNP 249,162개)²⁵⁻²⁷을 기반으로 한다. 후자는 한장(漢藏)어족 화자에 대한 심층 분석을 위해 더 많은 티베트/셰르파 게놈(티베트인 30명, 셰르파 45명)을 포함한다. 우리는 Simons Genome Diversity Panel⁴⁴과 발표된 고대 게놈(보충 데이터 2)을 추가하여 두 데이터 세트를 보강했다.
고대 DNA 인증
우리는 중국 북부의 고대 게놈 품질을 평가하기 위해 여러 방법을 사용했다. 첫째, mapDamage v2.0.6⁴⁵을 사용하여 고대 DNA에 예상되는 사후 화학적 변형 패턴을 표로 만들었다. 둘째, Schmutzi v1.5.1⁴⁶을 사용하여 모든 개체의 미토콘드리아 오염률을 추정했다. 셋째, ANGSD v0.910⁴⁷에 구현된 X 염색체 데이터를 기반으로 남성의 핵 게놈 오염률을 측정했다. 남성은 X 염색체 사본을 하나만 가지므로, 동일한 다형성 위치에 정렬된 염기 간의 불일치가 시퀀싱 오류 수준을 넘어서면 오염의 증거로 간주된다.
유전적 성별 판정 및 단일부모 유전 하플로그룹 할당
우리는 X 및 Y 염색체 커버리지 비율을 상염색체와 비교하여 고대 샘플의 분자적 성별을 결정했다⁴⁸. 우리는 Geneious v11.1.3 소프트웨어를 사용하여 고대 개체의 mtDNA 컨센서스 서열을 생성한 다음 HaploGrep2⁵⁰를 사용하여 mtDNA 하플로그룹을 결정했다. 우리는 ISOGG 데이터베이스의 25,660개 진단 위치 세트를 검사하여 남성 Y 염색체 하플로그룹을 결정하고, 가장 하위의 파생 SNP에 의해 최종 하플로그룹을 할당했다(보충 표 2).
집단 구조 분석
우리는 “HumanOrigins” 데이터 세트의 2077명 현생 유라시아인 집합과 “1240k-Illumina” 데이터 세트의 266명 동아시아인 하위 집합을 사용하여 smartpca v16000⁵¹에 구현된 PCA를 “lsqproject: YES” 및 “shrinkmode: YES” 옵션으로 수행했다. 또한 ADMIXTURE v1.3.0³¹으로 비지도 혼합 분석을 수행했다. 우리는 부대립유전자 빈도가 1% 미만인 유전적 마커를 제거하고 PLINK v1.90⁵²의 “–indep-pairwise 200 25 0.2” 옵션을 사용하여 연관 불균형을 가지치기했다.
유전적 관련성 분석
우리는 쌍별 불일치율(pmr)⁵³과 lcMLkin 0.5.0⁵⁴을 사용하여 고대 개체 간의 유전적 관련성을 결정했다. 우리는 1240k 패널¹²의 상염색체 SNP를 사용하여 모든 고대 북중국인 쌍에 대해 pmr을 계산하고, 품질이 낮은 샘플 간의 인위적인 편향을 최소화하기 위해 양쪽 모두에서 최소 8000개의 SNP가 커버되는 개체 쌍을 유지했다. 그런 다음 lcMLkin을 사용하여 관련성의 더 자세한 내용을 추정했다.
F-통계
우리는 아프리카 외집단으로부터 분기된 이후 두 집단 간의 유전적 관계를 측정하기 위해 외집단-f 통계⁵⁵,⁵⁶를 사용했다. 우리는 admixtools⁵⁶의 “f4mode: YES” 기능을 사용하여 f₄ 통계를 계산했다. F₃ 및 f₄ 통계는 admixtools 패키지의 qp3Pop v435 및 qpDstat v755를 사용하여 계산했다.
qpAdm을 이용한 혼합 모델링
우리는 qpWave/qpAdm 프레임워크(qpWave v410 및 qpAdm v810)⁴³를 사용하여 우리의 고대 북중국인 집단을 모델링했다. 우리는 “HumanOrigins” 및 “1240k-Illumina” 데이터 세트 모두에 있는 다음 9개 집단을 외집단(“OG1”)으로 사용했다: 음부티(Mbuti), 나투프인(Natufian), 옹게(Onge, “1240k-Illumina” 패널에서는 Onge.DG), 이란_신석기인(Iran_N), 빌라브루나(Villabruna), 미헤(Mixe, “1240k-Illumina” 패널에서는 Mixe.DG), 아미(Ami, “1240k-Illumina” 패널에서는 Ami.DG), 응가나산인(Nganasan), 이텔멘인(Itelmen, “1240k-Illumina” 패널에서는 Itelmen.DG). 이 집합에는 아프리카 외집단(음부티), 초기 홀로세 레반트 수렵-채집인(나투프인), 안다만 제도 원주민(옹게), 테페 간즈 다레 유적지의 초기 신석기 이란인(이란_N), 후기 홍적세 유럽 수렵-채집인(빌라브루나), 중앙 아메리카 원주민(미헤), 대만 원주민(아미), 북 시베리아 타이미르 반도에 거주하는 사모예드족(응가나산인), 러시아 캄차카 반도 원주민(이텔멘인)이 포함된다. 일부 흑룡강(AR) 집단이 응가나산인 및 이텔멘인과 증가된 유전적 친연성을 보이는 것을 감안하여(보충 그림 9, 10), 우리는 OG1에서 응가나산인과 이텔멘인을 제외한 외집단을 사용하여 흑룡강(AR) 및 인근 집단을 추가로 모델링했다.
유전적 연속성 테스트
고대 및 현생 흑룡강(AR) 인구 쌍에 대해, 우리는 발표된 방법³²을 사용하여 고대 개체가 현생 인구의 직접적인 조상 인구에 배치될 수 있는지 테스트했다. 이 방법은 https://github.com/Schraiber/continuity에서 다운로드했다. 구체적으로, 우리는 반수체 유전자형 분석에 사용된 파일업 테이블에서 고대 개체의 리드 카운트 데이터를 준비하고, eigenstrat 형식 유전자형 데이터에서 5개 현생 흑룡강(AR) 인구(Evenk_FarEast, Nanai, Negidal, Nivh, Ulchi)의 대립유전자 카운트 데이터를 준비했다. HumanOrigins 패널의 593,124개 상염색체 SNP에서 시작하여, 각 현생 인구에서 고정된 SNP를 제외하고 고대 개체에 대해 기본 커버리지 필터(min_cutoff 2.5, max_cutoff = 97.5; 가장 극단적인 커버리지를 가진 5% 이하의 사이트 제거)를 적용했다. 분석에 사용된 나머지 SNP에 대해, 우리는 현생 인구의 상대적으로 작은 샘플 크기를 고려하기 위해 현생 인구의 대립유전자 카운트 분포에 대해 베타 사전 분포를 적용했다. 그런 다음 연속성을 가정하는 모델(t_2=0; 고대 개체에 고유한 유전적 부동 없음; 귀무가설)과 그렇지 않은 모델(t_20; 대립가설)의 우도(likelihood)를 계산했다. 우도비 검정은 유전적 연속성을 테스트하기 위한 p값을 제공한다.
보고 요약
연구 설계에 대한 추가 정보는 이 기사에 링크된 Nature Research Reporting Summary에서 확인할 수 있다.
데이터 가용성
원시 FastQ 및 정렬 파일(BAM 형식)은 유럽 뉴클레오타이드 아카이브에서 접속 번호 PRJEB36297로 이용할 수 있다. 본 연구의 고대 개체에 대한 1240k 패널의 반수체 유전자형 데이터는 다음 링크에서 EIGENSTRAT 형식으로 이용할 수 있다: https://edmond.mpdl.mpg.de/imeji/collection/50V1TtHlsYggGBT3.
코드 가용성
본 연구에서 수행된 모든 분석은 공개적으로 이용 가능한 프로그램을 기반으로 한다. 프로그램 이름, 버전 및 기본이 아닌 옵션은 “연구 방법” 섹션에 설명되어 있다.
References
- Zuo, X. et al. Dating rice remains through phytolith carbon-14 study reveals domestication at the beginning of the Holocene. Proc. Natl Acad. Sci. USA 114, 6486–6491 (2017).
- Stevens, C. J. & Fuller, D. Q. The spread of agriculture in eastern Asia: archaeological bases for hypothetical farmer/language dispersals. Lang. Dyn. Change 7, 152–186 (2017).
- Yang, X. et al. Early millet use in northern China. Proc. Natl Acad. Sci. USA 109, 3726–3730 (2012).
- Liu, X., Jones, M. K., Zhao, Z., Liu, G. & O’Connell, T. C. The earliest evidence of millet as a staple crop: new light on neolithic foodways in North China. Am. J. Phys. 149, 283–290 (2012).
- Zhao, Z. New archaeobotanic data for the study of the origins of agriculture in China. Curr. 52, S295–S306 (2011).
- Lu, H. et al. Earliest domestication of common millet (Panicum miliaceum) in East Asia extended to 10,000 years ago. Proc. Natl Acad. Sci. USA 106, 7367–7372 (2009).
- Diao, X. Production and genetic improvement of minor cereals in China. Crop J. 5, 103–114 (2017).
- Ma, Z., Yang, X., Zhang, C., Sun, Y. & Jia, X. Early millet use in West Liaohe area during early-middle Holocene. Sci. China Earth Sci. 59, 1554–1561 (2016).
- Jia, X. et al. Spatial and temporal variations in prehistoric human settlement and their influencing factors on the south bank of the Xar Moron River, Northeastern China. Front. Earth Sci. 11, 137–147 (2017).
- Peterson, C. E., Lu, X., Drennan, R. D. & Zhu, D. Hongshan chiefly communities in Neolithic northeastern China. Proc. Natl Acad. Sci. USA 107, 5756–5761 (2010).
- Hsu, C. China: A New Cultural History. (Columbia University Press, 2012).
- Zhang, H., Bevan, A. & Guo, D. The neolithic ceremonial complex at Niuheliang and Wider Hongshan Landscapes in Northeastern China. J. World Prehistory 26, 1–24 (2013).
- Zhang, M., Yan, S., Pan, W. & Jin, L. Phylogenetic evidence for Sino-Tibetan origin in northern China in the Late Neolithic. Nature 569, 112–115 (2019).
- Sagart, L. et al. Dated language phylogenies shed light on the ancestry of Sino-Tibetan. Proc. Natl Acad. 116, 10317–10322 (2019).
- Robbeets, M. & Bouckaert, R. Bayesian phylolinguistics reveals the internal structure of the Transeurasian family. J. Lang. 3, 145–162 (2018).
- Johanson, L. & Robbeets, M. The high and low spirits of Transeurasian language studies, in Transeurasian Verbal Morphology in A Comparative Perspective: Genealogy, Contact, Chance. (Turcologica 78) 7–20 (Harrassowitz, Wiesbaden, 2010).
- Robbeets, M. The History of the debate, in Transeurasian Linguistics, Vol. 1, 225–229 (Routledge, London, 2017).
- Zhang, X., Liu, G., Wang, M. & Lv, P. Stable istopic analysis of human remains from Xinglonggou site (In Chinese). Nanfang Wenwu 4, 185–195 (2017).
- Cheung, C., Zhang, H., Hepburn, J. C., Yang, D. Y. & Richards, M. P. Stable isotope and dental caries data reveal abrupt changes in subsistence economy in ancient China in response to global climate change. PLoS ONE 14, e0218943 (2019).
- Jia, X. et al. The transition of human subsistence strategies in relation to climate change during the Bronze Age in the West Liao River Basin, Northeast China. Holocene 26, 781–789 (2016).
- Kuzmin, Y. V. The beginnings of prehistoric agriculture in the Russian Far East: Current evidence and concepts. Doc. 40, 1–12 (2013).
- Black, L. People of the Amur and Maritime Regions. in Crossroads of Contenients: Cultures of Siberia and Alaska 24–31 (Smithsonian Institution Press, 1988).
- Jeong, C. et al. The genetic history of admixture across inner Eurasia. Nat. Ecol. 3, 966–976 (2019).
- Jeong, C. et al. Bronze Age population dynamics and the rise of dairy pastoralism on the eastern Eurasian steppe. Proc. Natl Acad. Sci. USA 115, E11248–E11255 (2018).
- Jeong, C. et al. Admixture facilitates genetic adaptations to high altitude in Tibet. Nat. 5, 3281 (2014).
- Li, J. Z. et al. Worldwide human relationships inferred from genome-wide patterns of variation. Science 319, 1100–1104 (2008).
- Wang, B. et al. On the origin of Tibetans and their genetic basis in adapting high-altitude environments. PLoS ONE 6, e17002 (2011).
- Kamberov, Y. G. et al. Modeling recent human evolution in mice by expression of a selected EDAR variant. Cell 152, 691–702 (2013).
- Yoshiura, K. et al. A SNP in the ABCC11 gene is the determinant of human earwax type. Nat. 38, 324–330 (2006).
- Kimura, R. et al. A common variation in EDAR is a genetic determinant of shovel-shaped incisors. Am. J. Hum. 85, 528–535 (2009).
- Alexander, D. H., Novembre, J. & Lange, K. Fast model-based estimation of ancestry in unrelated individuals. Genome Res. 19, 1655–1664 (2009).
- Schraiber, J. G. Assessing the relationship of ancient and modern populations. Genetics 208, 383–398 (2018).
- Chen, F. H. et al. Agriculture facilitated permanent human occupation of the Tibetan Plateau after 3600 B.P. Science 347, 248–250 (2015).
- Jeong, C. et al. A longitudinal cline characterizes the genetic structure of human populations in the Tibetan plateau. PLoS ONE 12, e0175885 (2017).
- Robbeets, M. Proto-transeurasian: where and when? Man India 95, 921–946 (2017).
- Dabney, J. et al. Complete mitochondrial genome sequence of a Middle Pleistocene cave bear reconstructed from ultrashort DNA fragments. Proc. Natl Acad. Sci. USA 110, 15758–15763 (2013).
- Korlević, P. et al. Reducing microbial and human contamination in DNA extractions from ancient bones and teeth. BioTechniques 59, 87–93 (2015).
- Schubert, M., Lindgreen, S. & Orlando, L. AdapterRemoval v2: rapid adapter trimming, identification, and read merging. BMC Res. Notes 9, 88 (2016).
- Li, H. & Durbin, R. Fast and accurate long-read alignment with Burrows-Wheeler transform. Bioinformatics 26, 589–595 (2010).
- Peltzer, A. et al. EAGER: efficient ancient genome reconstruction. Genome Biol. 17, 60 (2016).
- Jun, G., Wing, M. K., Abecasis, G. R. & Kang, H. M. An efficient and scalable analysis framework for variant extraction and refinement from population-scale DNA sequence data. Genome Res. 25, 918–925 (2015).
- Mathieson, I. et al. Genome-wide patterns of selection in 230 ancient Eurasians. Nature 528, 499–503 (2015).
- Haak, W. et al. Massive migration from the steppe was a source for Indo-European languages in Europe. Nature 522, 207–211 (2015).
- Mallick, S. et al. The Simons Genome Diversity Project: 300 genomes from 142 diverse populations. Nature 538, 201–206 (2016).
- Jónsson, H., Ginolhac, A., Schubert, M., Johnson, P. L. F. & Orlando, L. mapDamage2.0: fast approximate Bayesian estimates of ancient DNA damage parameters. Bioinforma. Oxf. 29, 1682–1684 (2013).
- Renaud, G., Slon, V., Duggan, A. T. & Kelso, J. Schmutzi: estimation of contamination and endogenous mitochondrial consensus calling for ancient DNA. Genome Biol. 16, 224 (2015).
- Korneliussen, T. S., Albrechtsen, A. & Nielsen, R. ANGSD: analysis of next generation sequencing data. BMC Bioinforma. 15, 356 (2014).
- Fu, Q. et al. The genetic history of Ice Age Europe. Nature 534, 200–205 (2016).
- Kearse, M. et al. Geneious basic: an integrated and extendable desktop software platform for the organization and analysis of sequence data. Bioinforma. Oxf. 28, 1647–1649 (2012).
- Weissensteiner, H. et al. HaploGrep 2: mitochondrial haplogroup classification in the era of high-throughput sequencing. Nucleic Acids Res. 44, W58–W63 (2016).
- Patterson, N., Price, A. L. & Reich, D. Population structure and eigenanalysis. PLoS Genet. 2, e190 (2006).
- Chang, C. C. et al. Second-generation PLINK: rising to the challenge of larger and richer datasets. GigaScience 4, 7 (2015).
- Kennett, D. J. et al. Archaeogenomic evidence reveals prehistoric matrilineal dynasty. Nat. 8, 14115 (2017).
- Lipatov, M., Sanjeev, K., Patro, R. & Veeramah, K. R. Maximum likelihood estimation of biological relatedness from low coverage sequencing data. Preprint at https://www.biorxiv.org/content/10.1101/023374vl (2015).
- Raghavan, M. et al. Upper Palaeolithic Siberian genome reveals dual ancestry of Native Americans. Nature 505, 87–91 (2014).
- Patterson, N. et al. Ancient admixture in human history. Genetics 192, 1065–1093 (2012).
- Sikora, M. et al. The population history of northeastern Siberia since the Pleistocene. Nature 570, 182–188 (2019).
- Siska, V. et al. Genome-wide data from two early Neolithic East Asian individuals dating to 7700 years ago. Sci. 3, e1601877 (2017).