출처:

Siska, Veronika, et al. “Genome-wide data from two early Neolithic East Asian individuals dating to 7700 years ago.” Science advances 3.2 (2017): e1601877.

 

Genome-wide data from two early Neolithic East Asian individuals dating to 7700 years ago

7,700년 전 동아시아 초기 신석기인 두 명의 ‘전체 유전체(DNA)’ 분석 결과

베로니카 시스카(Veronika Siska),1* 에피 루스 존스(Eppie Ruth Jones),1,2 전성원(Sungwon Jeon),3 박영준(Youngjune Bhak),3 김학민(Hak-Min Kim),3 조윤성(Yun Sung Cho),3 김현호(Hyunho Kim),4 이규상(Kyusang Lee),5 엘리자베타 베셀로프스카야(Elizaveta Veselovskaya),6 타티아나 발루에바(Tatiana Balueva),6 마르코스 가예고-요렌테(Marcos Gallego-Llorente),1 미카엘 호프라이터(Michael Hofreiter),7 대니얼 G. 브래들리(Daniel G. Bradley),2 아네르스 에릭손(Anders Eriksson),1 론 핀하시(Ron Pinhasi),8*† 박종화(Jong Bhak),3,4*†‡ 안드레아 마니카(Andrea Manica)1*†

  • 1 Department of Zoology, University of Cambridge, Downing Street, Cambridge CB23EJ, U.K. 2 Smurfit Institute of Genetics, Trinity College Dublin, Dublin, Ireland. 3 The Genomics Institute, Ulsan National Institute of Science and Technology, Ulsan 44919, Republic of Korea. 4 Geromics, Ulsan 44919, Republic of Korea. 5 Clinomics Inc., Ulsan 4919, Republic of Korea. 6 Institute of Ethnology and Anthropology, Russian Academy of Sciences, Moscow, Russia. 7 Institute for Biochemistry and Biology, Faculty for Mathematics and Natural Sciences, University of Potsdam, Karl-Liebknecht-Str. 24-25, 14476 Potsdam-Golm, Germany. 8 School of Archaeology and Earth Institute, University College Dublin, Dublin, Ireland.
  • 1 영국 케임브리지 케임브리지 대학교 동물학과 (Department of Zoology, University of Cambridge, Downing Street, Cambridge CB23EJ, U.K.).
  • 2 아일랜드 더블린 더블린 트리니티 칼리지 스머핏 유전학 연구소 (Smurfit Institute of Genetics, Trinity College Dublin, Dublin, Ireland).
  • 3 대한민국 울산 울산과학기술원 유전체 연구소 (The Genomics Institute, Ulsan National Institute of Science and Technology, Ulsan 44919, Republic of Korea).
  • 4 대한민국 울산 게로믹스 (Geromics, Ulsan 44919, Republic of Korea).
  • 5 대한민국 울산 클리노믹스 주식회사 (Clinomics Inc., Ulsan 4919, Republic of Korea).
  • 6 러시아 모스크바 러시아 과학 아카데미 민족학 및 인류학 연구소 (Institute of Ethnology and Anthropology, Russian Academy of Sciences, Moscow, Russia).
  • 7 독일 포츠담-골름 포츠담 대학교 수학 및 자연 과학 학부 생화학 및 생물학 연구소 (Institute for Biochemistry and Biology, Faculty for Mathematics and Natural Sciences, University of Potsdam, Karl-Liebknecht-Str. 24-25, 14476 Potsdam-Golm, Germany).
  • 8 아일랜드 더블린 유니버시티 칼리지 더블린 고고학 및 지구 연구소 (School of Archaeology and Earth Institute, University College Dublin, Dublin, Ireland).
  • *Corresponding author. Email: vs389@cam.ac.uk (V.S.); ron.pinhasi@ucd.ie (R.P.); jongbhak@genomics.org (J.B.); am315@cam.ac.uk (A.M.) †These authors contributed equally to this work. ‡Adjunct professor at Seoul National University, Seoul, Republic of Korea.

 

[논문요약] 약 7,700년 전 신석기 시대 동아시아인의 유전체 분석

이 연구는 러시아한국 접경 지역에 위치한 데블스 게이트(Devil’s Gate) 동굴에서 발견된 약 7,700년 전 신석기 시대 수렵채집인 두 명의 유전체(몸 전체 DNA 설계도)를 분석했다. 연구 결과, 이 고대 인류는 오늘날 아무르강 유역에 사는 퉁구스어 계열의 소수 민족인 울치족과 유전적으로 가장 유사했다. 이는 서유라시아에서 신석기 혁명과 함께 대규모 인구 이동이 일어난 것과 달리, 동아시아의 이 지역에서는 약 7,700년 동안 유전적 연속성이 매우 높게 유지되었음을 보여준다. 또한, 이 고대 데블스 게이트 인류는 현대 한국인일본인의 조상을 이해하는 데 중요한 초기 동아시아 인구 집단 중 하나임을 확인했다.

1. 배경: 아직 풀리지 않은 동아시아의 신석기 역사

신석기 시대는 인류가 수렵채집 생활에서 농경 생활로 전환하기 시작한 시기이다. 서유라시아(유럽과 서아시아)에서는 고대 유전체 분석을 통해 농경의 확산과 함께 대규모 인구가 이동하며 유전적 구조가 크게 변화했다는 사실을 밝혀냈다.

하지만 농경이 근동 지역보다 약 3천 년 늦게 독자적으로 발생한 동아시아 지역의 고대 인구 이동 역사와 유전적 연속성은 잘 알려지지 않았다. 이 논문은 러시아 연해주에 위치한 데블스 게이트 동굴에서 발굴된 두 명의 신석기 시대 수렵채집인(DevilsGate1, DevilsGate2)의 유전체 데이터 분석을 통해 이 공백을 채우고자 했다.

2. 연구 결과 1: 현대 아무르 인구와의 놀라운 연속성

연구진은 주성분 분석(PCA)과 ADMIXTURE 분석을 사용해 데블스 게이트 인류의 유전적 위치를 파악했다.

1) 인구 구조 분석 (PCA 및 ADMIXTURE)

PCA는 복잡한 유전체 데이터를 간단하게 지도처럼 펼쳐 집단 간의 거리를 보여주는 방법이다. ADMIXTURE는 여러 조상 집단이 어떻게 섞였는지 추정하는 통계 기법이다.

  • 그림 지역 참조 패널, PCA 및 ADMIXTURE 분석. (A) 데블스 게이트의 위치와 분석을 위한 지역 패널을 구성하는 현대 인구의 위치를 보여주는 아시아 지도이다. (B) 동아시아 및 중앙 아시아의 현대 인구로 구성된 지역 패널에 의해 정의된 첫 번째 두 개의 주성분(PC)을 보여주는 플롯으로, 데블스 게이트의 두 샘플(검은색 삼각형)을 그 위에 투영했다 (18). (C) 데블스 게이트와 지역 패널에 대해 수행된 ADMIXTURE 분석 (19) 결과로, K=5 (가장 낮은 교차 검증 오류)와 K=8 (데블스 게이트 특이 클러스터의 출현)인 경우를 나타냈다.

분석 결과, 두 데블스 게이트 샘플은 동아시아시베리아 인구 중에서도 오늘날 아무르강 유역에 사는 현대 집단, 특히 울치족과 가장 가까이 뭉쳤다.

2) 유전적 부동 및 지리적 관계 분석 (Outgroup f3)

Outgroup f3 통계량아프리카코마니족을 기준점(아웃그룹)으로 삼아, 데블스 게이트 인류가 다른 현대 인류와 얼마나 공통된 유전적 부동(유전적 유사성)을 공유하는지 측정했다.

  • 그림 Outgroup f3 통계량. Outgroup f3아프리카 아웃그룹(코마니)을 기준으로 데블스 게이트(검은색 삼각형은 샘플링 위치를 나타냄)와 현대 인구 사이에 공유된 유전적 부동을 측정한다. (B) 데블스 게이트와 가장 높은 공유 부동을 보이는 15개 인구를 그림 1에서와 같이 지역별로 색상 코드를 지정했다.

결과는 PCA와 일치하여, 울치족나나이족 같은 아무르강 유역 집단이 가장 높은 유전적 유사성을 보였다.

더 나아가, 이 유전적 유사성이 지리적 거리와도 강한 상관관계를 보였다.

  • 그림 Outgroup f3 통계량의 공간적 패턴. 데블스 게이트로부터 육지 거리와 Outgroup f3 사이의 관계를 나타낸다. 데블스 게이트로부터 최대 9,000 km 떨어진 인구들을 고려했다. 최적의 선형 적합 (r2=0.772, F1,108=368.4, P<0.001)은 파란색 선으로 표시되며, 95% 신뢰 구간(CI)은 음영 영역으로 나타낸다.

이러한 결과는 데블스 게이트가 위치한 아무르강 유역 지역이 신석기 시대부터 현재까지 외부 인구와의 혼합이 적었으며, 유전적 연속성이 매우 높게 유지되었음을 시사한다. 이는 농경이 확산되면서 대규모 인구 이동과 교체가 일어난 서유라시아와는 뚜렷이 대비되는 패턴이다.

3. 연구 결과 2: 한국인과 일본인 조상에 대한 시사점

혼합(Admixture) f3 통계량 분석은 현대 한국인일본인데블스 게이트 인류와 다른 조상 집단들이 섞여서 만들어진 혼합 집단인지 확인하는 데 사용됐다.

  • 그림 혼합(Admixture) f3 통계량. 현대 한국인일본인을 두 인구(X와 Y)의 혼합으로 나타내는 혼합 f3를 보여주며… (B) 일본인을 대상으로 했을 때, 유의미하게 (z<-2) 음수 점수를 주는 4쌍 전체.

분석 결과, 데블스 게이트 인류는 현대 한국인일본인의 초기 동아시아 조상 성분으로 간주될 수 있었다. 특히 일본인의 경우, 데블스 게이트 인류와 다른 집단(예: 고대 대만이나 동남아시아 집단)을 혼합하여 현대 일본인유전적 구성을 잘 설명할 수 있었다. 이는 데블스 게이트 인류가 신석기 시대 이후 동아시아 인구 형성 역사에서 중요한 역할을 했음을 의미한다.

4. 기능성 SNP 분석: 형질 관련 유전자

연구진은 데블스 게이트 인류가 어떤 신체적 특징을 가졌는지 알아보기 위해 피부색, 머리카락, 알코올 대사 등과 관련된 특정 SNP(유전자 변이)를 조사했다.

  • 피부색: 동아시아인에게서 밝은 피부색과 연관된 유전자 변이(SLC24A5)를 보유하고 있었으며, 이는 신석기 시대 초기부터 이미 밝은 피부색을 갖는 유전자가 이 지역에 존재했음을 보여준다.
  • 머리카락: 동아시아인의 두꺼운 머리카락과 연관된 유전자 변이(EDAR) 역시 갖고 있었다.
  • 알코올 대사: 알코올을 분해하는 능력을 떨어뜨려 술에 약하게 만드는 유전자 변이(ALDH2)는 없었다. 이는 이 변이가 신석기 시대 이후에 동아시아 지역에서 나타나거나 퍼졌음을 시사한다.

5. 결론 및 의의

데블스 게이트 유전체 분석은 다음과 같은 결론을 제시한다.

  1. 아무르강 유역은 약 7,700년 전 신석기 시대부터 현재까지 유전적 연속성이 매우 높게 유지된 지역이다. 이는 신석기 농경의 확산과 함께 대규모 인구 교체가 일어난 서유라시아의 역사와는 크게 다른 패턴이다.
  2. 데블스 게이트 인류는 현대 동아시아 인구, 특히 한국인과 일본인의 유전적 조상 중 하나로, 동아시아의 인구 형성과정에 대한 중요한 고대 증거를 제공했다. 이 연구는 앞으로 동아시아 지역의 고대 유전체 연구를 위한 중요한 참조점을 제공한다는 의의가 있다.

 

[논문번역]

Ancient genomes have revolutionized our understanding of Holocene prehistory and, particularly, the Neolithic transition in western Eurasia. In contrast, East Asia has so far received little attention, despite representing a core region at which the Neolithic transition took place independently ~3 millennia after its onset in the Near East. We report genome-wide data from two hunter-gatherers from Devil’s Gate, an early Neolithic cave site (dated to ~7.7 thousand years ago) located in East Asia, on the border between Russia and Korea. Both of these individuals are genetically most similar to geographically close modern populations from the Amur Basin, all speaking Tungusic languages, and, in particular, to the Ulchi. The similarity to nearby modern populations and the low levels of additional genetic material in the Ulchi imply a high level of genetic continuity in this region during the Holocene, a pattern that markedly contrasts with that reported for Europe.

고대 유전체(게놈)는 홀로세(Holocene, 약 11,700년 전부터 현재까지) 선사시대에 대한 우리의 이해, 특히 서부 유라시아의 신석기 시대 전환 과정에 대한 이해에 혁명을 일으켰다.이와 대조적으로, 동아시아는 근동(Near East)에서 신석기 시대가 시작된 후 약 3천 년 뒤에 독립적으로 이 전환이 일어난 핵심 지역임에도 불구하고, 지금까지는 상대적으로 관심을 덜 받아왔다. 우리는 러시아와 한국의 국경 지대에 위치한 초기 신석기 시대 동굴 유적지인 데블스 게이트(Devil’s Gate, 약 7,700년 전으로 추정)에서 발견된 두 명의 수렵채집인으로부터 얻은 전체 유전체 데이터를 보고한다. 이 두 고대인은 유전적으로 지리적으로 가까운 현대 인구인 아무르강 유역의 집단(모두 퉁구스어를 사용하며, 특히 울치족)과 가장 유사하다. 가까운 현대 인구와의 이러한 유사성과 울치족에게서 외부 유전 물질이 적게 발견된다는 점은 이 지역이 홀로세 기간 동안 높은 수준의 유전적 연속성을 유지해 왔음을 의미하며, 이는 유럽에서 보고된 패턴과 확연히 대조된다.

 

목차

서론

결과

논의

재료 및 방법

실험 설계

통계 분석

보충 자료

참고문헌 및 주석

 

서론

Ancient genomes from western Asia have revealed a degree of genetic continuity between preagricultural hunter-gatherers and early farmers 12 to 8 thousand years ago (ka) (1, 2). In contrast, studies on southeast and central Europe indicate a major population replacement of Mesolithic hunter-gatherers by Neolithic farmers of a Near Eastern origin during the period 8.5 to 7 ka. This is then followed by a progressive “resurgence” of local hunter-gatherer lineages in some regions during the Middle/Late Neolithic and Eneolithic periods and a major contribution from the Asian Steppe later, ~sim 5.5 ka, coinciding with the advent of the Bronze Age (3–5). Compared to western Eurasia, for which hundreds of partial ancient genomes have already been sequenced, East Asia has been largely neglected by ancient DNA studies to date, with the exception of the Siberian Arctic belt, which has received attention in the context of the colonization of the Americas (6, 7). However, East Asia represents an extremely interesting region as the shift to reliance on agriculture appears to have taken a different course from that in western Eurasia. In the latter region, pottery, farming, and animal husbandry were closely associated. In contrast, Early Neolithic societies in the Russian Far East, Japan, and Korea started to manufacture and use pottery and basketry 10.5 to 15 ka, but domesticated crops and livestock arrived several millennia later (8, 9). Because of the current lack of ancient genomes from East Asia, we do not know the extent to which this gradual Neolithic transition, which happened independently from the one taking place in western Eurasia, reflected actual migrations, as found in Europe, or the cultural diffusion associated with population continuity.

서부 아시아의 고대 유전체는 12,000년 전부터 8,000년 전까지의 선(先)농경 수렵채집인과 초기 농경민 사이에 어느 정도의 유전적 연속성이 있었음을 밝혔다 (1, 2). 이와 대조적으로, 동남부 및 중앙 유럽에 대한 연구는 8,500년 전부터 7,000년 전 사이에 근동 기원인 신석기 농경민들이 중석기 수렵채집인을 대규모로 대체했음을 보여준다. 이후 중기/후기 신석기 시대와 동석기 시대에는 일부 지역에서 지역 수렵채집인 혈통이 점진적으로 “재등장”했으며, 나중인 약 5,500년 전, 청동기 시대의 출현과 일치하여 아시아 스텝 지역으로부터의 주요 유입이 뒤따랐다 (3–5). 이미 수백 개의 부분적인 고대 유전체가 시퀀싱된 서부 유라시아와 비교했을 때, 동아시아는 지금까지 고대 DNA 연구에서 대체로 무시되었다. 다만, 아메리카 대륙 식민지화 맥락에서 주목을 받았던 시베리아 북극 지대는 예외이다 (6, 7). 그러나 동아시아는 농업 의존으로의 전환이 서부 유라시아와는 다른 경로를 택한 것으로 보이기 때문에 매우 흥미로운 지역이다. 서부 유라시아에서는 도자기, 농업, 가축 사육이 밀접하게 연관되어 있었다. 이와 대조적으로, 러시아 극동, 일본, 한국의 초기 신석기 사회는 10,500년 전부터 15,000년 전 사이에 도자기와 바구니를 제작하고 사용하기 시작했지만, 가축화된 작물과 가축은 수천 년 후에 도착했다 (8, 9). 현재 동아시아의 고대 유전체가 부족하기 때문에, 서부 유라시아에서 일어난 것과는 독립적으로 발생한 이러한 점진적인 신석기 전환이 유럽에서 발견된 것과 같은 실제 이주를 반영했는지, 아니면 인구 연속성과 관련된 문화 확산을 반영했는지 그 정도를 알 수 없다.

 

결과

샘플, 시퀀싱 및 진위성

To fill this gap in our knowledge about the Neolithic in East Asia, we sequenced to low coverage the genomes of five early Neolithic burials (DevilsGate1, 0.059-fold coverage; DevilsGate2, 0.023-fold coverage; and DevilsGate3, DevilsGate4, and DevilsGate5, <0.001-fold coverage) from a single occupational phase at Devil’s Gate (Chertovy Vorota) Cave in the Primorye Region, Russian Far East, close to the border with China and North Korea (see the Supplementary Materials). This site dates back to 9.4 to 7.2 ka, with the human remains dating to ~7.7 ka, and it includes some of the world’s earliest evidence of ancient textiles (10). The people inhabiting Devil’s Gate were hunter-fisher-gatherers with no evidence of farming; the fibers of wild plants were the main raw material for textile production (10). We focus our analysis on the two samples with the highest sequencing coverage, DevilsGate1 and DevilsGate2, both of which were female. The mitochondrial genome of the individual with higher coverage (DevilsGate1) could be assigned to haplogroup D4; this haplogroup is found in present-day populations in East Asia (11) and has also been found in Jomon skeletons in northern Japan (2). For the other individual (DevilsGate2), only membership to the M branch (to which D4 belongs) could be established. Contamination, estimated from the number of discordant calls in the mitochondrial DNA (mtDNA) sequence, was low (0.87% [95% confidence interval (CI), 0.28 to 2.37%] and 0.59% (95% CI, 0.03 to 3.753%)} on nonconsensus bases at haplogroup-defining positions for DevilsGate1 and DevilsGate2, respectively. Using schmutzi (12) on the higher-coverage genome, DevilsGate1 also gives low contamination levels [1% (95% CI, 0 to 2%); see the Supplementary Materials]. As a further check against the possible confounding effect of contamination, we made sure that our most important analyses [outgroup f3 scores and principal components analysis (PCA)] were qualitatively replicated using only reads showing evidence of postmortem damage (PMD score of at least 3) (13), although these latter results had a high level of noise due to the low coverage (0.005X for DevilsGate1 and 0.001X for DevilsGate2).

동아시아 신석기 시대에 대한 지식의 격차를 메우기 위해, 연구자들은 러시아 극동의 프리모리예 지방에 있는 데블스 게이트(Чертовы Ворота) 동굴의 단일 점유층에서 발굴된 초기 신석기 시대 매장 유골 다섯 구(DevilsGate1, 0.059배 커버리지; DevilsGate2, 0.023배 커버리지; DevilsGate3, DevilsGate4, DevilsGate5, 0.001배 미만 커버리지)의 게놈을 낮은 커버리지로 시퀀싱(sequencing)했다 (Supplementary Materials 참조). 이 유적지는 중국 및 북한 국경에 가깝다. 이 유적지는 9,400년 전부터 7,200년 전으로 거슬러 올라가며, 인골은 약 7,700년 전으로 연대가 측정되었고, 세계에서 가장 초기의 고대 직물 증거를 포함한다 (10). 데블스 게이트에 거주했던 사람들은 농경의 증거가 없는 수렵-어로-채집인이었고, 야생 식물 섬유가 직물 생산의 주된 원료였다 (10). 연구자들은 시퀀싱 커버리지가 가장 높은 두 샘플, DevilsGate1과 DevilsGate2에 분석을 집중했는데, 둘 다 여성이었다. 커버리지가 더 높은 개체(DevilsGate1)의 미토콘드리아 게놈은 D4 하플로그룹(haplogroup)으로 분류할 수 있었다. 이 하플로그룹은 오늘날 동아시아 인구에서 발견되며 (11), 북부 일본의 죠몬 인골에서도 발견되었다 (2). 다른 개체(DevilsGate2)의 경우, D4가 속하는 M 분파에만 속하는 것으로 확인되었다. 미토콘드리아 DNA (mtDNA) 서열에서 불일치하는 호출 수를 기반으로 추정된 오염도는 낮았으며, DevilsGate1과 DevilsGate2 각각에 대해 하플로그룹을 정의하는 위치에서 비(非)합의 염기쌍을 기준으로 0.87% [95% 신뢰 구간 (CI), 0.28~2.37%] 및 0.59% (95% CI, 0.03~3.753%}였다. 커버리지가 더 높은 게놈인 DevilsGate1에 schmutzi (12)를 사용했을 때도 낮은 오염 수준 [1% (95% CI, 0~2%); Supplementary Materials 참조]을 보였다. 오염의 잠재적인 혼란 효과에 대한 추가적인 확인으로, 연구자들은 가장 중요한 분석 [outgroup f3 점수와 주성분 분석 (PCA)]이 사후 손상(postmortem damage, PMD) 증거를 보이는 리드(reads)만을 사용하여 정성적으로 재현되었는지 확인했다 (13). 비록 후자의 결과는 낮은 커버리지 (DevilsGate1에 대해 0.005X, DevilsGate2에 대해 0.001X)로 인해 높은 수준의 노이즈를 가졌지만 말이다.

현대 인구와의 관계

We compared the individuals from Devil’s Gate to a large panel of modern-day Eurasians and to published ancient genomes (Fig. 1A) (4, 5, 14-17). On the basis of PCA (18) and an unsupervised clustering approach, ADMIXTURE (19), both individuals fall within the range of modern variability found in populations from the Amur Basin, the geographic region where Devil’s Gate is located (Fig. 1), and which is today inhabited by speakers from a single language family (Tungusic). This result contrasts with observations in western Eurasia, where, because of a number of major intervening migration waves, hunter-gatherers of a similar age fall outside modern genetic variation (3, 20). We further confirmed the affinity between Devil’s Gate and modern-day Amur Basin populations by using outgroup f3 statistics in the form f3 (African}; DevilsGate, X), which measures the amount of shared genetic drift between a Devil’s Gate individual and X, a modern or ancient population, since they diverged from an African outgroup. Modern populations that live in the same geographic region as Devil’s Gate have the highest genetic affinity to our ancient genomes (Fig. 2), with a progressive decline in affinity with increasing geographic distance (r2=0.756, F1,96=301, P<0.001; Fig. 3), in agreement with neutral drift leading to a simple isolation-by-distance pattern. The Ulchi, traditionally fishermen who live geographically very close to Devil’s Gate and are the only Tungusic-speaking population from the Amur Basin sampled in Russia (all other Tungusic speakers in our panel are from China), are genetically the most similar population in our panel. Other populations that show high affinity to Devil’s Gate are the Oroqen and the Hezhen—both of whom, like the Ulchi, are Tungusic speakers from the Amur Basin—as well as modern Koreans and Japanese. Given their geographic distance from Devil’s Gate (Fig. 3), Amerindian populations are unusually genetically close to samples from this site, in agreement with their previously reported relationship to Siberian and other north Asian populations (7).

연구자들은 데블스 게이트의 개체들을 오늘날의 광범위한 유라시아 패널과 이전에 발표된 고대 게놈과 비교했다 (그림. 1A) (4, 5, 14-17). 주성분 분석(PCA) (18)과 비지도 클러스터링 접근 방식인 ADMIXTURE (19)를 기반으로, 두 개체 모두 데블스 게이트가 위치한 지리적 영역인 아무르강 분지에서 발견되는 현대 변이의 범위 내에 속했다 (Fig. 1). 이 지역은 오늘날 단일 언어 가족인 퉁구스어족 화자들이 거주한다. 이 결과는 여러 차례의 주요 이주 물결로 인해 비슷한 연대의 수렵채집인이 현대 유전적 변이 외부에 속하는 서부 유라시아에서의 관찰과 대조된다 (3, 20). 연구자들은 아프리카 아웃그룹(outgroup)으로부터 분기한 이후 데블스 게이트 개체와 현대 또는 고대 인구 X 사이에 공유된 유전적 부동(genetic drift)의 양을 측정하는 outgroup f3 통계량, 즉 f3(아프리카; DevilsGate, X) 형태를 사용하여 데블스 게이트와 오늘날의 아무르강 분지 인구 간의 유연 관계를 추가로 확인했다. 데블스 게이트와 동일한 지리적 지역에 거주하는 현대 인구는 고대 게놈과 가장 높은 유전적 유연 관계를 가지며 (그림. 2), 이는 지리적 거리가 증가함에 따라 점진적으로 감소했다 (r2=0.756, F1,96=301, P<0.001; 그림. 3). 이는 중립적 부동이 단순한 격리-거리(isolation-by-distance) 패턴으로 이어진다는 것과 일치한다. 전통적으로 어부였으며 데블스 게이트와 지리적으로 매우 가깝게 거주하는 울치족은 (이들의 퉁구스어족 화자 패널 중 러시아에서 채집된 유일한 인구이며, 나머지 퉁구스어족 화자들은 중국 출신이다) 유전적으로 패널에서 가장 유사한 인구이다. 데블스 게이트와 높은 유연 관계를 보이는 다른 인구는 울치족과 마찬가지로 아무르강 분지의 퉁구스어족 화자인 오로첸과 허저이며, 현대 한국인과 일본인도 포함된다. 데블스 게이트와의 지리적 거리를 고려할 때 (그림. 3), 아메리카 원주민(Amerindian) 인구는 이 유적지의 샘플과 이례적으로 유전적으로 가까운데, 이는 이전에 보고된 시베리아 및 다른 북부 아시아 인구와의 관계와 일치한다 (7).

그림 1. 지역 참조 패널, PCA 및 ADMIXTURE 분석. (A) 데블스 게이트의 위치(검은색 삼각형)와 분석을 위한 지역 패널을 구성하는 현대 인구의 위치를 보여주는 아시아 지도. (B) (A)에 표시된 동아시아 및 중앙 아시아의 현대 인구로 구성된 지역 패널에 의해 정의된 첫 번째 두 개의 주성분(PC)을 보여주는 플롯으로, 데블스 게이트의 두 샘플(검은색 삼각형)을 그 위에 투영했다 (18). (C) 데블스 게이트와 지역 패널에 대해 수행된 ADMIXTURE 분석 (19) 결과로, K=5 (가장 낮은 교차 검증 오류)와 K=8 (데블스 게이트 특이 클러스터의 출현)인 경우를 나타냈다.

그림 2. Outgroup f3 통계량. 아프리카 아웃그룹(코마니)을 기준으로 데블스 게이트(검은색 삼각형은 샘플링 위치를 나타냄)와 현대 인구 사이에 공유된 유전적 부동을 측정하는 Outgroup f3. (A) 전 세계 지도. (B) 데블스 게이트와 가장 높은 공유 부동(shared drift)을 보이는 15개 인구를 그림 1에서와 같이 지역별로 색상 코드를 지정했다. 오차 막대는 1 표준 오차(SE)를 나타낸다.

그림 3. Outgroup f3 통계량의 공간적 패턴. DevilsGate1과 모든 단일 염기 다형성(SNP)을 사용하여 Outgroup f3 (X, Devil’s Gate; 코마니)와 데블스 게이트로부터 육지 거리 사이의 관계를 나타낸다. 상관관계를 계산할 때 데블스 게이트로부터 최대 9,000 km 떨어진 인구들을 고려했다. 고려된 최대 거리는 500 km 단계로 피어슨 상관관계가 가장 높게 나오도록 선택했다. 최적의 선형 적합 (r2=0.772, F1,108=368.4, P<0.001)은 파란색 선으로 표시되며, 95% 신뢰 구간(CI)은 음영 영역으로 나타낸다.

아시아의 고대 유전체와의 관계

No previously published ancient genome shows marked genetic affinity to Devil’s Gate: The top 50 populations in our outgroup f3 statistic were all modern, an expected result given that all other ancient genomes are either geographically or temporally very distant from Devil’s Gate. Among these ancient genomes, the closest to Devil’s Gate are those from Steppe populations dating from the Bronze Age onward and Mesolithic hunter-gatherers from Europe, but these genomes are no closer to the Devil’s Gate genomes than to genomes of modern populations from the same regions (for example, Tuvinian, Kalmyk, Russian, or Finnish). The two ancient genomes geographically closest to Devil’s Gate, Ust’-Ishim (~45 ka) and Mal’ta (MA1, 24 ka), also do not show high genetic affinity, probably because they both date to a much earlier time period. Of the two, MA1 is genetically closer to Devil’s Gate, but it is equally as distant from Devil’s Gate as it is from all other East Asians (figs. S14 to S16). A similar pattern is found for Ust’-Ishim, which is equally as distant to all Asians, including Devil’s Gate; this is consistent with its basal position in a genealogical tree (figs. S17 to S19).

이전에 발표된 고대 게놈 중 데블스 게이트와 뚜렷한 유전적 유연 관계를 보이는 것은 없었다. outgroup f3 통계량에서 상위 50개 인구는 모두 현대 인구였는데, 이는 다른 모든 고대 게놈이 데블스 게이트와 지리적으로나 시간적으로 매우 멀리 떨어져 있다는 점을 고려할 때 예상되는 결과였다. 이 고대 게놈들 중에서 데블스 게이트에 가장 가까운 것은 청동기 시대 이후의 스텝 인구와 유럽의 중석기 수렵채집인의 게놈이었지만, 이들 게놈은 동일 지역의 현대 인구(투비니안, 칼미크, 러시아인, 핀란드인 등)의 게놈보다 데블스 게이트 게놈에 더 가깝지는 않았다. 데블스 게이트와 지리적으로 가장 가까운 두 고대 게놈인 우스티-이심 (약 45,000년 전)과 말타 (MA1, 24,000년 전) 역시 유전적 유연 관계가 높지 않았는데, 이는 아마도 둘 다 훨씬 더 이른 시기로 거슬러 올라가기 때문일 것이다. 둘 중에서 MA1이 유전적으로 데블스 게이트에 더 가깝지만, 다른 모든 동아시아인과 마찬가지로 데블스 게이트와 동일하게 거리가 멀다 (figs. S14 to S16). 우스티-이심에서도 유사한 패턴이 발견되는데, 데블스 게이트를 포함한 모든 아시아인과 동일하게 거리가 멀었고, 이는 계통수에서 이 게놈의 기저(basal) 위치와 일치한다 (figs. S17 to S19).

데블스 게이트와 울치족 간의 연속성

Because Devil’s Gate falls within the range of modern human genetic variability in the Amur Basin in a number of analyses and shows a high genetic affinity to the Ulchi, we investigated the extent of genetic continuity in this region. To look for signals of additional genetic material in the Ulchi, we modeled them as a mixture of Devil’s Gate and other modern populations using admixture f3 statistics. Despite a large panel of possible modern sources, the Ulchi are best represented by Devil’s Gate alone without any further contribution (no admixture f3 gave a significant negative result; tables S3 and S4). Because admixture f3 can be affected by demographic events such as bottlenecks, we also tested whether Devil’s Gate formed a clade with the Ulchi using a D statistic in the form D(African outgroup, X; Ulchi, Devil’s Gate). A number of primarily modern populations worldwide gave significantly nonzero results (|z|>2), which, together with the additional components for the Ulchi in the ADMIXTURE analysis, suggests that the continuity is not absolute. However, it should be noted that the higher error rates in the Devil’s Gate sequence resulting from DNA degradation and low coverage can also decrease the inferred level of continuity. To compare the level of continuity between the Ulchi and the inhabitants of Devil’s Gate to that between modern Europeans and European hunter-gatherers, we compared their ancestry proportions as inferred by ADMIXTURE. We found that the proportion of Devil’s Gate-related ancestry in the Ulchi was significantly higher than the local hunter-gatherer-related ancestry in any European population (P<0.01 from 100 bootstrap replicates for the five European populations with the highest mean hunter-gatherer-related component).

데블스 게이트가 여러 분석에서 아무르강 분지 현대 인류의 유전적 변이 범위 내에 속하며 울치족과 높은 유전적 유연 관계를 보이기 때문에, 연구자들은 이 지역의 유전적 연속성 정도를 조사했다. 울치족에서 추가적인 유전 물질의 신호를 찾기 위해, 연구자들은 혼합(admixture) f3 통계량을 사용하여 울치족을 데블스 게이트와 다른 현대 인구의 혼합으로 모델링했다. 가능한 현대 출처의 광범위한 패널에도 불구하고, 울치족은 추가적인 기여 없이 데블스 게이트 단독으로 가장 잘 설명되었다 (어떤 혼합 f3도 유의미한 음수 결과를 보이지 않았다; tables S3 and S4). 혼합 f3는 병목 현상(bottlenecks)과 같은 인구 통계학적 사건의 영향을 받을 수 있으므로, 연구자들은 D 통계량, 즉 D(아프리카 아웃그룹, X; 울치, 데블스 게이트) 형태를 사용하여 데블스 게이트가 울치족과 분지군(clade)을 형성하는지 여부도 테스트했다. 전 세계의 주로 현대 인구 중 다수가 유의미하게 0이 아닌 결과 (|z|>2)를 보였는데, 이는 ADMIXTURE 분석에서 울치족에 대한 추가 구성 요소와 함께 연속성이 절대적이지 않음을 시사한다. 그러나 DNA 분해 및 낮은 커버리지로 인해 데블스 게이트 서열의 오류율이 높으면 추론된 연속성 수준도 감소할 수 있다는 점에 유의해야 한다. 울치족과 데블스 게이트 주민 간의 연속성 수준을 현대 유럽인과 유럽 수렵채집인 간의 연속성 수준과 비교하기 위해, 연구자들은 ADMIXTURE로 추론된 이들의 혈통 비율을 비교했다. 울치족에서 데블스 게이트 관련 혈통의 비율이 가장 높은 평균 수렵채집인 관련 구성 요소를 가진 다섯 유럽 인구에 대한 100회의 부트스트랩(bootstrap) 복제로부터 얻은 결과, 어떤 유럽 인구에서도 지역 수렵채집인 관련 혈통의 비율보다 유의미하게 높다는 것을 발견했다 (P<0.01).

These results suggest a relatively high degree of continuity in this region; the Ulchi are likely descendants of Devil’s Gate (or a population genetically very close to it), but the geographic and genetic connectivity among populations in the region means that this modern population also shows increased association with related modern populations. Compared to Europe, these results suggest a higher level of genetic continuity in northern East Asia over the last ~7.7 thousand years (ky), without any major population turnover since the early Neolithic.

이러한 결과는 이 지역에서 비교적 높은 정도의 연속성을 시사한다. 울치족은 데블스 게이트 (또는 유전적으로 매우 가까운 인구)의 후손일 가능성이 높지만, 이 지역 인구 간의 지리적 및 유전적 연결성은 이 현대 인구 역시 관련 현대 인구와 증가된 연관성을 보인다는 것을 의미한다. 유럽과 비교할 때, 이러한 결과는 초기 신석기 시대 이후 주요 인구 교체 없이 지난 약 7,700년 동안 북부 동아시아에서 더 높은 수준의 유전적 연속성을 시사한다.

일본인과 한국인의 남부 및 북부 유전 물질

The close genetic affinity between Devil’s Gate and modern Japanese and Koreans, who live further south, is also of interest. It has been argued, based on both archaeological (21) and genetic analyses (22-25), that modern Japanese have a dual origin, descending from an admixture event between hunter-gatherers of the Jomon culture (16 to 3 ka) and migrants of the Yayoi culture (3 to 1.7 ka), who brought wet rice agriculture from the Yangtze estuary in southern China through Korea. The few ancient mtDNA samples available from Jomon sites on the northern Hokkaido island show an enrichment of particular haplotypes (N9b and M7a, with D1, D4, and G1 also detected) present in modern Japanese populations, particularly the Ainu and Ryukyuans, as well as southern Siberians (for example, Udegey and Ulchi) (26, 27). The mtDNA haplogroups of our samples from Devil’s Gate (D4 and M) are also present in Jomon samples, although they are not the most common ones (N9b and M7a). Recently, nuclear genetic data from two Jomon samples also confirmed the dual origin hypothesis and implied that the Jomon diverged before the diversification of present-day East Asians (28).

데블스 게이트와 남쪽에 거주하는 현대 일본인 및 한국인 사이의 긴밀한 유전적 유연 관계 또한 흥미롭다. 고고학적 (21) 및 유전적 분석 (22-25) 모두를 기반으로, 현대 일본인은 죠몬 문화의 수렵채집인 (16,000년 전부터 3,000년 전)과 야요이 문화의 이주민 (3,000년 전부터 1,700년 전) 간의 혼합 사건에서 유래했다는 이중 기원설이 주장되어 왔다. 이주민들은 중국 남부의 양쯔강(揚子江) 어귀에서 한국을 통해 습식 벼농사(wet rice agriculture)를 가져왔다. 북부 홋카이도(北海道) 섬의 죠몬 유적지에서 확보된 몇 안 되는 고대 mtDNA 샘플은 현대 일본 인구, 특히 아이누(Ainu)족과 류큐(Ryukyuan)족, 그리고 남부 시베리아인 (우데게이(Udegey)족과 울치족 등)에서 발견되는 특정 하플로타입(haplotypes) (N9b와 M7a, 그리고 D1, D4, G1도 검출됨)이 풍부하게 나타났다 (26, 27). 데블스 게이트 샘플의 mtDNA 하플로그룹 (D4와 M) 역시 죠몬 샘플에 존재하지만, 가장 흔한 하플로그룹은 아니다 (N9b와 M7a). 최근, 두 죠몬 샘플의 핵 게놈 데이터 역시 이중 기원 가설을 확인했으며, 죠몬이 오늘날의 동아시아인의 다양화 이전에 분기했음을 시사했다 (28).

We investigated whether it was possible to recover the Northern and Southern genetic components by modeling modern Japanese as a mixture of all possible pairs of sources, including both modern Asian populations and Devil’s Gate, using admixture f2 statistics. The clearest signal was given by a combination of Devil’s Gate and modern-day populations from Taiwan, southern China, and Vietnam (Fig. 4), which could represent hunter-gatherer and agriculturalist components, respectively. However, it is important to note that these scores were just barely significant (-3<z<-2) and that some modern pairs also gave negative scores, even if not reaching our significance threshold (z scores as low as -1.9; see the Supplementary Materials). The origin of Koreans has received less attention. Also, because of their location on the main land, Koreans have likely experienced a greater degree of contact with neighboring populations throughout history. However, their genomes show similar characteristics to those of the Japanese on genome-wide SNP data (29) and have also been shown to harbor both northern and southern Asian mtDNA (30) and Y chromosomal haplogroups (30, 31). Unfortunately, our low coverage and small sample size from Devil’s Gate prevented a reliable estimate of admixture coefficients or use of linkage disequilibrium-based methods to investigate whether the components originated from secondary contact (admixture) or continuous differentiation and to date any admixture event that did occur.

연구자들은 혼합 f2 통계량을 사용하여 현대 일본인을 모든 가능한 출처 쌍, 즉 현대 아시아 인구와 데블스 게이트의 혼합으로 모델링하여 북부 및 남부 유전적 구성 요소를 복구할 수 있는지 조사했다. 가장 명확한 신호는 데블스 게이트와 타이완, 중국 남부, 베트남의 현대 인구를 조합했을 때 나타났는데 (그림. 4), 이는 각각 수렵채집인 및 농경민 구성 요소를 나타낼 수 있다. 그러나 이 점수들이 겨우 유의미한 수준 (-3<z<-2)이었고, 일부 현대 쌍 역시 유의성 임계값에 도달하지는 않았지만 음수 점수(z 점수가 -1.9만큼 낮음)를 보였다는 점에 유의하는 것이 중요하다 (Supplementary Materials 참조). 한국인의 기원은 덜 주목받았다. 또한, 한국인은 대륙에 위치했기 때문에 역사 전반에 걸쳐 이웃 인구와 더 높은 수준의 접촉을 경험했을 가능성이 높다. 그러나 한국인의 게놈은 전장 SNP 데이터에서 일본인의 게놈과 유사한 특성을 보이며 (29), 북부 및 남부 아시아 mtDNA (30)와 Y 염색체 하플로그룹 (30, 31)을 모두 보유하는 것으로 나타났다. 아쉽게도, 데블스 게이트 샘플의 낮은 커버리지와 적은 샘플 크기로 인해 혼합 계수에 대한 신뢰할 수 있는 추정이나, 구성 요소가 2차 접촉(혼합) 또는 지속적인 분화에서 비롯되었는지 조사하기 위한 연관 불균형(linkage disequilibrium) 기반 방법 사용, 그리고 혼합 사건 발생 시점을 추정하는 것이 불가능했다.

그림 4. 혼합(Admixture) f3 통계량. 현대 한국인과 일본인을 두 인구(X와 Y)의 혼합으로 나타내는 혼합 f3를 보여주며, 그림 1에서와 같이 지역별로 색상 코드를 지정했다. (A) 한국인을 대상(target)으로 했을 때, 유의미한 (z<-2) 값을 주는 쌍들 중에서 가장 낮은 f3 점수를 보이는 30쌍. (B) 일본인을 대상으로 했을 때, 유의미하게 (z<-2) 음수 점수를 주는 4쌍 전체. 오차 막대는 1 표준 오차(SE)를 나타낸다.

관심 표현형

The low coverage of our sample does not allow for direct observation of most SNPs linked to phenotypic traits of interest, but imputation based on modern-day populations can provide some information. We focused on the genome with highest coverage, DevilsGate1, using the same imputation approach that has previously been used to estimate genotype probabilities (GPs) for ancient European samples (5, 16, 17). DevilsGate1 likely had brown eyes (rs12913832 on HERC2; GP, 0.905) and, where it could be determined, had pigmentation-associated variants that are common in East Asia (see section S11) (32). She appears to have at least one copy of the derived mutation on the EDAR gene, encoding the Ectodysplasin A receptor (rs3827760; GP, 0.865), which gives increased odds of straight, thick hair (33), as well as shovel-shaped incisors (34). She almost certainly lacked the most common Eurasian mutation for lactose tolerance (rs4988235, LCT gene; GP>0.999) (35) and was unlikely to have suffered from alcohol flush (rs671, ALDH2 gene; GP, 0.847) (36). Thus, at least with regard to those phenotypic traits for which the genetic basis is known, there also seems to have been some degree of phenotypic continuity in this region for the last 7.7 ky.

샘플의 낮은 커버리지는 관심 있는 표현형 특성(phenotypic traits)과 관련된 대부분의 SNP를 직접 관찰하는 것을 허용하지 않지만, 현대 인구를 기반으로 한 추정(imputation)은 일부 정보를 제공할 수 있다. 연구자들은 커버리지가 가장 높은 게놈인 DevilsGate1에 집중했으며, 이전 고대 유럽 샘플의 유전자형 확률(Genotype Probabilities, GPs)을 추정하는 데 사용된 것과 동일한 추정 접근 방식을 사용했다 (5, 16, 17). DevilsGate1은 갈색 눈을 가졌을 가능성이 높고 (HERC2의 rs12913832; GP, 0.905), 결정할 수 있는 경우 동아시아에서 흔한 색소 침착 관련 변이체(pigmentation-associated variants)를 가졌다 (section S11 참조) (32). 그녀는 Ectodysplasin A 수용체(receptor)를 암호화하는 EDAR 유전자에서 유래된 돌연변이 (rs3827760; GP, 0.865)를 적어도 한 카피 가지고 있는 것으로 보이며, 이는 곧고 두꺼운 머리카락 (33) 및 삽 모양 앞니(shovel-shaped incisors) (34)의 가능성을 높인다. 그녀는 젖당 내성(lactose tolerance)을 위한 가장 흔한 유라시아 돌연변이 (rs4988235, LCT gene; GP>0.999)를 거의 확실히 가지고 있지 않았으며 (35), 알코올 홍조(alcohol flush) (rs671, ALDH2 gene; GP, 0.847)를 겪었을 가능성은 낮았다 (36). 따라서, 적어도 유전적 기반이 알려진 표현형 특성과 관련하여, 지난 7,700년 동안 이 지역에서 어느 정도의 표현형 연속성(phenotypic continuity)이 있었던 것으로 보인다.

 

논의

By analyzing genome-wide data from two early Neolithic East Asians from Devil’s Gate, in the Russian Far East, we could demonstrate a high level of genetic continuity in the region over at least the last 7700 years. The cold climatic conditions in this area, where modern populations still rely on a number of hunter-gatherer-fisher practices, likely provide an explanation for the apparent continuity and lack of major genetic turnover by exogenous farming populations, as has been documented in the case of southeast and central Europe. Thus, it seems plausible that the local hunter-gatherers progressively added food-producing practices to their original lifestyle. However, it is interesting to note that in Europe, even at very high latitudes, where similar subsistence practices were still important until very recent times, the Neolithic expansion left a significant genetic signature, albeit attenuated in modern populations, compared to the southern part of the continent. Our ancient genomes thus provide evidence for a qualitatively different population history during the Neolithic transition in East Asia compared to western Eurasia, suggesting stronger genetic continuity in the former region. These results encourage further study of the East Asian Neolithic, which would greatly benefit from genetic data from early agriculturalists (ideally, from areas near the origin of wet rice cultivation in southern East Asia), as well as higher-coverage hunter-gatherer samples from different regions to quantify population structure before intensive agriculture.

한글 러시아 극동 데블스 게이트(Devil’s Gate) 출신 초기 신석기 동아시아인 두 명의 전장(全場) 게놈 데이터를 분석함으로써, 연구자들은 적어도 지난 7,700년 동안 이 지역에서 높은 수준의 유전적 연속성을 입증할 수 있었다. 현대 인구가 여전히 다양한 수렵-채집-어로 행위에 의존하는 이 지역의 추운 기후 조건은 동남부 및 중앙 유럽의 경우에서 문서화되었듯이, 외래 농경 인구에 의한 명백한 연속성과 주요 유전적 교체 부족에 대한 설명을 제공하는 듯하다. 따라서, 지역 수렵채집인들이 점진적으로 자신들의 원래 생활 방식에 식량 생산 관행을 추가했다고 보는 것이 그럴듯하다. 그러나 흥미롭게도 유럽에서는 매우 최근까지 유사한 생계 관행이 여전히 중요했던 매우 높은 위도에서도, 신석기 확장이 대륙 남부와 비교하여 현대 인구에서는 약화되었을지라도, 유의미한 유전적 흔적을 남겼다는 점에 주목할 필요가 있다. 따라서 연구자들의 고대 게놈은 서부 유라시아와 비교하여 동아시아신석기 전환기 동안 질적으로 다른 인구 역사에 대한 증거를 제공하며, 동아시아 지역의 더 강력한 유전적 연속성을 시사한다. 이 결과는 동아시아 신석기 시대에 대한 추가 연구를 장려하며, 집약적 농업 이전에 인구 구조를 정량화하기 위해 초기 농경민의 유전적 데이터 (이상적으로는 동아시아 남부의 벼 재배 기원지 근처 지역에서), 그리고 다른 지역의 더 높은 커버리지 수렵채집인 샘플로부터 얻는 유전적 데이터가 크게 도움이 될 것이다.

 

재료 및 방법

실험 설계

샘플 준비 및 시퀀싱 과정

Molecular analyses were carried out in dedicated ancient DNA facilities at Trinity College Dublin, Ireland. Samples were prepared, and DNA was extracted using a silica column–based protocol following the methods of Gamba et al. (17), which were based on the study of Yang et al. (37). DNA extracted from both the first and second lysis buffers (17) was used for library preparation, which was carried out using a modified version of the protocol of Meyer and Kircher (38), as described by Gamba et al. (17). Libraries were sequenced on either an Illumina MiSeq or HiSeq platform (for further details and sequencing statistics, see Supplementary Materials and Methods).

분자 분석은 아일랜드 더블린 트리니티 칼리지(Trinity College Dublin)에 있는 고대 DNA 전용 시설에서 수행했다. 감바(Gamba) 등 (17)의 방법론 (이는 양(Yang) 등 (37)의 연구를 기반으로 한다)에 따라 실리카 컬럼 기반 프로토콜을 사용하여 샘플을 준비하고 DNA를 추출했다. 첫 번째와 두 번째 용해 버퍼에서 추출한 DNA (17)를 라이브러리 준비에 사용했는데, 이는 감바(Gamba) 등 (17)이 설명한 대로 마이어(Meyer)와 키르허(Kircher) (38)의 프로토콜을 수정하여 수행했다. 라이브러리는 일루미나 마이시크(Illumina MiSeq) 또는 하이시크(HiSeq) 플랫폼 중 하나에서 시퀀싱했다 (자세한 내용 및 시퀀싱 통계는 보충 자료 및 방법을 참조했다).

데이터 처리 및 정렬

For single-end sequencing data, adapter sequences were trimmed from the ends of reads using cutadapt (39), allowing an overlap of only 1 basepair (bp)between the adapter andthe read.Forpaired-enddata, adapters were trimmed using leeHom (40). leeHom was run using the –ancientdna option, and paired-end reads that overlapped were merged. For paired-end reads that could not be overlapped, only data from read 1 were used in downstream analyses. Reads were aligned using the Burrows-Wheeler alignment tool (BWA) (41), with the seed region disabled, to the GRCh37 build of the human genome, with the mitochondrial sequence replaced by the revised Cambridge reference sequence (National Center for Biotechnology Information accession number NC_012920.1). Reads from different sequencing experiments were merged using Picard MergeSamFiles https://picard.sourceforge.net/), and clonal reads were removed using SAMtools (42). A minimum read length of 30 bp was imposed, and for the higher-coverage (above 0.01X) samples, DevilsGate1 and DevilsGate2, indels were realigned using RealignerTargetCreator and IndelRealigner from the Genome Analysis Toolkit (GATK) (43). SAMtools (42) was used to filter out reads with a mapping quality of less than 30, and reads were rescaled using mapDamage 2.0 (44) to reduce the qualities of likely damaged bases, therefore lessening the effects of ancient DNA damage–associated errors on analysis (44). Average genomic depth of coverage was calculated using the genomecov function of bedtools(45).

단일 말단 시퀀싱 데이터(single-end sequencing data)의 경우, cutadapt (39)를 사용하여 어댑터 서열을 리드(read, 읽힌 DNA 조각) 끝에서 잘라냈는데, 이 때 어댑터리드 사이에 단 1 염기쌍(bp)의 겹침만 허용했다. 쌍 말단 데이터(paired-end data)의 경우, leeHom (40)을 사용하여 어댑터를 잘라냈다. leeHom–ancientdna 옵션을 사용하여 실행했으며, 겹치는 쌍 말단 리드병합했다. 겹칠 수 없는 쌍 말단 리드의 경우, 이후 분석에서는 리드 1의 데이터만 사용했다. BWA(Burrows-Wheeler alignment tool) (41)를 사용하여 리드를 인간 게놈GRCh37 빌드에 정렬했는데, 이때 시드 영역은 비활성화했다. 미토콘드리아 서열은 개정된 캠브리지 참조 서열로 대체했다 (NCBI 등록 번호 NC_012920.1). 서로 다른 시퀀싱 실험에서 얻은 리드는 Picard MergeSamFiles (http://picard.sourceforge.net/)를를) 사용하여 병합했으며, SAMtools (42)를 사용하여 클론 리드는 제거했다. 최소 리드 길이는 30 bp로 제한했으며, 커버리지가 높은 (0.01X 초과) 샘플인 DevilsGate1DevilsGate2에 대해서는 GATK(Genome Analysis Toolkit) (43)의 RealignerTargetCreatorIndelRealigner를 사용하여 인델(삽입-결실 돌연변이)을 재정렬했다. SAMtools (42)를 사용하여 매핑 품질이 30 미만인 리드는 필터링하여 걸러냈고, mapDamage 2.0 (44)을 사용하여 리드를 재조정했다. 이는 손상되었을 가능성이 있는 염기의 품질을 낮춰 고대 DNA 손상 관련 오류가 분석에 미치는 영향을 줄이기 위함이다 (44). 평균 유전체 커버리지 깊이bedtools (45)의 genomecov 함수를 사용하여 계산했다.

결과 진위성 및 오염 추정치

Patterns of molecular damage and the length distribution of reads were assessed using all reads for DevilsGate3, DevilsGate4, and DevilsGate5. Because a portion of the reads from DevilsGate1 and DevilsGate2 was derived from 50-bp single-end sequencing, only reads sequenced with 150-bp paired-end sequencing were considered in the following analyses to avoid using truncated reads (library ID MOS5A. E1 for DevilsGate1 and MOS4A.E1 for DevilsGate2). MapDamage 2.0 (44) was used to assess patterns of molecular damage, which are typical of ancient DNA. We replicated all results using our data without applying MapDamage to avoid biases from dropping true mutations that look like damage on our low-coverage data. For further details, see Supplementary Materials and Methods.

분자적 손상 패턴과 리드의 길이 분포DevilsGate3, DevilsGate4, DevilsGate5의 모든 리드를 사용하여 평가했다. DevilsGate1DevilsGate2의 리드 중 일부가 50 bp 단일 말단 시퀀싱에서 유래했기 때문에, 이후 분석에서는 잘려나간 리드 사용을 피하기 위해 150 bp 쌍 말단 시퀀싱으로 분석된 리드만 고려했다 (DevilsGate1의 라이브러리 ID는 MOS5A. E1, DevilsGate2는 MOS4A.E1이다). MapDamage 2.0 (44)을 사용하여 고대 DNA의 전형적인 특징인 분자적 손상 패턴을 평가했다. 연구자들은 낮은 커버리지 데이터에서 손상처럼 보이는 진짜 돌연변이를 제외하는 편향을 피하기 위해 MapDamage를 적용하지 않은 데이터를 사용하여 모든 결과를 재현했다. 자세한 내용은 보충 자료 및 방법을 참조했다.

We assessed the rate of mitochondrial contamination for our highest-coverage samples, DevilsGate1 and DevilsGate2. This was calculated by evaluating the percentage of nonconsensus bases at haplogroup-defining positions (haplogroup D4 for DevilsGate1 and M for DevilsGate2) using bases with quality ≥20. We also used schmutzi, a tool that uses a Bayesian maximum a posteriori algorithm (12), to estimate the mitochondrial contamination for DevilsGate1. Last, we replicated the analyses that yielded the most robust results (outgroup f3 scores and PCA) using only reads showing evidence of postmortem damage (PMD score of at least 3) (13). For further de- tails, see Supplementary Materials and Methods.

커버리지가 가장 높은 샘플인 DevilsGate1DevilsGate2미토콘드리아 오염률을 평가했다. 이는 품질이 20 이상인 염기를 사용하여 하플로그룹을 정의하는 위치(DevilsGate1D4 하플로그룹, DevilsGate2M 하플로그룹)에서 비합의 염기쌍의 비율을 평가하여 계산했다. 또한, 베이즈 최대 사후 확률 알고리즘을 사용하는 도구인 schmutzi (12)를 사용하여 DevilsGate1미토콘드리아 오염도를 추정했다. 마지막으로, 가장 신뢰할 수 있는 결과(outgroup f3 점수와 PCA)를 도출한 분석을 사후 손상(PMD)의 증거를 보이는 리드(PMD 점수가 3 이상)만을 사용하여 재현했다 (13). 자세한 내용은 보충 자료 및 방법을 참조했다.

통계 분석

mtDNA 하플로그룹 및 분자 성별 결정

Mitochondrial consensus sequences were generated for DevilsGate1 and DevilsGate2 using Analysis of Next Generation Sequencing Data (ANGSD) (46). Called positions were required to have a depth of coverage age≥3, and only bases with quality ≥20 were considered. The resulting FASTA files were uploaded to HAPLOFIND (47) for haplogroup determination, with coverage calculated using GATK DepthOfCoverage (43). Mutations defining the assigned haplogroup were also manually checked. Molecular sex was assigned using the script described in the study of Skoglund et al. (48). For further details, see Supplementary Materials and Methods.

차세대 시퀀싱 데이터 분석(ANGSD) 프로그램 (46)을 사용하여 DevilsGate1과 DevilsGate2의 미토콘드리아 컨센서스 서열을 생성했다. 호출된 위치는 커버리지 깊이가 3 이상이어야 했고, 염기 품질이 20 이상인 염기만 고려했다. 결과 FASTA 파일은 하플로그룹 결정을 위해 HAPLOFIND (47)에 업로드했으며, 커버리지는 GATK DepthOfCoverage (43)를 사용하여 계산했다. 할당된 하플로그룹을 정의하는 돌연변이도 수동으로 확인했다. 분자 성별은 스코글룬드(Skoglund) 등 (48)의 연구에서 설명된 스크립트를 사용하여 할당했다. 자세한 내용은 보충 자료 및 방법을 참조했다.

SNP 호출 및 참조 패널 병합

To compare our sample to modern and ancient human genetic variation, we called SNPs using the hg19 reference FASTA file at positions overlapping with the Human Origins (HO) reference panel (591,356 positions) (49) using SAMtools 1.2 (42). Bases were required to have a minimum mapping quality of 30 and base quality of 20; all triallelic SNPs were discarded. Because our low coverage does not provide sufficient information to infer diploid genotypes, a base was chosen with probability proportional to its depth of coverage. This allele was duplicated to form a homozygous diploid genotype, which was used to represent the individual at that SNP position (48). This method of SNP calling (referred to as the proportional method from now on) will artificially increase the appearance of drift on the lineage leading to the ancient individual; however, this drift is not expected to be in any particular direction and, therefore, should not bias inferences about population relationships (3). A total of 35,903 positions in DevilsGate1 and 14,739 positions in DevilsGate2 were covered by at least one high-quality read.

연구 샘플을 현대 및 고대 인류의 유전적 변이와 비교하기 위해, 연구자들은 SAMtools 1.2 (42)를 사용하여 인간 기원(Human Origins, HO) 참조 패널 (591,356개 위치) (49)과 겹치는 위치에서 hg19 참조 FASTA 파일을 사용하여 SNP를 호출했다. 염기는 최소 매핑 품질 30과 염기 품질 20을 충족해야 했으며, 모든 삼대립형질(triallelic) SNP는 제외했다. 연구자들의 낮은 커버리지는 이배체 유전자형을 추론하기에 충분한 정보를 제공하지 않으므로, 커버리지 깊이에 비례하는 확률로 하나의 염기를 선택했다. 이 대립유전자는 복제되어 동형 접합 이배체 유전자형을 형성했으며, 이는 해당 SNP 위치에서 개체를 나타내는 데 사용했다 (48). 이러한 SNP 호출 방법 (이후 비례적 방법이라 칭함)은 고대 개체로 이어지는 계통에서 유전적 부동(genetic drift)의 출현을 인위적으로 증가시키지만, 이 부동은 특정 방향으로 치우치지 않으므로 인구 관계에 대한 추론을 편향시키지 않을 것으로 예상했다 (3). 데블스 게이트 1에서는 총 35,903개 위치, 데블스 게이트 2에서는 14,739개 위치가 최소한 하나의 고품질 리드로 커버되었다.

The resulting SNP data for DevilsGate1 and DevilsGate2 were then merged with a reference panel containing modern genomes from the HO panel and selected ancient genomes [this data set was described by Jones et al. (5)] as well as an additional 45 Korean genomes from the Personal Genome Project Korea http://Opengenome.net/Main_Page) using PLINK 1.07 (50). Additional sample information is available in extended data table S1, including sample IDs, populations, and groupings used throughout the article. Last, a transversion-only version of all the above data was created by converting all T’s to C’s and G’s to A’s. This alternative data set was used to confirm that potential biases originating from ancient DNA damage do not influence our conclusions.

PLINK 1.07 (50)을 사용하여 데블스 게이트 1과 데블스 게이트 2의 결과 SNP 데이터를 HO 패널의 현대 게놈과 선별된 고대 게놈을 포함하는 참조 패널 [이 데이터 세트는 존스(Jones) 등 (5)에 의해 설명되었다], 그리고 한국 개인 게놈 프로젝트(Personal Genome Project Korea) (http://opengenome.net/)의의) 한국인 게놈 45개를 추가하여 병합했다. 샘플 ID, 인구, 논문 전반에 사용된 그룹을 포함한 추가 샘플 정보는 확장 데이터 표 S1에서 사용할 수 있다. 마지막으로, 모든 T를 C로, G를 A로 변환하여 위 모든 데이터의 전환(transversion) 전용 버전을 생성했다. 이 대체 데이터 세트는 고대 DNA 손상에서 비롯된 잠재적인 편향이 연구자들의 결론에 영향을 미치지 않음을 확인하는 데 사용했다.

In the later analyses (outgroup and admixture f3 statistics, PCA, and ADMIXTURE analysis), results using all mutations or only transversions were qualitatively similar, apart from increased noise in the transversion-only data due to the reduced information content. Thus, in the main text, we only report results using all mutations and the default calling method referred to as the proportional method (choosing a read uniformly at random from the reads covering any given position). We present results using the Khomani San as our African outgroup for outgroup f3 and D statistics, but other populations (the Yoruba, the Mbuti, and the Dinka) gave equivalent results. For further details, see Supplementary Materials and Methods.

이후 분석 (outgroup 및 혼합 f3 통계량, PCA, ADMIXTURE 분석)에서, 모든 돌연변이를 사용한 결과와 전환만을 사용한 결과는 정보 내용 감소로 인해 전환 전용 데이터에서 노이즈가 증가했다는 점을 제외하고는 정성적으로 유사했다. 따라서 본문에서는 모든 돌연변이와 비례적 방법 (주어진 위치를 커버하는 리드에서 균일하게 무작위로 리드를 선택하는 것)이라고 하는 기본 호출 방법을 사용한 결과만 보고한다. 연구자들은 outgroup f3 및 D 통계량에 대해 코마니 산(Khomani San)을 아프리카 아웃그룹으로 사용하여 결과를 제시하지만, 다른 인구 (요루바(Yoruba), 음부티(Mbuti), 딘카(Dinka))도 동등한 결과를 제공했다. 자세한 내용은 보충 자료 및 방법을 참조했다.

인구 유전 분석

PCA was performed with two different reference panels (Fig. 1 and extended data table S1), both subsets of the worldwide panel of contemporary and ancient individuals from the study of Jones et al. (5). The analysis was carried out using EIGENSOFT 6.0.1 smartpca (18), with the lsqproject and normalization options on, the outlier removal option off, and one SNP from each pair in linkage disequilibrium with r2 > 0.2 removed. Ancient samples were projected onto the principal components defined by modern populations. For further details and results, see Supplementary Materials and Methods.

주성분 분석(PCA)은 두 가지 다른 참조 패널 (그림. 1 및 확장 데이터 표 S1)을 사용하여 수행했는데, 이는 모두 존스(Jones) 등 (5)의 연구에서 가져온 현대 및 고대 개체의 전 세계 패널의 하위 집합이다. 분석은 EIGENSOFT 6.0.1 smartpca (18)를 사용하여 lsqproject 및 normalization 옵션을 켜고, 이상치(outlier) 제거 옵션을 끄고, 연관 불균형(linkage disequilibrium) 상태인 r2>0.2인 각 쌍에서 하나의 SNP를 제거하여 수행했다. 고대 샘플은 현대 인구에 의해 정의된 주성분에 투영했다. 자세한 내용 및 결과는 보충 자료 및 방법을 참조했다.

A clustering analysis was performed using ADMIXTURE version 1.23 (19). SNPs in linkage disequilibrium were thinned using PLINK 1.07 with parameters –indep-pairwise 200 25 0.5, resulting in a set of 334,359 SNPs for analysis (91,379 transversions). K = 2 to 20 clusters for the global panel and K = 2 to 10 clusters for the regional panel were explored using 10 independent runs, with fivefold cross-validation at each K with different random seeds. The minimal cross-validation error was found at K = 18 for the global panel and K = 5 for the regional (East Asia and central Asia) panel, but the error already started plateauing around K = 9 for the global panel, suggesting little improvement. Furthermore, results for the regional panel were largely similar to those from the global panel for East Asian populations. To compare population-level frequencies of the inferred ancestry components, we simultaneously performed bootstrapping on SNPs and individuals for each population, with 100 bootstrap estimates, using inferred ancestral components from our ADMIXTURE runs on all SNPs and MapDamage-treated samples from Devil’s Gate. We projected each bootstrap replicate on the ancestral components by numerically maximizing the corresponding likelihood function, following the logic in the study of Allentoft et al. (16) and Sikora et al. (51). For further details and results, see Supplementary Materials and Methods and extended data figs. S1 to S8.

ADMIXTURE 버전 1.23 (19)을 사용하여 클러스터링 분석을 수행했다. PLINK 1.07을 사용하여 –indep-pairwise 200 25 0.5 매개변수로 연관 불균형 상태인 SNP를 솎아냈고(thinned), 그 결과 분석을 위한 334,359개의 SNP 세트 (91,379개의 전환)를 얻었다. 전 세계 패널에 대해 K=2에서 20까지의 클러스터와 지역 패널에 대해 K=2에서 10까지의 클러스터를 서로 다른 무작위 시드를 사용하여 각 K에서 5겹 교차 검증을 통해 10회의 독립적인 실행으로 탐색했다. 최소 교차 검증 오류는 전 세계 패널의 경우 K=18, 지역 (동아시아 및 중앙 아시아) 패널의 경우 K=5에서 발견되었으나, 전 세계 패널의 경우 K=9 부근에서 이미 오류가 고원 상태(plateauing)에 도달하여 개선의 여지가 거의 없음을 시사했다. 또한, 지역 패널의 결과는 동아시아 인구에 대해 전 세계 패널의 결과와 대체로 유사했다. 추론된 혈통 구성 요소의 인구 수준 빈도를 비교하기 위해, 데블스 게이트의 모든 SNP 및 MapDamage 처리된 샘플에 대한 ADMIXTURE 실행에서 추론된 조상 구성 요소를 사용하여 각 인구에 대해 SNP와 개체 모두에 대해 100회 부트스트랩 추정치를 동시에 수행했다. 알렌토프트(Allentoft) 등 (16)과 시코라(Sikora) 등 (51)의 연구 논리를 따라, 연구자들은 해당 가능도 함수(likelihood function)를 수치적으로 최대화하여 각 부트스트랩 복제본을 조상 구성 요소에 투영했다. 자세한 내용 및 결과는 보충 자료 및 방법 및 확장 데이터 figs. S1에서 S8을 참조했다.

D statistics (52) and f3 statistics (49, 53) were used to formally assess the relationships between the samples using the qpDstat (D statistics) and qp3PopTest (f3 statistics) programs from the ADMIXTOOLS package (49). Significance was assessed by these programs using a block jackknife over 5-centimorgan chunks of the genome, and statistics were considered significant if their z score was of magnitude greater than 2 or, for admixture f3 scores, if they were smaller than −2. These correspond approximately to P values of 0.046 and 0.023, respectively. For further details and results, see Supplementary Materials and Methods.

ADMIXTOOLS 패키지 (49)의 qpDstat (D 통계량) 및 qp3PopTest (f3 통계량) 프로그램을 사용하여 D 통계량 (52)과 f3 통계량 (49, 53)을 통해 샘플 간의 관계를 공식적으로 평가했다. 유의성은 게놈의 5센티모르간 청크에 대한 블록 잭나이프(block jackknife)를 사용하여 이 프로그램들로 평가했으며, 통계량은 z 점수의 크기가 2보다 크거나 혼합 f3 점수의 경우 -2보다 작으면 유의미한 것으로 간주했다. 이는 대략 P 값 0.046 및 0.023에 해당한다. 자세한 내용 및 결과는 보충 자료 및 방법을 참조했다.

관심 표현형

We investigated phenotypes of interest in our highest-coverage sample, DevilsGate1, including some loci known to have been under selection in Eurasian populations. Because of the low quality of our samples, we used BEAGLE (54) to impute genotypes using a reference panel containing phased genomes from the 1000 Genomes Project (26 different populations). Following the study of Gamba et al. (17), GATK UnifiedGenotyper (43) was used to call genotype likelihoods at SNP sites in phase 3 of the 1000 Genomes Project. Equal likelihoods were set for positions with no spanning sequence data and positions where the observed genotype could be explained by deamination (17). We imputed at least 1 Mb upstream and downstream from the loci of interest using 10 iterations to estimate genotypes at markers for which we had no direct genotype. For further details and results, see Supplementary Materials and Methods and extended data table S9.

연구자들은 커버리지가 가장 높은 샘플인 데블스 게이트 1에서 유라시아 인구에서 선택 압력을 받았던 것으로 알려진 일부 유전자좌(loci)를 포함하여 관심 있는 표현형(phenotypes)을 조사했다. 샘플의 품질이 낮기 때문에, BEAGLE (54)을 사용하여 1000 게놈 프로젝트 (26개 인구)의 위상 결정(phased) 게놈을 포함하는 참조 패널로 유전자형을 추정(impute)했다. 감바(Gamba) 등 (17)의 연구를 따라 GATK UnifiedGenotyper (43)를 사용하여 1000 게놈 프로젝트 3단계의 SNP 위치에서 유전자형 가능도(genotype likelihoods)를 호출했다. 범위 내 시퀀스 데이터가 없는 위치와 관찰된 유전자형이 탈아미노화(deamination)로 설명될 수 있는 위치 (17)에는 동일한 가능도를 설정했다. 연구자들은 직접적인 유전자형이 없는 마커의 유전자형을 추정하기 위해 10회 반복을 사용하여 관심 있는 유전자좌의 최소 1Mb 상류 및 하류를 추정했다. 자세한 내용 및 결과는 보충 자료 및 방법 및 확장 데이터 표 S9를 참조했다.

 

보충 자료

Supplementary material for this article is available at http://advances.sciencemag.org/cgi/content/full/3/2/e1601877/DC1

이 논문의 보충 자료는 http://advances.sciencemag.org/cgi/content/full/3/2/e1601877/DC1에서 이용할 수 있다.

Supplementary Materials and Methods
보충 자료 및 방법

그림 S1. 데블스 게이트에서 발견된 두 인골 표본의 보정된 연대 범위 (OxCal 버전 4.2.4).

그림 S2. 데블스 게이트 샘플의 손상 패턴.

그림 S3. 데블스 게이트 샘플의 서열 길이 분포.

그림 S4. PMDtools로 필터링된 데이터에 대한 outgroup f3 통계량.

그림 S5. 전 세계 패널을 사용하여 모든 SNP에 대해 수행한 PCA.

그림 S6. 전 세계 패널을 사용하여 전환(transversion) SNP에 대해 수행한 PCA.

그림 S7. 지역 패널을 사용하여 모든 SNP에 대해 수행한 PCA.

그림 S8. 지역 패널을 사용하여 전환 SNP에 대해 수행한 PCA.

그림 S9. MapDamage 처리 (왼쪽 열) 유무에 관계없이 모든 SNP (위쪽 행) 또는 전환만 (아래쪽 행)을 사용하여 지역 패널에 대해 클러스터 수 (K)의 함수로 나타낸 ADMIXTURE 분석 교차 검증 (CV) 오류.

그림 S10. MapDamage 처리 (왼쪽 열) 유무에 관계없이 모든 SNP (위쪽 행) 또는 전환만 (아래쪽 행)을 사용하여 전 세계 패널에 대해 클러스터 수 (K)의 함수로 나타낸 ADMIXTURE 분석 CV 오류.

그림 S11. 모든 SNP를 사용하여 f3 > 0.15로 표시된, 현대 인구 및 선별된 고대 샘플 (데블스 게이트 1, 데블스 게이트 2, 우스티-이심(Ust’-Ishim), 코티아스(Kotias), 로슈부르(Loschbour), 슈투트가르트(Stuttgart))에 대한 f3(X, MA1; 코마니(Khomani)) 형태의 outgroup f3 점수.

그림 S12. 패널의 모든 현대 인구 및 선별된 고대 샘플에 대해 모든 SNP를 사용하여 계산한 D(X, 코마니; MA1, 데블스 게이트 1) 형태의 D 점수.

그림 S13. 패널의 모든 현대 인구 및 선별된 고대 샘플에 대해 모든 SNP를 사용하여 계산한 D(X, 코마니; MA1, 데블스 게이트 1) 형태의 D 점수.

그림 S14. 모든 SNP를 사용하여 f3 > 0.15로 표시된, 현대 인구 및 선별된 고대 샘플 (MA1, 코티아스, 로슈부르, 슈투트가르트)에 대한 f3(X, 우스티-이심; 코마니) 형태의 outgroup f3 점수.

그림 S15. 패널의 모든 현대 인구 및 선별된 고대 샘플에 대해 모든 SNP를 사용하여 계산한 D(X, 코마니; 우스티-이심, 데블스 게이트 1) 형태의 D 점수.

그림 S16. 패널의 모든 현대 인구 및 선별된 고대 샘플에 대해 모든 SNP를 사용하여 계산한 D(X, 코마니; 우스티-이심, 데블스 게이트 2) 형태의 D 점수.

그림 S17. 울치족의 데블스 게이트 관련 혈통과 유럽 인구의 유럽 수렵채집인 관련 혈통의 비교.

그림 S18. 울치족의 데블스 게이트 관련 혈통과 유럽 인구의 초기 유럽 농경민 관련 혈통의 비교.

그림 S19. 울치족의 데블스 게이트 관련 혈통과 유럽 인구의 청동기 시대 스텝 관련 혈통의 비교.

표 S1. 샘플 준비 및 시퀀싱에 대한 세부 사항.

표 S2. mtDNA 오염 추정치.

표 S3. 모든 SNP를 사용하여 z < -1인 울치족에 대한 혼합 f3(소스 1, 소스 2; 대상) 통계량.

표 S4. 전환 SNP만 사용하여 z < -1인 울치족에 대한 혼합 f3(소스 1, 소스 2; 대상) 통계량.

표 S5. 모든 SNP를 사용하여 사르디니아인(Sardinians)에 대한 혼합 f3(소스 1, 소스 2; 대상) 통계량 및 가장 유의미하게 음수인 상위 10쌍.

표 S6. 모든 SNP를 사용하여 리투아니아인(Lithuanians)에 대한 혼합 f3(소스 1, 소스 2; 대상) 통계량 및 가장 유의미하게 음수인 상위 10쌍.

확장 데이터 그림 S1. 지역 패널, 모든 SNP, MapDamage 처리를 데블스 게이트 샘플에 적용하고 클러스터 수 K를 2에서 10으로 설정한 ADMIXTURE 분석 결과.

확장 데이터 그림 S2. 지역 패널, 전환 SNP, MapDamage 처리를 데블스 게이트 샘플에 적용하고 클러스터 수 K를 2에서 10으로 설정한 ADMIXTURE 분석 결과.

확장 데이터 그림 S3. 지역 패널, 모든 SNP, MapDamage 처리를 데블스 게이트 샘플에 적용하지 않고 클러스터 수 K를 2에서 10으로 설정한 ADMIXTURE 분석 결과.

확장 데이터 그림 S4. 지역 패널, 전환 SNP, MapDamage 처리를 데블스 게이트 샘플에 적용하지 않고 클러스터 수 K를 2에서 10으로 설정한 ADMIXTURE 분석 결과.

확장 데이터 그림 S5. 전체 패널, 모든 SNP, MapDamage 처리를 데블스 게이트 샘플에 적용하고 클러스터 수 K를 2에서 20으로 설정한 ADMIXTURE 분석 결과.

확장 데이터 그림 S6. 전체 패널, 전환 SNP, MapDamage 처리를 데블스 게이트 샘플에 적용하고 클러스터 수 K를 2에서 20으로 설정한 ADMIXTURE 분석 결과.

확장 데이터 그림 S7. 전체 패널, 모든 SNP, MapDamage 처리를 데블스 게이트 샘플에 적용하지 않고 클러스터 수 K를 2에서 20으로 설정한 ADMIXTURE 분석 결과.

확장 데이터 그림 S8. 전체 패널, 전환 SNP, MapDamage 처리를 데블스 게이트 샘플에 적용하지 않고 클러스터 수 K를 2에서 20으로 설정한 ADMIXTURE 분석 결과.

확장 데이터 표 S1. 샘플 정보.

확장 데이터 표 S2. ADMIXTURE 비율.

확장 데이터 표 S3. 데블스 게이트에 대한 outgroup f3 통계량.

확장 데이터 표 S4. outgroup f3 및 공간.

확장 데이터 표 S5. MA1과 우스티-이심에 대한 outgroup f3 통계량.

확장 데이터 표 S6. MA1과 우스티-이심에 대한 D 점수.

확장 데이터 표 S7. 울치족에 대한 D 점수.

확장 데이터 표 S8. 한국인과 일본인에 대한 혼합 f3 통계량.

확장 데이터 표 S9. 관심 표현형.

References (55–84)

 

참고문헌 및 주석

  1. I. Lazaridis, D. Nadel, G. Rollefson, D. C. Merrett, N. Rohland, S. Mallick, D. Fernandes, M.Novak, B. Gamarra, K. Sirak, S. Connell, K. Stewardson, E. Harney, Q. Fu, G. Gonzalez-Fortes, E. R. Jones, S. Alpaslan Roodenberg, G. Lengyel, F. Bocquentin, B. Gasparian, J. M. Monge, M. Gregg, V. Eshed, A.-S. Mizrahi, C. Meiklejohn, F. Gerritsen, L. Bejenaru, M. Blüher, A. Campbell, G. Cavalleri, D. Comas, P. Froguel, E. Gilbert, S. M. Kerr, P. Kovacs, J. Krause, D. McGettigan, M.Merrigan, D. Andrew Merriwether, S. O’Reilly, M.B. Richards, O. Semino, M. Shamoon-Pour, G. Stefanescu, M. Stumvoll, A. Tönjes, A. Torroni, J. F. Wilson, L. Yengo, N. A. Hovhannisyan, N. Patterson, R. Pinhasi, D. Reich, Genomic insights into the origin of farming in the ancient Near East. Nature 536, 419–424 (2016).
  2. M. Gallego-Llorente, S. Connell, E. R. Jones, D. C. Merrett, Y. Jeon, A. Eriksson, V. Siska, C. Gamba, C. Meiklejohn, R. Beyer, S. Jeon, Y. S. Cho, M. Hofreiter, J. Bhak, A. Manica, R. Pinhasi, The genetics of an early Neolithic pastoralist from the Zagros, Iran. Sci. Rep. 6, 31326 (2016).
  3. I. Lazaridis, N. Patterson, A. Mittnik, G. Renaud, S. Mallick, K. Kirsanow, P. H. Sudmant, J. G. Schraiber, S. Castellano, M. Lipson, B. Berger, C. Economou, R. Bollongino, Q. Fu, K. I. Bos, S. Nordenfelt, H. Li, C. de Filippo, K. Prüfer, S. Sawyer, C. Posth, W. Haak, F. Hallgren, E. Fornander, N. Rohland, D. Delsate, M. Francken, J.-M. Guinet, J. Wahl, G. Ayodo, H. A. Babiker, G. Bailliet, E. Balanovska, O. Balanovsky, R. Barrantes, G. Bedoya, H. Ben-Ami, J. Bene, F. Berrada, C. M. Bravi, F. Brisighelli, G. B. J. Busby, F. Cali, M. Churnosov, D. E. C. Cole, D. Corach, L. Damba, G. van Driem, S. Dryomov, J.-M. Dugoujon, S. A. Fedorova, I. Gallego Romero, M. Gubina, M. Hammer, B. M. Henn, T. Hervig, U. Hodoglugil, A. R. Jha, S. Karachanak-Yankova, R. Khusainova, E. Khusnutdinova, R. Kittles, T. Kivisild, W. Klitz, V. Kučinskas, A. Kushniarevich, L. Laredj, S. Litvinov, T. Loukidis, R. W. Mahley, B. Melegh, E. Metspalu, J. Molina, J. Mountain, K. Näkkäläjärvi, D. Nesheva, T. Nyambo, L. Osipova, J. Parik, F. Platonov, O. Posukh, V. Romano, F. Rothhammer, I. Rudan, R. Ruizbakiev, H. Sahakyan, A. Sajantila, A. Salas, E. B. Starikovskaya, A. Tarekegn, D. Toncheva, S. Turdikulova, I. Uktveryte, O. Utevska, R. Vasquez, M. Villena, M. Voevoda, C. A. Winkler, L. Yepiskoposyan, P. Zalloua, T. Zemunik, A. Cooper, C. Capelli, M. G. Thomas, A. Ruiz-Linares, S. A. Tishkoff, L. Singh, K. Thangaraj, R. Villems, D. Comas, R. Sukernik, M. Metspalu, M. Meyer, E. E. Eichler, J. Burger, M. Slatkin, S. Pääbo, J. Kelso, D. Reich, J. Krause, Ancient human genomes suggest three ancestral populations for present-day Europeans. Nature 513, 409–413 (2014).
  4. W. Haak, I. Lazaridis, N. Patterson, N. Rohland, S. Mallick, B. Llamas, G. Brandt, S. Nordenfelt, E. Harney, K. Stewardson, Q. Fu, A. Mittnik, E. Bánffy, C. Economou, M. Francken, S. Friederich, R. Garrido Pena, F. Hallgren, V. Khartanovich, A. Khokhlov, M. Kunst, P. Kuznetsov, H. Meller, O. Mochalov, V. Moiseyev, N. Nicklisch, S. L. Pichler, R. Risch, M. A. Rojo Guerra, C. Roth, A. Szécsényi-Nagy, J. Wahl, M. Meyer, J. Krause, D. Brown, D. Anthony, A. Cooper, K. Werner Alt, D. Reich, Massive migration from the steppe was a source for Indo-European languages in Europe. Nature 522, 207–211 (2015).
  5. E. R. Jones, G. Gonzalez-Fortes, S. Connell, V. Siska, A. Eriksson, R. Martiniano, R. L. McLaughlin, M. Gallego Llorente, L. M. Cassidy, C. Gamba, T. Meshveliani, O. Bar-Yosef, W. Müller, A. Belfer-Cohen, Z. Matskevich, N. Jakeli, T. F. G. Higham, M. Currat, D. Lordkipanidze, M. Hofreiter, A. Manica, R. Pinhasi, D. G. Bradley, Upper Palaeolithic genomes reveal deep roots of modern Eurasians. Nat. Commun. 6, 8912 (2015).
  6. M. Raghavan, M. DeGiorgio, A. Albrechtsen, I. Moltke, P. Skoglund, T. S. Korneliussen, B. Grønnow, M. Appelt, H. Christian Gulløv, T. Max Friesen, W. Fitzhugh, H. Malmström, S. Rasmussen, J. Olsen, L. Melchior, B. T. Fuller, S. M. Fahrni, T. Stafford Jr., V. Grimes, M. A. P. Renouf, J. Cybulski, N. Lynnerup, M. M. Lahr, K. Britton, R. Knecht, J. Arneborg, M. Metspalu, O. E. Cornejo, A.-S. Malaspinas, Y. Wang, M. Rasmussen, V. Raghavan, T. V. O. Hansen, E. Khusnutdinova, T. Pierre, K. Dneprovsky, C. Andreasen, H. Lange, M. G. Hayes, J. Coltrain, V. A. Spitsyn, A. Götherström, L. Orlando, T. Kivisild, R. Villems, M. H. Crawford, F. C. Nielsen, J. Dissing, J. Heinemeier, M. Meldgaard, C. Bustamante, D. H. O’Rourke, M. Jakobsson, M. T. P. Gilbert, R. Nielsen, E. Willerslev, The genetic prehistory of the New World Arctic. Science 345, 1255832 (2014).
  7. M. Raghavan, M. Steinrücken, K. Harris, S. Schiffels, S. Rasmussen, M. DeGiorgio, A. Albrechtsen, C. Valdiosera, M. C. Ávila-Arcos, A.-S. Malaspinas, A. Eriksson, I. Moltke, M.Metspalu, J.R.Homburger, J. Wall, O. E. Cornejo, J. Víctor Moreno-Mayar, T. S. Korneliussen, T. Pierre, M. Rasmussen, P. F. Campos, P. de Barros Damgaard, M. E. Allentoft, J. Lindo, E. Metspalu, R. Rodríguez-Varela, J. Mansilla, C. Henrickson, A. Seguin-Orlando, H. Malmström, T. Stafford Jr., S. S. Shringarpure, A. Moreno-Estrada, M. Karmin, K. Tambets, A. Bergström, Y. Xue, V. Warmuth, A. D. Friend, J. Singarayer, P. Valdes, F. Balloux, I. Leboreiro, J. L. Vera, H. Rangel-Villalobos, D. Pettener, D. Luiselli, L. G. Davis, E. Heyer, C. P. E. Zollikofer, M. S. Ponce de León, C. I. Smith, V. Grimes, K.-A. Pike, M. Deal, B. T. Fuller, B. Arriaza, V. Standen, M. F. Luz, F. Ricaut, N. Guidon, L. Osipova, M. I. Voevoda, O. L. Posukh, O. Balanovsky, M. Lavryashina, Y. Bogunov, E. Khusnutdinova, M. Gubina, E. Balanovska, S.Fedorova,S.Litvinov,B.Malyarchuk,M.Derenko,M.J.Mosher,D.Archer,J.Cybulski, B.Petzelt,J.Mitchell,R.Worl,P.J.Norman,P.Parham,B.M.Kemp,T.Kivisild,C.Tyler-Smith, M. S. Sandhu, M. Crawford, R. Villems, D. G. Smith, M. R. Waters, T. Goebel, J. R. Johnson, R. S. Malhi, M. Jakobsson, D. J. Meltzer, A. Manica, R. Durbin, C. D. Bustamante, Y. S. Song, R. Nielsen, E. Willerslev, Genomic evidence for the Pleistocene and recent population history of native Americans. Science 349, aab3884 (2015).
  8. Y. Kuzmin, The Paleolithic-to-Neolithic transition and the origin of pottery production in the Russian Far East: A geoarchaeological approach. Archaeol. Ethnol. Anthropol. Eurasia 4, 16–26 (2003).
  9. Z. Chi, H. Hsiao-chun, The Encyclopedia of Global Human Migration (Blackwell Publishing Ltd., 2013).
  10. Y. V. Kuzmin, C. T. Keally, A. J. T. Jull, G. S. Burr, N. A. Klyuev, The earliest surviving textiles in East Asia from Chertovy Vorota Cave, Primorye province, Russian Far East. Antiquity 86, 325–337 (2012).
  11. M. Tanaka, V. M. Cabrera, A. M. González, J. M. Larruga, T. Takeyasu, N. Fuku, L.-J. Guo, R. Hirose, Y. Fujita, M. Kurata, K.-i. Shinoda, K. Umetsu, Y. Yamada, Y. Oshida, Y. Sato, N. Hattori, Y. Mizuno, Y. Arai, N. Hirose, S. Ohta, O. Ogawa, Y. Tanaka, R. Kawamori, M. Shamoto-Nagai, W. Maruyama, H. Shimokata, R. Suzuki, H. Shimodaira, Mitochondrial genome variation in eastern Asia and the peopling of Japan. Genome Res. 14, 1832–1850 (2004).
  12. G. Renaud, V. Slon, A. T. Duggan, J. Kelso, Schmutzi: Estimation of contamination and endogenous mitochondrial consensus calling for ancient DNA. Genome Biol. 16, 224 (2015).
  13. P. Skoglund, B. H. Northoff, M. V. Shunkov, A. P. Derevianko, S. Pääbo, J. Krause, M. Jakobsson, Separating endogenous ancient DNA from modern day contamination in a Siberian Neandertal. Proc. Natl. Acad. Sci. U.S.A. 111, 2229–2234 (2014).
  14. Q. Fu, H. Li, P. Moorjani, F. Jay, S. M. Slepchenko, A. A. Bondarev, P. L. F. Johnson, A. Aximu-Petri, K. Prüfer, C. de Filippo, M. Meyer, N. Zwyns, D. C. Salazar-García, Y. V. Kuzmin, S. G. Keates, P. A. Kosintsev, D. I. Razhev, M. P. Richards, N. V. Peristov, M. Lachmann, K. Douka, T. F. G. Higham, M. Slatkin, J.-J. Hublin, D. Reich, J. Kelso, T. Bence Viola, S. Pääbo, Genome sequence of a 45,000-year-old modern human from western Siberia. Nature 514, 445–449 (2014).
  15. M. Raghavan, P. Skoglund, K. E. Graf, M. Metspalu, A. Albrechtsen, I. Moltke, S. Rasmussen, T. W. Stafford Jr., L. Orlando, E. Metspalu, M. Karmin, K. Tambets, S. Rootsi, R. Mägi, P. F. Campos, E. Balanovska, O. Balanovsky, E. Khusnutdinova, S. Litvinov, L. P. Osipova, S. A. Fedorova, M. I. Voevoda, M. DeGiorgio, T. Sicheritz-Ponten, S. Brunak, S. Demeshchenko, T. Kivisild, R. Villems, R. Nielsen, M. Jakobsson, E. Willerslev, Upper Palaeolithic Siberian genome reveals dual ancestry of Native Americans. Nature 505,87–91 (2014).
  16. M. E. Allentoft, M. Sikora, K.-G. Sjögren, S. Rasmussen, M. Rasmussen, J. Stenderup, P. B. Damgaard, H. Schroeder, T. Ahlström, L. Vinner, A.-S. Malaspinas, A. Margaryan, T. Higham, D. Chivall, N. Lynnerup, L. Harvig, J. Baron, P. Della Casa, P. Dąbrowski, P. R. Duffy, A. V. Ebel, A. Epimakhov, K. Frei, M. Furmanek, T. Gralak, A. Gromov, S. Gronkiewicz, G. Grupe, T. Hajdu, R. Jarysz, V. Khartanovich, A. Khokhlov, V. Kiss, J. Kolář, A. Kriiska, I. Lasak, C. Longhi, G. McGlynn, A. Merkevicius, I. Merkyte, M. Metspalu, R. Mkrtchyan, V. Moiseyev, L. Paja, G. Pálfi, D. Pokutta, Ł. Pospieszny, T. Douglas Price, L. Saag, M. Sablin, N. Shishlina, V. Smrčka, V. I. Soenov, V. Szeverényi, G. Tóth, S. V. Trifanova, L. Varul, M. Vicze, L. Yepiskoposyan, V. Zhitenev, L. Orlando, T. Sicheritz-Pontén, S. Brunak, R. Nielsen, K. Kristiansen, E. Willerslev, Population genomics of Bronze Age Eurasia. Nature 522, 167–172 (2015).
  17. C. Gamba, E. R. Jones, M. D. Teasdale, R. L. McLaughlin, G. Gonzalez-Fortes, V. Mattiangeli, L. Domboróczki, I. Kővári, I. Pap, A. Anders, A. Whittle, J. Dani, P. Raczky, T. F. G. Higham, M. Hofreiter, D. G. Bradley, R. Pinhasi, Genome flux and stasis in a five millennium transect of European prehistory. Nat. Commun. 5, 5257 (2014).
  18. N. Patterson, A. L. Price, D. Reich, Population structure and eigenanalysis. PLOS Genet. 2, e190 (2006).
  19. D. H. Alexander, J. Novembre, K. Lange, Fast model-based estimation of ancestry in unrelated individuals. Genome Res. 9, 1655–1664 (2009).
  20. F. Sánchez-Quinto, H. Schroeder, O. Ramirez, M. C. Ávila-Arcos, M. Pybus, I. Olalde, A. M. V. Velazquez, M. E. P. Marcos, J. M. V. Encinas, J. Bertranpetit, L. Orlando, M. T. P. Gilbert, C. Lalueza-Fox, Genomic affinities of two 7,000-year-old Iberian hunter- gatherers. Curr. Biol. 22, 1494–1499 (2012).
  21. K. Imamura, Prehistoric Japan: New Perspectives on Insular East Asia (Univ. Hawaii Press, 1996).
  22. T. A. Jinam, H. Kanzawa-Kiriyama, N. Saitou, Human genetic diversity in the Japanese Archipelago: Dual structure and beyond. Genes Genet. Syst. 90, 147–152 (2015).
  23. R. Rasteiro, L. Chikhi, Revisiting the peopling of Japan: An admixture perspective. J. Hum. Genet. 54, 349–354 (2009).
  24. Y. He, W. R. Wang, S. Xu, L. Jin; Pan-Asia SNP Consortium, Paleolithic contingent in modern Japanese: Estimation and inference using genome-wide data. Sci. Rep. 2, 355 (2012).
  25. T. A. Jinam, H. Kanzawa-Kiriyama, I. Inoue, K. Tokunaga, K. Omoto, N. Saitou, Unique characteristics of the Ainu population in Northern Japan. J. Hum. Genet. 60,565–571 (2015).
  26. N. Adachi, K.-i. Shinoda, K. Umetsu, H. Matsumura, Mitochondrial DNA analysis of Jomon skeletons from the Funadomari site, Hokkaido, and its implication for the origins of Native American. Am. J. Phys. Anthropol. 138, 255–265 (2009).
  27. N. Adachi, K.-i. Shinoda, K. Umetsu, T. Kitano, H. Matsumura, R. Fujiyama, J. Sawada, M. Tanaka, Mitochondrial DNA analysis of Hokkaido Jomon skeletons: Remnants of archaic maternal lineages at the southwestern edge of former Beringia. Am. J. Phys. Anthropol. 146, 346–360 (2011).
  28. H.Kanzawa-Kiriyama,K.Kryukov,T.A.Jinam,K.Hosomichi,A.Saso,G.Suwa,S.Ueda, M. Yoneda, A. Tajima, K.-i. Shinoda, I. Inoue, N. Saitou, A partial nuclear genome of the Jomons who lived 3000 years ago in Fukushima, Japan. J. Hum. Genet. 10.1038/jhg.2016.110 (2016).
  29. HUGO Pan-Asian SNP Consortium, Mapping human genetic diversity in Asia. Science 326, 1541–1545 (2009).
  30. H.-J. Jin, C. Tyler-Smith, W. Kim, The peopling of Korea revealed by analyses of mitochondrial DNA and Y-chromosomal markers. PLOS ONE 4, e4210 (2009).
  31. H.-J. Jin, K.-D. Kwak, M. F. Hammer, Y. Nakahori, T. Shinka, J.-W. Lee, F. Jin, X. Jia, C. Tyler-Smith, W. Kim, Y-chromosomal DNA haplogroups and their implications for the dual origins of the Koreans. Hum. Genet. 114,27–35 (2003).
  32. R. A. Sturm, D. L. Duffy, Human pigmentation genes under environmental selection. Genome Biol. 13, 248 (2012).
  33. A. Fujimoto, R. Kimura, J. Ohashi, K. Omi, R. Yuliwulandari, L. Batubara, M. S. Mustofa, U. Samakkarn, W. Settheetham-Ishida, T. Ishida, Y. Morishita, T. Furusawa, M. Nakazawa, R. Ohtsuka, K. Tokunaga, A scan for genetic determinants of human hair morphology: EDAR is associated with Asian hair thickness. Hum. Mol. Genet. 17, 835–843 (2008).
  34. J.-H. Park, T. Yamaguchi, C. Watanabe, A. Kawaguchi, K. Haneji, M. Takeda, Y.-I. Kim, Y. Tomoyasu, M. Watanabe, H. Oota, T. Hanihara, H. Ishida, K. Maki, S.-B. Park, R. Kimura, Effects of an Asian-specific nonsynonymous EDAR variant on multiple dental traits. J. Hum. Genet. 57, 508–514 (2012).
  35. Y. Itan, A. Powell, M. A. Beaumont, J. Burger, M. G. Thomas, The origins of lactase persistence in Europe. PLOS Comput. Biol. 5, e1000491 (2009).
  36. D. W. Crabb, H. J. Edenberg, W. F. Bosron, T. K. Li, Genotypes for aldehyde dehydrogenase deficiency and alcohol sensitivity. The inactive ALDH22 allele is dominant. J. Clin. Invest. 83, 314–316 (1989).
  37. D. Y. Yang, B. Eng, J. S. Waye, J. C. Dudar, S. R. Saunders, Improved DNA extraction from ancient bones using silica-based spin columns. Am. J. Phys.Anthropol. 105, 539–543 (1998).
  38. M. Meyer, M. Kircher, Illumina sequencing library preparation for highly multiplexed target capture and sequencing. Cold Spring Harb. Protoc. 2010, pdb.prot5448 (2010).
  39. M. Martin, Cutadapt removes adapter sequences from high-throughput sequencing reads. EMBnet.journal 17,10–12 (2011).
  40. G. Renaud, U. Stenzel, J. Kelso, leeHom: Adaptor trimming and merging for Illumina sequencing reads. Nucleic Acids Res. 42, e141 (2014).
  41. H. Li, R. Durbin, Fast and accurate short read alignment with Burrows-Wheeler transform. Bioinformatics 25, 1754–1760 (2009).
  42. H. Li, B. Handsaker, A. Wysoker, T. Fennell, J. Ruan, N. Homer, G. Marth, G. Abecasis, R. Durbin; 1000 Genome Project Data, The sequence alignment/map format and SAMtools. Bioinformatics 25, 2078–2079 (2009).
  43. A. McKenna, M. Hanna, E. Banks, A. Sivachenko, K. Cibulskis, A. Kernytsky, K. Garimella, D. Altshuler, S. Gabriel, M. Daly, M. A. DePristo, Thegenome analysis toolkit: A MapReduce framework for analyzing next-generation DNA sequencing data. Genome Res. 20, 1297–1303 (2010).
  44. H. Jónsson, A. Ginolhac, M. Schubert, P. L. F. Johnson, L. Orlando, mapDamage2.0: Fast approximate Bayesian estimates of ancient DNA damage parameters. Bioinformatics 29, 1682–1684 (2013).
  45. A. R. Quinlan, I. M. Hall, BEDTools: A flexible suite of utilities for comparing genomic features. Bioinformatics 26, 841–842 (2010).
  46. T. S. Korneliussen, A. Albrechtsen, R. Nielsen, ANGSD: Analysis of next generation sequencing data. BMC Bioinformatics 15, 356 (2014).
  47. D. Vianello, F. Sevini, G. Castellani, L. Lomartire, M. Capri, C. Franceschi, HAPLOFIND: A new method for high-throughput mtDNA haplogroup assignment. Hum. Mutat. 34, 1189–1194 (2013).
  48. P. Skoglund, H. Malmström, A. Omrak, M. Raghavan, C. Valdiosera, T. Günther, P. Hall, K. Tambets, J. Parik, K.-G. Sjögren, J. Apel, E. Willerslev, J. Storå, A. Götherström, M. Jakobsson, Genomic diversity and admixture differs for stone-age Scandinavian foragers and farmers. Science 344, 747–750 (2014).
  49. N. Patterson, P. Moorjani, Y. Luo, S. Mallick, N. Rohland, Y. Zhan, T. Genschoreck, T. Webster, D. Reich, Ancient admixture in human history. Genetics 192, 1065–1093 (2012).
  50. S. Purcell, B. Neale, K. Todd-Brown, L. Thomas, M. A. R. Ferreira, D. Bender, J. Maller, P. Sklar, P. I. W. de Bakker, M. J. Daly, P. C. Sham, PLINK: A tool set for whole-genome association and population-based linkage analyses. Am.J.Hum.Genet.81,559–575 (2007).
  51. M. Sikora, M. L. Carpenter, A. Moreno-Estrada, B. M. Henn, P. A. Underhill, F. Sánchez-Quinto, I. Zara, M. Pitzalis, C. Sidore, F. Busonero, A. Maschio, A. Angius, C. Jones, J. Mendoza-Revilla, G. Nekhrizov, D. Dimitrova, N. Theodossiev, T. T. Harkins, A. Keller, F. Maixner, A. Zink, G. Abecasis, S. Sanna, F. Cucca, C. D. Bustamante, Population genomic analysis of ancient and modern genomes yields new insights into the genetic ancestry of the Tyrolean iceman and the genetic structure of Europe. PLOS Genet. 10, e1004353 (2014).
  52. R.E. Green, J. Krause, A. W. Briggs, T. Maricic, U. Stenzel, M.Kircher, N. Patterson, H. Li, W.Zhai, M. H.-Y. Fritz, N. F. Hansen, E. Y. Durand, A.-S. Malaspinas, J. D. Jensen, T. Marques-Bonet, C. Alkan, K. Prüfer, M. Meyer, H. A. Burbano, J. M. Good, R. Schultz, A. Aximu-Petri, A. Butthof, B. Höber, B. Höffner, M. Siegemund, A. Weihmann, C. Nusbaum, E. S. Lander, C. Russ, N. Novod, J. Affourtit, M. Egholm, C. Verna, P. Rudan, D. Brajkovic, Ž.Kucan,I.Gušic, V. B. Doronichev, L. V. Golovanova, C. Lalueza-Fox, M. de la Rasilla, J. Fortea, A. Rosas, R. W. Schmitz, P. L. F. Johnson, E. E. Eichler, D. Falush, E. Birney, J. C. Mullikin, M. Slatkin, R. Nielsen, J. Kelso, M. Lachmann, D. Reich, S. Pääbo, A draft sequence of the Neandertal genome. Science 328, 710–722 (2010).
  53. D. Reich, K. Thangaraj, N. Patterson, A. L. Price, L. Singh, Reconstructing Indian population history. Nature 461, 489–494 (2009).
  54. B. L. Browning, S. R. Browning, Genotype imputation with millions of reference samples. Am. J. Hum. Genet. 98, 116–126 (2016).
  55. Z. V. Andreeva, V. Tatarnikov, Peshera “Chertovy Vorota v Primor’e”. Arheol. Otkrytiya 1973 Goda Cave Devils Gate Primorye 1973 Excav. Seas. Mosc., 180–181 (1974).
  56. I. S. Zhushchikhovskaya, Archaeology of the Russian Far East: Essays in Stone Age Prehistory, S.M.Nelson,A.P.Derevianko,Y.V.Kuzmin,R.L.Bland,Eds.(Archaeopress,2006),pp.101–122.
  57. A. Kuznecov, The ancient settlement in a cave Devil’s Gate and some problems of the Neolithic of Primorye. Ross. Arheol. 2,17–19 (2002).
  58. T. S. Balueva, Cranial samples from a Neolithic layer from Devil’s Gate Cave, Primorye. Vopr. Antropol. 58, 184–187 (1978).
  59. M. G. Llorente, E. R. Jones, A. Eriksson, V. Siska, K. W. Arthur, J. W. Arthur, M. C. Curtis, J. T. Stock, M. Coltorti, P. Pieruccini, S. Stretton, F. Brock, T. Higham, Y. Park, M. Hofreiter, D. G. Bradley, J. Bhak, R. Pinhasi, A. Manica, Ancient Ethiopian genome reveals extensive Eurasian admixture throughout the African continent. Science 350, 820–822 (2015).
  60. B. Shapiro, M. Hofreiter, A paleogenomic perspective on evolution and gene function: New insights from ancient DNA. Science 343, 1236573 (2014).
  61. A. Manica, W. Amos, F. Balloux, T. Hanihara, The effect of ancient population bottlenecks on human phenotypic variation. Nature 448, 346–348 (2007).
  62. R. L. Lamason, M.-A. P. K. Mohideen, J. R. Mest, A. C. Wong, H. L. Norton, M. C. Aros, M. J. Jurynec, X. Mao, V. R. Humphreville, J. E. Humbert, S. Sinha, J. L. Moore, P. Jagadeeswaran, W. Zhao, G. Ning, I. Makalowska, P. M. McKeigue, D. O’Donnell, R. Kittles, E. J. Parra, N. J. Mangini, D. J. Grunwald, M. D. Shriver, V. A. Canfield, K. C. Cheng, SLC24A5, a putative cation exchanger, affects pigmentation in zebrafish and humans. Science 310, 1782–1786 (2005).
  63. R. A. Sturm, Molecular genetics of human pigmentation diversity. Hum. Mol. Genet. 18, R9–R17 (2009).
  64. V. A. Canfield, A. Berg, S. Peckins, S. M. Wentzel, K. Chung Ang, S. Oppenheimer, K. C. Cheng, Molecular phylogeography of a human autosomal skin color locus under natural selection. G3 3, 2059–2067 (2013).
  65. C. Basu Mallick, F. Mircea Iliescu, M. Möls, S. Hill, R. Tamang, G. Chaubey, R. Goto, S. Y. W. Ho, I. Gallego Romero, F. Crivellaro, G. Hudjashov, N. Rai, M. Metspalu, C. G. N. Mascie-Taylor, R. Pitchappan, L. Singh, M. Mirazon-Lahr, K. Thangaraj, R. Villems, T. Kivisild, The light skin allele of SLC24A5 in south Asians and Europeans shares identity by descent. PLOS Genet. 9, e1003912 (2013).
  66. S. Wilde, A. Timpson, K. Kirsanow, E. Kaiser, M. Kayser, M. Unterländer, N. Hollfelder, I. D. Potekhina, W. Schier, M. G. Thomas, J. Burger, Direct evidence for positive selection of skin, hair, and eye pigmentation in Europeans during the last 5,000 y. Proc. Natl. Acad. Sci. U.S.A. 111, 4832–4837 (2014).
  67. H. L. Norton, R. A. Kittles, E. Parra, P. McKeigue, X. Mao, K. Cheng, V. A. Canfield, D. G. Bradley, B. McEvoy, M. D. Shriver, Genetic evidence for the convergent evolution of light skin in Europeans and East Asians. Mol. Biol. Evol. 24, 710–722 (2007).
  68. M. P. Donnelly, P. Paschou, E. Grigorenko, D. Gurwitz, C. Barta, R.-B. Lu, O. V. Zhukova, J.-J. Kim, M. Siniscalco, M. New, H. Li, S. L. B. Kajuna, V. G. Manolopoulos, W. C. Speed, A. J. Pakstis, J. R. Kidd, K. K. Kidd, A global view of the OCA2-HERC2 region and pigmentation. Hum. Genet. 131, 683–696 (2011).
  69. J. L. Hider, R. M. Gittelman, T. Shah, M. Edwards, A. Rosenbloom, J. M. Akey, E. J. Parra, Exploring signatures of positive selection in pigmentation candidate genes in populations of East Asian ancestry. BMC Evol. Biol. 13, 150 (2013).
  70. I. Yuasa, K. Umetsu, S. Harihara, A. Kido, A. Miyoshi, N. Saitou, B. Dashnyam, F. Jin, G. Lucotte, P. K. Chattopadhyay, L. Henke, J. Henke, Distribution of two Asian-related coding SNPs in the MC1R and OCA2 genes. Biochem. Genet. 45, 535–542 (2007).
  71. I. Yuasa, K. Umetsu, S. Harihara, A. Miyoshi, N. Saitou, K. Sook Park, B. Dashnyam, F. Jin, G. Lucotte, P. K. Chattopadhyay, L. Henke, J. Henke, OCA2*481Thr,a hypofunctional allele in pigmentation, is characteristic of northeastern Asian populations. J. Hum. Genet. 52, 690–693 (2007).
  72. I. Yuasa, S. Harihara, F. Jin, H. Nishimukai, J. Fujihara, Y. Fukumori, H. Takeshita, K. Umetsu, N. Saitou, Distribution of OCA2∗481Thr and OCA2∗615Arg, associated with hypopigmentation, in several additional populations. Leg. Med. 13, 215–217 (2011).
  73. E. M. Ramos, D. Hoffman, H. A. Junkins, D. Maglott, L. Phan, S. T. Sherry, M. Feolo, L.A.Hindorff,Phenotype–GenotypeIntegrator(PheGenI):Synthesizinggenome-wideassociation study (GWAS) data with existing genomic resources. Eur. J. Hum. Genet. 22,144–147 (2014).
  74. A.Fujimoto,J.Ohashi,N.Nishida,T.Miyagawa,Y.Morishita,T.Tsunoda,R.Kimura, K. Tokunaga, A replication study confirmed the EDAR gene to be a major contributor to population differentiation regarding head hair thickness in Asia. Hum. Genet. 124, 179–185 (2008).
  75. Y. G. Kamberov, S. Wang, J. Tan, P. Gerbault, A. Wark, L. Tan, Y. Yang, S. Li, K. Tang, H. Chen, A. Powell, Y. Itan, D. Fuller, J. Lohmueller, J. Mao, A. Schachar, M. Paymer, E. Hostetter, E. Byrne, M.Burnett,A.P.McMahon,M.G.Thomas,D.E.Lieberman,L.Jin,C.J.Tabin,B.A.Morgan, P. C. Sabeti, Modeling recent human evolution in mice by expression of a selected EDAR variant. Cell 152, 691–702 (2013).
  76. H. W. Goedde, D. P. Agarwal, G. Fritze, D. Meier-Tackmann, S. Singh, G. Beckmann, K. Bhatia, L. Z. Chen, B. Fang, R. Lisker, Y. K. Paik, F. Rothhammer, N. Saha, B. Segal, L. M. Srivastava, A. Czeizel, Distribution of ADH2 and ALDH2 genotypes in different populations. Hum. Genet. 88, 344–346 (1992).
  77. H. Li, S. Borinskaya, K. Yoshimura, N. Kal’ina, A. Marusin, V. A. Stepanov, Z. Qin, S. Khaliq, M.-Y. Lee, Y. Yang, A. Mohyuddin, D. Gurwitz, S. Q. Mehdi, E. Rogaev, L. Jin, N. K. Yankovsky, J. R. Kidd, K. K. Kidd, Refined geographic distribution of the oriental ALDH2*504Lys (nee 487Lys) variant. Ann. Hum. Genet. 73, 335–345 (2009).
  78. K. Matsuo, N. Hamajima, M. Shinoda, S. Hatooka, M. Inoue, T. Takezaki, K. Tajima, Gene–environment interaction between an aldehyde dehydrogenase-2 (ALDH2) polymorphism and alcohol consumption for the risk of esophageal cancer. Carcinogenesis 22, 913–916 (2001).
  79. D. Cusi, C. Barlassina, T. Azzani, G. Casari, L. Citterio, M. Devoto, N. Glorioso, C. Lanzani, P. Manunta, M. Righetti, R. Rivera, P. Stella, C. Troffa, L. Zagato, G. Bianchi, Polymorphisms of a-adducin and salt sensitivity in patients with essential hypertension. Lancet 349, 1353–1357 (1997).
  80. E. van den Wildenberg, R. W. Wiers, J. Dessers, R. G. J. H. Janssen, E. H. Lambrichs, H. J. M. Smeets, G. J. P. van Breukelen, A functional polymorphism of the m-opioid receptor gene (OPRM1) influences cue-induced craving for alcohol in male heavy drinkers. Alcohol. Clin. Exp. Res. 31,1–10 (2007).
  81. B. S. Haerian, M. S. Haerian, OPRM1 rs1799971 polymorphism and opioid dependence: Evidence from a meta-analysis. Pharmacogenomics 14, 813–824 (2013).
  82. S. Rodriguez, C. D. Steer, A. Farrow, J. Golding, I. N. M. Day, Dependence of deodorant usage on ABCC11 genotype: Scope for personalized genetics in personal hygiene. J. Invest. Dermatol. 133, 1760–1767 (2013).
  83. K.-i. Yoshiura, A. Kinoshita, T. Ishida, A. Ninokata, T. Ishikawa, T. Kaname, M. Bannai, K. Tokunaga, S. Sonoda, R. Komaki, M. Ihara, V. A. Saenko, G. K. Alipov, I. Sekine, K. Komatsu, H. Takahashi, M. Nakashima, N. Sosonkina, C. K. Mapendano, M. Ghadami, M. Nomura, D.-S. Liang, N. Miwa, D.-K. Kim, A. Garidkhuu, N. Natsume, T. Ohta, H. Tomita, A. Kaneko, M. Kikuchi, G. Russomando, K. Hirayama, M. Ishibashi, A. Takahashi, N. Saitou, J. C. Murray, S. Saito, Y. Nakamura, N. Niikawa, A SNP in the ABCC11 gene is the determinant of human earwax type. Nat. Genet. 38, 324–330 (2006).
  84. Y. S. Cho, C.-H. Chen, C. Hu, J. Long, R. T. H. Ong, X. Sim, F. Takeuchi, Y. Wu, M. Jin Go, T. Yamauchi, Y.-C. Chang, S. H. Kwak, R. C. W. Ma, K. Yamamoto, L. S. Adair, T. Aung, Q. Cai, L.-C.Chang,Y.-T.Chen,Y.Gao,F.B.Hu,H.-L.Kim,S.Kim,Y.J.Kim,J.J.-M.Lee,N.R.Lee,Y.Li, J. J. Liu, W. Lu, J. Nakamura, E. Nakashima, D. P.-K. Ng, W. T. Tay, F.-J. Tsai, T. Y. Wong, M. Yokota, W. Zheng, R. Zhang, C. Wang, W. Y. So, K. Ohnaka, H. Ikegami, K. Hara, Y. M. Cho, N. H. Cho, T.-J. Chang, Y. Bao, Å. K. Hedman, A. P. Morris, M. I. McCarthy; DIAGRAM Consortium; MuTHER Consortium, R. Takayanagi, K. S. Park, W. Jia,L.-M. Chuang, J. C. N. Chan, S. Maeda, T. Kadowaki, J.-Y. Lee, J.-Y. Wu, Y. Y. Teo, E. S. Tai, X. O. Shu, K. L. Mohlke, N. Kato, B.-G. Han, M. Seielstad, Meta-analysis of genome-wide association studies identifies eight new loci for type 2 diabetes in East Asians. Nat. Genet. 44,67–72 (2012).