#유전자 #고대DNA #미토콘드리아 #동아시아
Liu, J., Zeng, W., Sun, B. et al. (2021) ‘Maternal genetic structure in ancient Shandong between 9500 and 1800 years ago’, Science Bulletin, 66(11), pp. 1129–1135. https://linkinghub.elsevier.com/retrieve/pii/S2095927321000657.
Maternal genetic structure in ancient Shandong between 9500 and 1800 years ago
고대 산동(山東) 사람들의 어머니는 누구였을까: DNA로 되짚어보는 9500년 전부터 1800년 전까지의 모계 혈통 기록
Juncen Liua,b,c,1, Wen Zengd,1, Bo Sune,1, Xiaowei Maoa,b,1, Yongsheng Zhaod, Fen Wangf, Zhenguang Lie, Fengshi Luanf, Junfeng Guog, Chao Zhue, Zimeng Wange, Chengmin Weie, Ming Zhanga,b,c, Peng Caoa, Feng Liua, Qingyan Daia, Xiaotian Fenga, Ruowei Yanga, Weihong Houa,b, Wanjing Pinga, Xiaohong Wuh, E. Andrew Bennetta,b, Yichen Liua,b, Qiaomei Fua,b,c,*
유준잠(劉俊岑)a,b,c,1, 증문(曾雯)d,1, 손파(孫波)e,1, 모효위(毛曉偉)a,b,1, 조영생(趙永生)d, 왕분(王芬)f, 이진광(李振光)e, 난풍실(欒豐實)f, 곽준봉(郭俊鋒)g, 주초(朱超)e, 왕자맹(王子孟)e, 위성민(魏成敏)e, 장명(張明)a,b,c, 조붕(曹鵬)a, 유봉(劉鋒)a, 대경염(代慶豔)a, 풍효념(馮曉恬)a, 양약위(楊若煒)a, 후위홍(侯衛紅)a,b, 평만정(平萬靜)a, 오소홍(吳小紅)h, E. 앤드루 베넷(E. Andrew Bennett)a,b, 유일신(劉逸宸)a,b, 부교매(付巧妹)a,b,c,*
a Key Laboratory of Vertebrate Evolution and Human Origins, Institute of Vertebrate Paleontology and Paleoanthropology, Chinese Academy of Sciences, Beijing 100044, China
중국과학원(中國科學院) 척추고생물 및 고인류 연구소, 척추동물 진화 및 인류 기원 핵심 연구실, 북경(北京) 100044, 중국
b Center for Excellence in Life and Paleoenvironment, Chinese Academy of Sciences, Beijing 100044, China
중국과학원(中國科學院) 생명 및 고환경 탁월 센터, 북경(北京) 100044, 중국
c University of Chinese Academy of Sciences, Beijing 100049, China
중국과학원(中國科學院) 대학, 북경(北京) 100049, 중국
d Institute of Cultural Heritage, Shandong University, Qingdao 266237, China
산동대학(山東大學) 문화유산 연구원, 청도(靑島) 266237, 중국
e Shandong Provincial Institute of Cultural Relics and Archaeology, Jinan 250012, China
산동성(山東省) 문물고고 연구원, 제남(濟南) 250012, 중국
f School of History and Culture, Shandong University, Jinan 250100, China
산동대학(山東大學) 역사문화학원, 제남(濟南) 250100, 중국
g Jinan Municipal Institute of Archaeology, Jinan 250062, China
제남시(濟南市) 고고 연구소, 제남(濟南) 250062, 중국
h School of Archaeology and Museology, Peking University, Beijing 100871, China
북경대학(北京大學) 고고학 및 박물관학과, 북경(北京) 100871, 중국
[리뷰] 중화 쇼비니즘 경사도 평가: 3/10
13. Liu, J., Zeng, W., Sun, B. et al. (2021) ‘Maternal genetic structure in ancient Shandong between 9500 and 1800 years ago’, Science Bulletin, 66(11), pp. 1129–1135. https://linkinghub.elsevier.com/retrieve/pii/S2095927321000657.
(1) 연구 개요 및 저자의 주장
이 연구는 9,500년 전부터 1,800년 전까지 산동 지역 12개 유적지에서 발굴된 86명의 고대인 미토콘드리아 DNA(mtDNA) 전체 염기서열을 분석하여 모계 유산의 장기적인 변화를 추적했다. 핵심 발견은 두 가지다. 첫째, 4,600년 이전의 초기 신석기-대문구 시기 산동인들은 이미 북방계(D4, D5)와 남방계(B4c1, B5b2) 모계 혈통을 함께 가진 다원적 집단이었다. 둘째, 4,600년 이후(롱산 시기)부터는 C, M9, F 계통이 새롭게 등장하며 모계 유전자 풀에 변화가 있었음을 밝혔다. 특히, 연해 지역의 대문구 문화인에게서 B5b2 계통이 높은 빈도로 나타나는 지역적 특수성을 확인했다.
(2) 편향성 분석 (중화 쇼비니즘 경사도: 3/10)
모계 유산에 집중하여 연해 지역의 독자성과 장기적인 연속성을 부각함으로써, 외부로부터의 일방적인 남성 중심의 확산 서사를 약화시키는 데 중요한 기여를 했다.
- 서사 프레이밍 (낮은 편향성): 산동 지역의 장기적인 모계 유산의 연속성과 지역적 특수성을 강조하여, 외부로부터의 일방적인 확산이 아닌 지역 내부의 역동성을 중심으로 서사를 구성했다.
- 모델 선택과 반례 취급 (낮은 편향성): 이 연구에서 밝혀진 연해 지역의 모계 특수성(B5b2 고빈도)은, 타기도 유적이 왜 내륙이 아닌 연해 집단의 후예인지를 설명하는 중요한 근거가 된다.
- 지리·환경 제약 반영 (낮은 편향성): 해안 지역의 독자적인 모계 유산을 확인함으로써, ‘해양 회랑’이 선사 시대 내내 인구 교류의 중요한 통로였음을 간접적으로 지지한다.
- 유전자–문화 결합 가정 (낮은 편향성): 모계 혈통의 강한 연속성을 보여줌으로써, 문화적 변화가 반드시 인구 전체의 완전한 교체를 의미하지 않는다는 점을 시사하며 ‘유전자-문화 분리’ 가능성을 열어두었다.
(3) 결론 재구성
편향이 낮아 큰 수정은 불필요하다. 결론을 보강한다면, 이 연구에서 확인된 연해 지역의 모계 혈통(B5b2)이 멀리 떨어진 홍산 문화인에게서도 발견된다는 사실(Wang, R. et al., 2025)을 명시적으로 연결해야 한다. 이를 통해 ‘산동 연해-홍산 연계’라는 구체적인 교류 네트워크를 제시하고, ‘해양 회랑’이 단순한 남북 교류를 넘어 북방 내륙과도 연결되는 복잡한 네트워크였음을 강조할 수 있다.
[논문요약]
이 논문은 DNA를 이용해 수천 년 전 사람들의 ‘모계 족보’를 추적하는 유전학 탐정 이야기와 같다. 연구 대상 지역은 중국의 산동(山東) 반도인데, 이곳은 예로부터 여러 문화가 만나고 섞이는 중요한 교차로였기 때문에 고대 인구의 이동과 변화를 연구하기에 아주 좋은 장소이다.
핵심 용어 쉽게 이해하기
요약을 읽기 전, 두 가지 핵심 단어만 알면 훨씬 쉬워진다.
- 미토콘드리아 DNA (mtDNA): 우리 몸의 유전 정보(DNA)는 대부분 부모님 양쪽에서 물려받지만, 미토콘드리아 DNA는 오직 어머니에게서 자녀에게로만 전달된다. 아빠는 전달하지 못한다. 그래서 이걸 분석하면 마치 ‘어머니의 성(姓)씨’를 따라가듯, 수천 년 전 외증조할머니, 그 외증조할머니의 어머니까지 모계 혈통을 쭉 추적할 수 있다.
- 하플로그룹 (Haplogroup): 미토콘드리아 DNA를 분석하다 보면, 같은 특징을 공유하는 사람들의 그룹이 나타난다. 이를 ‘하플로그룹’이라고 한다. 쉽게 말해, 같은 하플로그룹에 속한 사람들은 아주 먼 옛날에 같은 어머니 조상(외할머니)을 가졌다는 뜻이다. 거대한 모계 가문의 ‘시조’나 ‘본관’ 같은 개념이다. 이 논문에 나오는 B, D, C, F 등은 모두 이런 가문들의 이름이다.
논문 전체 내용 요약
1부: 초기 산동 사람들 (9500년 ~ 4600년 전)
연구진이 가장 먼저 발견한 사실은, 산동의 유전적 역사가 4600년 전을 기준으로 크게 두 시기로 나뉜다는 점이다.
1부에서는 그 이전, 즉 신석기 시대의 초기 산동 사람들을 다룬다. 이 시기 사람들의 mtDNA를 분석해보니 아주 흥미로운 결과가 나왔다. 오늘날 북부 동아시아인(예: 몽골인, 북부 한족)에게서 주로 발견되는 하플로그룹 D와, 남부 동아시아인(예: 남부 한족, 베트남인)에게서 주로 보이는 하플로그룹 B가 함께 발견되었다. 이는 고대 산동이 남과 북을 잇는 유전적 다리 역할을 했으며, 이미 오래전부터 다양한 혈통이 섞여 살던 곳이었음을 보여준다.
- 논문의 [그림 3-a]는 이 시기를 요약한다.

그림 속 화살표들은 산동 지역(SD)에 살던 고대인들의 유전자가 오늘날의 한족(r), 일본인(j), 북아시아인(R) 등 다양한 민족의 조상이 되어 퍼져나갔음을 상징적으로 보여준다. 특히 아주 오래된 B5b2라는 하플로그룹이 산동에서 발견되어 다른 지역으로 퍼져나간 것은 이 논문의 중요한 발견 중 하나이다.
2부: 새로운 이웃의 등장 (4600년 전 이후)
4600년 전은 중국 역사에서 여러 지역 문화가 통합되는 용산(龍山) 문화가 시작되는 중요한 시기이다. 놀랍게도 이 시기부터 산동 사람들의 유전자에 큰 변화가 생긴다. 이전 시대에는 보이지 않던 새로운 하플로그룹, 즉 C, M9, F 등이 나타나기 시작했다.
이는 외부에서 새로운 사람들이 산동 지역으로 이주해왔다는 강력한 증거이다. 기존에 살던 사람들과 새로 온 사람들이 함께 섞여 살면서 산동의 모계 혈통이 훨씬 더 다양해졌다.
- 논문의 [그림 1]은 이 변화를 시각적으로 잘 요약한다.

이 그림(b)은 유전적 유사성을 보여주는 유전자 지도🗺️라고 할 수 있다. 후기 산동 유적인 유가장(LJZ) 사람들은 현대 북부 동아시아인과 가깝게 뭉쳐있고, 익서(YX) 사람들은 남부 동아시아인과 더 가깝게 나타난다. 이는 산동이 시간이 흐르면서 다양한 혈통이 모여드는 ‘멜팅팟(Melting Pot)’이 되었음을 보여준다.
특별 발견: ‘산동 토박이’ B5b2 하플로그룹의 비밀
이 논문의 가장 흥미로운 탐정 스토리 부분이다. 과학자들은 이전에 B5b2라는 하플로그룹을 가진 사람들이 산동을 거치지 않고 다른 곳으로 이주했다고 생각했다.
하지만 이번 연구에서 무려 9500년 전의 변변(扁扁) 동굴 사람에게서 이 B5b2 혈통을 발견했다. 이는 B5b2 가문이 사실은 아주 오래전부터 산동에 뿌리내리고 살던 ‘토박이’였음을 증명한다.
- 논문의 [그림 2]는 이 B5b2 가문의 ‘모계 족보’를 그린 것이다.

이 유전자 가계도(a, c)🌳를 보면, 가장 오래된 9500년 전 변변(扁扁) 동굴 사람이 이 가문의 뿌리 근처에 있다. 그리고 그 후손인 5400년 전 북견(北阡) 사람들의 가지가 오늘날의 일본인, 북아시아인(부리야트족), 중국인(한족, 허저족)과 직접 연결되는 것을 볼 수 있다. 즉, 수천 년 전 산동에 살던 어떤 할머니가 오늘날 우리 주변에 있는 누군가의 직계 외할머니 조상이 될 수 있다는 놀라운 사실을 보여준다.
최종 결론
이 논문은 mtDNA 분석을 통해, 9500년 전부터 산동 지역이 남북 동아시아 혈통이 뒤섞이는 중요한 무대였음을 밝혔다. 특히 4600년 전을 기점으로 외부 인구가 유입되면서 유전적 다양성이 증가했으며, 오랫동안 산동의 토착 혈통으로 살아온 B5b2 가문이 오늘날 여러 동아시아 민족의 직접적인 조상이 되었음을 증명했다. 이 연구는 고대인의 뼈에 남은 작은 DNA 조각으로 우리 조상들의 거대한 이동과 역사를 복원할 수 있다는 것을 보여준 멋진 사례라고 할 수 있다.
[논문번역]
요약 ABSTRACT
Archaeological and ancient DNA studies revealed that Shandong, a multi-culture center in northern coastal China, was home to ancient populations having ancestry related to both northern and southern East Asian populations. However, the limited temporal and geographical range of previous studies have been insufficient to describe the population history of this region in greater detail. Here, we report the analysis of 86 complete mitochondrial genomes from the remains of 9500 to 1800-year-old humans from 12 archaeological sites across Shandong. For samples older than 4600 years before present (BP), we found haplogroups D4, D5, B4c1, and B5b2, which are observed in present-day northern and southern East Asians. For samples younger than 4600 BP, haplogroups C (C7a1 and C7b), M9 (M9a1), and F (F1a1, F2a, and F4a1) begin to appear, indicating changes in the Shandong maternal genetic structure starting from the beginning of the Longshan cultural period. Within Shandong, the genetic exchange is possible between the coastal and inland regions after 3100 BP. We also discovered the B5b2 lineage in Shandong populations, with the oldest Bianbian individual likely related to the ancestors of some East Asians and North Asians. By reconstructing a maternal genetic structure of Shandong populations, we provide greater resolution of the population dynamics of the northern coastal East Asia over the past nine thousand years.
고고학 및 고대 DNA 연구에 따르면, 중국 북부 해안의 다문화 중심지였던 산동(山東)은 북부와 남부 동아시아 인구 모두와 관련된 조상을 가진 고대 인구의 터전이었다. 그러나 이전 연구들은 시간적, 지리적 범위가 제한적이어서 이 지역의 인구 역사를 더 자세히 설명하기에는 불충분했다. 이 연구에서는 산동(山東) 전역의 12개 고고학 유적지에서 발굴된 9500년에서 1800년 전 인간 유해로부터 얻은 86개의 전체 미토콘드리아 게놈 분석 결과를 보고한다. 지금부터 4600년 전(BP)보다 오래된 시료에서는 오늘날 북부 및 남부 동아시아인에게서 관찰되는 하플로그룹 D4, D5, B4c1, B5b2를 발견했다. 4600년 전(BP)보다 시기가 늦은 시료에서는 하플로그룹 C(C7a1, C7b), M9(M9a1), F(F1a1, F2a, F4a1)가 나타나기 시작했는데, 이는 용산(龍山) 문화 시기 초부터 산동(山東)의 모계 유전 구조에 변화가 있었음을 나타낸다. 산동(山東) 내에서는 3100년 전(BP) 이후 해안과 내륙 지역 간에 유전적 교류가 있었을 가능성이 있다. 우리는 또한 산동(山東) 인구에서 B5b2 계통을 발견했으며, 가장 오래된 변변(扁扁) 동굴 개체는 일부 동아시아인과 북아시아인의 조상과 관련이 있을 가능성이 있다. 산동(山東) 인구의 모계 유전 구조를 재구성함으로써, 우리는 지난 9천 년 동안 북부 해안 동아시아의 인구 역학에 대해 더 높은 해상도의 정보를 제공한다.
Keywords: Ancient DNA, Human, Mitochondrial DNA, East Asia, Neolithic
키워드: 고대 DNA, 인간, 미토콘드리아 DNA, 동아시아, 신석기 시대
목차
2. 재료 및 방법 (Materials and methods)
2.1. 고대 DNA 추출 및 라이브러리 제작 (Ancient DNA extraction and library preparation)
2.2. 용액 내 포획 및 미토콘드리아 DNA 분석 (In-solution capture and analysis of mitochondrial DNA)
3. 결과 및 논의 (Results and discussion)
3.1. 4600 BP를 기준으로 구분되는 유전 구조 (Genetic structure separated by 4600 BP)
3.2. 4600 BP 이전 산동(山東)의 모계 유전 구조 (Maternal genetic structure in Shandong before 4600 BP)
3.3. 4600 BP 이후 산동(山東)의 모계 유전 구조 (Maternal genetic structure in Shandong after 4600 BP)
3.5. 해안과 내륙 산동(山東) 간의 가능한 유전적 교류(Possible genetic exchange between coastal and inland Shandong)
3.6. 산동(山東)에서 하플로그룹 B5b2 계통의 발견(Discovery of the haplogroup B5b2 lineage in Shandong)
1. 서론 (Introduction)
Ancient DNA (aDNA) studies have helped clarify human population history and evolution in East Eurasia [1–9], such as revealing a genetic distinction between ancient populations in northern and southern East Asia. Shandong province is situated in the northern coastal region of China, and is geographically connected to both northern and southern China. As a multi-culture center, Shandong was home to the Dawenkou culture (6000–4600 years before present (BP), distributed in the lower Yellow River [10]) and the Shandong Longshan culture (4600–4000 BP, a local manifestation of the Longshan Culture [10]). Previous aDNA studies focused on the short hypervariable region I of the mitochondrial DNA (mtDNA) of several Shandong remains [10–13], but these had limited power identifying haplogroups. Recently, a genome-wide study [6] and a review of the human population history of Eastern Eurasia [9] revealed that ancient Shandong individuals played an important role in defining the population genetic history and past migrations of East Asia: six ancient Shandong individuals (~9500–7700 BP) from four Early Neolithic archaeological sites were shown to have ancestry related to northern East Asian populations, an ancestral component that later spread into southern East Asia [6]. However, the above studies were limited by a scarcity of samples, leaving large gaps in our understanding of the changing genetic relationships over time across Shandong and its neighboring regions.
고대 DNA(aDNA) 연구는 동부 유라시아의 인류 집단 역사와 진화를 명확히 하는 데 도움을 주었다 [1–9]. 예를 들어 북부와 남부 동아시아의 고대 인구 사이에 유전적 차이가 있음을 밝혔다. 산동성(山東省)은 중국의 북부 해안 지역에 있으며, 지리적으로 중국 남부와 북부 모두에 연결되어 있다. 다문화 중심지로서 산동(山東)은 대문구(大汶口) 문화(6000–4600 BP, 황하(黃河) 하류에 분포 [10])와 산동(山東) 용산(龍山) 문화(4600–4000 BP, 용산(龍山) 문화의 지역적 형태 [10])의 본거지였다. 이전의 고대 DNA 연구는 몇몇 산동(山東) 유해의 미토콘드리아 DNA(mtDNA) 중 짧은 초변이부위 I에 초점을 맞췄지만 [10-13], 하플로그룹을 식별하는 데는 한계가 있었다. 최근의 게놈 전체 연구 [6]와 동부 유라시아 인구 역사에 대한 리뷰 [9]는 고대 산동(山東) 개체들이 동아시아의 인구 유전 역사와 과거 이주를 규정하는 데 중요한 역할을 했음을 밝혔다. 4개의 신석기 초기 고고학 유적지에서 나온 6명의 고대 산동(山東) 개체(~9500–7700 BP)는 북부 동아시아 인구와 관련된 혈통을 가졌으며, 이 조상 구성 요소는 나중에 남부 동아시아로 퍼져나갔다 [6]. 하지만, 위 연구들은 시료 부족으로 한계가 있었다. 그래서 시간의 흐름에 따른 산동(山東) 및 인접 지역의 유전적 관계 변화를 이해하는 데 큰 공백이 남았다.
In this study, we present the analyses of 86 high-quality complete mtDNA sequences of ancient individuals (~9500–1800 BP) collected from the northern Chinese province of Shandong (12 archaeological sites, Fig. 1a). Our study provides a wider and finer temporal and geographical resolution than previous work in describing the population dynamics regarding Shandong’s maternal genetic structure, and how these populations connected with those outside of Shandong.
이 연구에서 우리는 중국 북부 산동성(山東省)의 12개 고고학 유적지(그림 1a)에서 수집된 고대인(~9500–1800 BP)의 고품질 전체 mtDNA 서열 86개를 분석한 결과를 제시한다. 우리 연구는 산동(山東)의 모계 유전 구조에 관한 인구 역학을 설명하고, 이들 인구가 산동(山東) 외부의 인구와 어떻게 연결되었는지를 설명하는 데 있어 이전 연구보다 더 넓고 세밀한 시간적, 지리적 해상도를 제공한다.

그림 1. 고대 산동(山東) 인구의 유전 분석. (a) 산동성(山東省) 전역 12개 고고학 유적지에서 나온 고대 인류의 지리적, 시간적 분포. (b) 고대 산동(山東) 인구와 현대 동아시아 인구 간 공유 mtDNA 하플로그룹 빈도에 대한 주성분 분석(PCA) 그림. 시간에 따른 모계 유전 구조의 변화를 보여줌 (BQ = 북견(北阡), CZY = 성자애(城子崖), TL = 동림(桐林), LJZ = 유가장(劉家莊), XZ = 신지(辛置), HL = 후리(后李), YX = 익서(亦西)). 현대 동아시아 인구는 “북부 동아시아”와 “남부 동아시아”로 표시된 두 개의 주요 유전적 변이 경향을 형성함. (c) 고대 산동(山東) 인구와 다양한 현대 동아시아 인구 간 유전적 거리(Φst)의 P-값 (온라인 표 S4). 녹색 점선 위의 점들은 P-값이 0.05보다 커 유의미한 차이가 없음을 나타내며, 붉은색은 P-값이 0.05 미만, 회색은 P-값이 0.05보다 큼을 의미함. (d) 고대 산동(山東) 인구와 현대 동아시아 인구 간의 mtDNA 하플로그룹 빈도 상관관계 히트맵. 값이 1에 가까울수록 양의 상관관계(파란색)를 나타내며, 이는 두 인구가 유사한 모계 유전 구조를 공유함을 의미함. 그렇지 않은 경우 음의 상관관계(흰색)를 나타냄.
2. 재료 및 방법 (Materials and methods)
2.1. 고대 DNA 추출 및 라이브러리 제작 (Ancient DNA extraction and library preparation)
DNA was extracted from 88 samples (aged between 9500 and 1800 BP from 12 sites) including temporal bones, limb bones, phalanges, and molars (Table S1 online) using a method described previously [14]. A total of 88 double-stranded libraries were constructed according to previously published protocols [15,16] and all were partially treated with uracil DNA glycosylase (”UDGhalf”) [17].
12개 유적지에서 나온 9500년에서 1800년 전의 시료 88개(측두골, 사지뼈, 손발가락뼈, 어금니 포함, 온라인 표 S1)에서 이전에 기술된 방법을 사용해 DNA를 추출했다 [14, 62]. 이전에 발표된 프로토콜에 따라 총 88개의 이중 가닥 라이브러리를 제작했고 [15,16], 모두 우라실-DNA-글리코실라아제(“UDG-half”)로 부분 처리했다 [17, 63].
2.2. 용액 내 포획 및 미토콘드리아 DNA 분석 (In-solution capture and analysis of mitochondrial DNA)
Libraries were hybridized with oligonucleotide probes that overlapped with the mitochondrial genome as previously described [18]. From the enriched mitochondrial DNA libraries, we used the Illumina MiSeq platform to generate 2 76 bp paired-end reads. After sequencing, forward and reverse reads that overlapped by at least 11 bp were merged into a single sequence, with one mismatch allowed [18]. The merged sequences (>30 bp in length) were mapped to the mtDNA revised Cambridge Reference Sequence using BWA (version 0.5.10-evan.91g44db244, https://bitbucket.org/ustenzel/networkawarebwa) [19], after which duplicate reads and those with mapping qualities lower than 30 were removed. The subset of libraries that included the characteristic ancient DNA damage at the first position of the 5′ end and the last position of the 3′ end are noted as ”DS.half” [16].
이전에 기술된 바와 같이 미토콘드리아 게놈과 겹치는 올리고뉴클레오타이드 프로브를 사용하여 라이브러리를 혼성화했다 [18, 65]. 농축된 미토콘드리아 DNA 라이브러리에서 일루미나 MiSeq 플랫폼을 사용하여 2×76 bp 페어드-엔드 리드를 생성했다. 시퀀싱 후, 최소 11 bp 이상 겹치는 순방향 및 역방향 리드는 하나의 불일치를 허용하여 단일 서열로 병합했다 [18, 67]. 병합된 서열(길이 >30 bp)은 BWA를 사용하여 mtDNA 수정 케임브리지 참조 서열에 매핑했고 [19], 그 후 중복 리드와 매핑 품질이 30 미만인 리드는 제거했다. 5′ 말단의 첫 번째 위치와 3′ 말단의 마지막 위치에서 특징적인 고대 DNA 손상을 포함하는 라이브러리 하위 집합은 “DS.half”로 표기했다 [16].
The contamination rate was estimated by calculating the fraction of ancient mtDNA fragments compared to 311 published modern human mitochondrial genomes using ContamMix [20,21]. After manually excluding two individuals with large numbers of missing positions, our final dataset included 86 complete mtDNA genomes (16,569 bp) with high coverage (101- to 591-fold) and low contamination rates (0.01% to 4.52%) (Table S1 online).
오염률은 ContamMix를 사용하여 발표된 311개의 현대인 미토콘드리아 게놈과 비교하여 고대 mtDNA 조각의 비율을 계산함으로써 추정했다 [20,21, 70]. 결측 위치가 많은 두 개체를 수동으로 제외한 후, 우리의 최종 데이터 세트에는 높은 커버리지(101배~591배)와 낮은 오염률(0.01%~4.52%)을 가진 86개의 완전한 mtDNA 게놈(16,569 bp)이 포함되었다(온라인 표 S1).
2.3. 유전 분석 (Genetic analysis)
To compare with present-day East Asian populations, we prepared mtDNA haplogroup frequencies from published studies [10,22] (Table S3 online) and those of 528 complete mitochondrial sequences (Table S4 online) from populations across East Asia. For our newly sampled individuals, HaploGrep2 and PhyloTree build 17 were used to call the haplogroup of each mtDNA sequence [23,24]. Certain haplotypes were found to be shared by individuals (ranging from 2 to 5) buried in the same graves at the Beiqian site, which may have been due to matrilineal kinship among these individuals (Table S1 online). In these cases, only one individual was used for the analyses. Principal component analysis (PCA) of haplogroup frequencies was carried out to investigate the general population structure. The sequences of the mitochondrial genomes from the ancient samples were aligned using MUSCLE v3.8.3 [25]. Genetic distances (Φst) and corresponding P-values were calculated by Arlequin 3.518 [26]. We also used Arlequin 3.518 [26] to carry out the analysis of molecular variance (AMOVA). To avoid artificially low genetic diversity at certain sites, sites covered by fewer than five individuals were excluded from the PCA and correlation coefficient analyses of haplogroup frequency. The correlation coefficients (R) of the frequencies of different haplogroups in ancient and modern individuals were calculated using the following equation:

where 0<R<1 means a positive correlation and −1<R<0 means a negative correlation, x and y are the frequencies of a given haplogroup of the two populations[27]. The network was constructed with complete mtDNA sequences using the median-joining method in the Popart software [28,29]. The Time of the Most Recent Common Ancestor (TMRCA) was estimated by BEAST [30] with the HYK+G+I model because it resulted in the best fit for our data according to jModelTest 2 [31]; we also investigated a model with a Constant Population Size and Strict Clock [20]. For this model, the Markov-Chain Monte Carlo (MCMC) ran for 100,000,000 iterations sampling every 10,000 steps.
현대 동아시아 인구와 비교하기 위해, 발표된 연구 [10,22]에서 mtDNA 하플로그룹 빈도(온라인 표 S3)와 동아시아 전역 인구의 완전한 미토콘드리아 서열 528개(온라인 표 S4)를 준비했다. 새로 샘플링한 개체에 대해서는 HaploGrep2와 PhyloTree 빌드 17을 사용하여 각 mtDNA 서열의 하플로그룹을 결정했다 [23,24, 74]. 북견(北阡) 유적지의 같은 무덤에 묻힌 개체들(2~5명)이 특정 하플로타입을 공유하는 것으로 나타났는데, 이는 이들 사이의 모계 혈연관계 때문일 수 있다(온라인 표 S1). 이 경우, 분석에는 한 개체만 사용했다. 하플로그룹 빈도의 주성분 분석(PCA)을 수행하여 일반적인 인구 구조를 조사했다. 고대 시료의 미토콘드리아 게놈 서열은 MUSCLE v3.8.3을 사용하여 정렬했다 [25, 78]. 유전적 거리(Φst)와 해당 P-값은 Arlequin 3.518을 사용하여 계산했다 [26, 79]. 또한 Arlequin 3.518 [26]을 사용하여 분자 분산 분석(AMOVA)을 수행했다. 특정 유적지에서 인위적으로 유전적 다양성이 낮게 나타나는 것을 피하기 위해, 5명 미만의 개체만 포함된 유적지는 PCA 및 하플로그룹 빈도의 상관 계수 분석에서 제외했다. 고대 및 현대인의 여러 하플로그룹 빈도에 대한 상관 계수(R)는 특정 방정식을 사용하여 계산했다.

고대인과 현대인의 서로 다른 하플로그룹 빈도의 상관 계수(R)는 다음 방정식을 사용하여 계산했다. [공식] 여기서 0<R<1은 양의 상관관계를 의미하고 −1<R<0은 음의 상관관계를 의미하며, x와 y는 두 집단의 특정 하플로그룹 빈도이다[27].
네트워크는 Popart 소프트웨어의 중간-연결 방법을 사용하여 완전한 mtDNA 서열로 구성했다 [28,29, 88]. 가장 가까운 공통 조상의 시간(TMRCA)은 BEAST [30]를 사용하여 추정했다. jModelTest 2 [31]에 따르면 HYK+G+I 모델이 우리 데이터에 가장 적합했기 때문에 이 모델을 사용했다. 또한 일정한 인구 크기와 엄격한 시계 모델도 조사했다 [20, 90]. 이 모델의 경우, 마르코프-체인 몬테카를로(MCMC)는 10,000 단계마다 샘플링하면서 1억 번의 반복을 실행했다.
3. 결과 및 논의 (Results and discussion)
3.1. 4600 BP를 기준으로 구분되는 유전 구조 (Genetic structure separated by 4600 BP)
Complete mtDNA genomes (16,569 bp) were obtained from bone and tooth samples of 86 out of 88 ancient individuals aged between 9500 and 1800 BP from 12 sites in Shandong. From these 86 individuals, we identified a total of 56 haplotypes (Table S1 online). Certain haplotypes (e.g., A5a and B5b2a2) were found to be shared by two to five individuals buried in the same graves at the Beiqian site, which may indicate a matrilineal kinship among them (Table S1 online). For samples having possible matrilineal kinship, only one was kept for the subsequent genetic analyses (10 individuals were removed). The 56 haplotypes could be assigned to 13 basal mtDNA haplogroups [32–37]: A, B, C, D4, D5, F, G, M8, M9, M11, N9a, R, and Z. We used AMOVA to test which population groupings, based on the age of samples, would best represent the genetic structure of all Shandong sites (Table S2 online). We found that the highest variance (variance among groups = 0.17%) was observed when populations were divided into groups older and younger than 4600 BP (group sizes were 27 and 49), which coincides with the interval between the Dawenkou (6000–4600 BP) and Longshan cultural (4600–4000 BP) periods.
산동(山東) 12개 유적지에서 9500년에서 1800년 전 사이의 고대인 88명 중 86명의 뼈와 치아 시료에서 완전한 mtDNA 게놈(16,569 bp)을 얻었다. 이 86명으로부터 총 56개의 하플로타입을 확인했다(온라인 표 S1). 북견(北阡) 유적지의 같은 무덤에 묻힌 2~5명의 개인이 특정 하플로타입(예: A5a, B5b2a2)을 공유하는 것이 발견되었는데, 이는 그들 사이의 모계 혈연관계를 나타낼 수 있다(온라인 표 S1). 모계 혈연관계 가능성이 있는 시료의 경우, 후속 유전 분석을 위해 한 명만 남겼다(10명 제외). 56개의 하플로타입은 13개의 기초 mtDNA 하플로그룹 [32–37]으로 분류될 수 있었다: A, B, C, D4, D5, F, G, M8, M9, M11, N9a, R, Z. 우리는 AMOVA를 사용하여 시료의 연대를 기반으로 한 인구 그룹화 중 어떤 것이 모든 산동(山東) 유적지의 유전 구조를 가장 잘 나타내는지 테스트했다(온라인 표 S2). 인구를 4600 BP보다 오래된 그룹과 젊은 그룹(그룹 크기는 각각 27과 49)으로 나누었을 때 가장 높은 분산(그룹 간 분산 = 0.17%)이 관찰되었으며, 이는 대문구(大汶口) 문화(6000–4600 BP)와 용산(龍山) 문화(4600–4000 BP) 시기 사이의 전환기와 일치한다.
3.2. 4600 BP 이전 산동(山東)의 모계 유전 구조 (Maternal genetic structure in Shandong before 4600 BP)
Twenty-eight individuals were dated to before 4600 BP: a ~9500-year-old individual from Bianbian, an ~8200-year-old Xiaogao individual, an ~8200-year-old Boshan individual [20], three ~8000–7700-year-old Xiaojingshan individuals, three ~6000 to 4600-year-old individuals from Fujia site, and nineteen ~5500 to 5300 BP individuals from Beiqian site (Fig. 1a and Table S1 online). Among them, the samples older than 4600 BP show a high frequency of haplogroups B (B4c1 and B5b2, 24.14%) and D (D4 and D5, 37.93%). The haplogroup B4 is mainly distributed in present-day central-eastern Asians [34], while haplogroup B4c1 is found predominantly in southern East Asians (61.70%), as well as populations from Southeast Asia (Mueang, Tay, Phula, Kinh, and LaHu; 25.53%) that are closely related to southern East Asians (Table S6 online). Haplogroup B5b is found widely across East Asia, with its highest diversity in present-day Koreans [34]. B5b2 represents a more derived haplogroup of B5b that is mainly found in Han, Hez- hen, Minnan, and Makatao (63.64%), but is also found in other East Asians, including Japanese, Kinh, Buryat, Khamnigan, and Kizhi (Table S6 online). For haplogroup D, both D4 and D5 have high frequencies in ancient populations of northern East Asia (17.60%– 43.75%), but are less frequent in ancient populations of southern East Asia (0%–20%) [22,34]. Additionally, N9a was found in one individual aged ~8200 BP from Xiaogao. N9a belongs to the Eastern Eurasian lineage [10], and it is distributed predominantly in East Asia [38]. These results indicate that Shandong populations contained both northern and southern East Asian-associated haplogroups prior to 4600 BP (Fig. 3a).
28명의 개체가 4600 BP 이전으로 연대가 측정되었다: 변변(扁扁) 동굴의 약 9500년 전 개체 1명, 소고(小高)의 약 8200년 전 개체 1명, 박산(博山)의 약 8200년 전 개체 1명 [20], 소형산(小荊山)의 약 8000–7700년 전 개체 3명, 후가(傅家) 유적지의 약 6000-4600년 전 개체 3명, 그리고 북견(北阡) 유적지의 약 5500-5300 BP 개체 19명이다(그림 1a 및 온라인 표 S1). 그중 4600 BP보다 오래된 시료들은 하플로그룹 B(B4c1, B5b2, 24.14%)와 D(D4, D5, 37.93%)가 높은 빈도로 나타난다. 하플로그룹 B4는 주로 오늘날 중동부 아시아인에게 분포하며 [34], B4c1은 남부 동아시아인(61.70%)과 남부 동아시아인과 밀접하게 관련된 동남아시아 인구(Mueang, Tay, Phula, Kinh, LaHu; 25.53%)에서 주로 발견된다(온라인 표 S6). 하플로그룹 B5b는 동아시아 전역에서 넓게 발견되며, 오늘날 한국인에서 가장 높은 다양성을 보인다 [34]. B5b2는 B5b에서 파생된 하플로그룹으로, 주로 한족, 허저족, 민난족, 마카타오족(63.64%)에서 발견되지만, 일본인, 킨족, 부리야트족, 캄니간족, 키지족 등 다른 동아시아인에게서도 발견된다(온라인 표 S6). 하플로그룹 D의 경우, D4와 D5 모두 북부 동아시아의 고대 인구에서 높은 빈도(17.60%–43.75%)를 보이지만, 남부 동아시아의 고대 인구에서는 빈도가 낮다(0%–20%) [22,34, 279]. 추가로, 소고(小高)에서 온 약 8200 BP의 한 개체에서 N9a가 발견되었다. N9a는 동부 유라시아 계통에 속하며 [10], 주로 동아시아에 분포한다 [38, 281]. 이러한 결과는 4600 BP 이전에 산동(山東) 인구가 북부 및 남부 동아시아 관련 하플로그룹을 모두 포함하고 있었음을 나타낸다(그림 3a).
3.3. 4600 BP 이후 산동(山東)의 모계 유전 구조 (Maternal genetic structure in Shandong after 4600 BP)
For most of the Shandong sites, haplogroups B and D maintain their high frequencies (>20%) throughout our sampling period (9500–1800 BP) (Table S1 online), while haplogroups C (6.00%, C7a1 and C7b), M9 (6.00%, M9a1), and F (2.00%, F1a1, F2a, and F4a1) are only observed in samples younger than 4600 BP (Fig. 3b). These newly introduced haplogroups indicate that the maternal genetic structure of Shandong became more diverse beginning with the onset of the Longshan cultural period (4600–4000 BP). In examining the possible sources of these newly introduced haplogroups (Table S3 online), we find haplogroup C is prevalent in northern ethnic groups in East Asia, e.g., the Oroqen population (29.55%, Table S3 online), which is consistent with previous observations that this haplogroup is more diverse among the northern ethnic groups[34]. Haplogroup M9a was suggested to have spread from Southeast Asia northward into the East Asian mainland about 15,000 BP [38], and has a limited distribution among the present-day northern East Asians (0%–4.20%) [33]. Haplogroup F1 and F4 are more common in southern East Asia and Southeast Asia than in northern East Asia [34,35], while haplogroup F2 is more frequently distributed among the northern East Asians [10]. As these more recent haplogroups have been found in both southern and northern East Asians, their appearance in Shandong, without replacing those observed before 4600 BP, may represent an influx of populations from outside Shandong after this period.
대부분의 산동(山東) 유적지에서 하플로그룹 B와 D는 우리의 샘플링 기간(9500–1800 BP) 내내 높은 빈도(>20%)를 유지한다(온라인 표 S1). 반면, 하플로그룹 C(6.00%, C7a1, C7b), M9(6.00%, M9a1), F(2.00%, F1a1, F2a, F4a1)는 4600 BP보다 젊은 시료에서만 관찰된다(그림 3b). 새롭게 유입된 이 하플로그룹들은 용산(龍山) 문화 시기(4600–4000 BP)가 시작되면서 산동(山東)의 모계 유전 구조가 더 다양해졌음을 나타낸다. 새롭게 유입된 이 하플로그룹들의 가능한 출처를 조사한 결과(온라인 표 S3), 하플로그룹 C는 동아시아 북부 민족 그룹에서 널리 나타나며, 예를 들어 오로촌(Oroqen) 인구(29.55%, 온라인 표 S3)가 이에 해당한다. 이는 이 하플로그룹이 북부 민족 그룹 사이에서 더 다양하다는 이전의 관찰과 일치한다[34]. 하플로그룹 M9a는 약 15,000년 전(BP)에 동남아시아에서 북쪽으로 동아시아 본토에 퍼졌을 것으로 추정되며[38], 오늘날 북부 동아시아인 사이에서는 제한적으로 분포한다(0%–4.20%)[33]. 하플로그룹 F1과 F4는 북부 동아시아보다 남부 동아시아와 동남아시아에서 더 흔하게 나타나지만[34,35], 하플로그룹 F2는 북부 동아시아인들 사이에 더 자주 분포한다[10]. 이처럼 더 후대의 하플로그룹들이 남부와 북부 동아시아인 모두에게서 발견되므로, 4600년 전(BP) 이전에 관찰되던 하플로그룹들을 대체하지 않으면서 산동(山東) 지역에 이들이 나타난 것은 이 시기 이후 산동(山東) 외부로부터 인구가 유입되었음을 의미할 수 있다.
We further investigated populations from each site between 4600 and 1800 BP using PCA of haplogroup frequencies (Fig. 1b). Present-day northern and southern East Asians can be distinguished along the PC1 axis, driven mainly by the different proportions of haplogroup D, B, and F. Present-day northern East Asians have a higher proportion of haplogroup D (e.g., Mongolian 39.58%, Han-Jilin 35.29%, and Han-Shandong1 36.00%), while haplogroup B and F are more frequent among southern East Asians (e.g., B: Han-Jiangxi 34.78%, Han-Guangdong2 30.43%, F: Va 31.82%, Lahu 33.33%, and Bai 25.00%) (Table S3 online). The individuals from the Chengziya site (CZY, 4400–3300 BP, during and after the Longshan culture) and Tonglin site (TL, 4600–4000 BP, belonging to the Longshan culture) are close to the center of PC1 (Fig. 1b) mainly due to these two sites having high proportions of haplogroups elevated in either southern or northern East Asians. Specifically, the frequencies of haplogroup B of the two sites are higher than 37.50%, and the frequencies of haplogroup D are 20.00% (CZY) and 37.50% (TL), respectively. Haplogroup F was also found in the Tonglin site with a frequency of 12.50%. The Xinzhi (XZ, 3050–1800 BP) and Houli (HL, 3050–2750 BP) are closer to northern East Asians on PC1 (Fig. 1b), which can be explained by their higher proportion of haplogroup D (50.00% in XZ and 33.30% in HL). The population from the Liujiazhuang site (LJZ, 3100–1800 BP) clusters with present-day northern East Asians (Fig. 1b), likely owing to the Liujiazhuang population sharing 59.40% of their haplogroups (A, B, D, G, M11, M8, and N9a) with the present-day Shandong population (Han-Shandong1). On the other hand, the Yixi (YX, 2300–1800 BP) site is closer to southern East Asians on PC1 with a haplogroup F frequency of 40.00% (Fig. 1b).
우리는 4600년에서 1800년 전(BP) 사이 각 유적지의 인구를 하플로그룹 빈도의 주성분 분석(PCA)을 사용하여 추가로 조사했다 (그림 1b). 현대의 북부와 남부 동아시아인은 주로 하플로그룹 D, B, F의 비율 차이에 따라 PC1 축에서 구분된다. 현대 북부 동아시아인은 하플로그룹 D의 비율이 더 높고(예: 몽골인 39.58%, 길림성 한족 35.29%, 산동성 한족1 36.00%), 반면 남부 동아시아인은 하플로그룹 B와 F가 더 빈번하다(예: B: 강서성 한족 34.78%, 광동성 한족2 30.43%, F: 바족 31.82%, 라후족 33.33%, 바이족 25.00%) (온라인 표 S3). 성자애(城子崖) 유적(CZY, 4400–3300 BP, 용산 문화 시기 및 이후)과 동림(桐林) 유적(TL, 4600–4000 BP, 용산 문화 소속)의 개체들은 PC1 축의 중앙에 가깝게 위치한다(그림 1b). 이는 주로 이 두 유적지가 남부 또는 북부 동아시아인에게서 높은 비율로 나타나는 하플로그룹들을 많이 가졌기 때문이다. 구체적으로, 두 유적지의 하플로그룹 B 빈도는 37.50%보다 높고, 하플로그룹 D의 빈도는 각각 20.00%(CZY)와 37.50%(TL)이다. 하플로그룹 F 또한 동림(桐林) 유적에서 12.50%의 빈도로 발견되었다. 신지(辛置) 유적(XZ, 3050–1800 BP)과 후리(后李) 유적(HL, 3050–2750 BP)은 PC1 축에서 북부 동아시아인에 더 가깝다(그림 1b). 이는 두 유적지의 하플로그룹 D 비율이 더 높기(XZ에서 50.00%, HL에서 33.30%) 때문으로 설명할 수 있다. 유가장(劉家莊) 유적(LJZ, 3100–1800 BP)의 인구는 현대 북부 동아시아인과 함께 군집을 이룬다(그림 1b). 이는 유가장(劉家莊) 인구가 자신들의 하플로그룹(A, B, D, G, M11, M8, N9a) 중 59.40%를 현대 산동(山東) 인구(한족-산동1)와 공유하기 때문일 가능성이 크다. 반면, 익서(亦西) 유적(YX, 2300–1800 BP)은 하플로그룹 F의 빈도가 40.00%로 PC1 축에서 남부 동아시아인에 더 가깝다(그림 1b).
3.4. 고대 산동(山東) 인구와 현대 동아시아인의 관계(Relationship between ancient Shandong populations and present-day East Asians)
We then investigated how the ancient Shandong populations are related to present-day East Asians. First, we calculated the Φst between the ancient Shandong populations and present-day East Asians (15 selected populations from Han and other ethnic groups) (Fig. 1c and Table S5 online). Beqian (5500–5300 BP) is found to be more genetically different from present-day East Asians (eight populations show significant Φst with Beiqian), compared with younger Shandong populations which are more similar to present-day East Asians (0–4 populations show significant Φst). We further looked into the haplotype composition (reflected by correlation of haplotype frequencies) between the ancient Shandong populations and present-day East Asians. We observe that ancient Shandong populations are less similar to several northern ethnic groups (Kazak, Uzbek, and Uygur) and southern ethnic groups (Bai and Jino) compared with other present-day East Asians (Fig. 1d).
다음으로 우리는 고대 산동(山東) 인구가 현대 동아시아인과 어떻게 관련되는지 조사했다. 먼저, 고대 산동(山東) 인구와 현대 동아시아인(한족 및 기타 민족 그룹에서 선택된 15개 인구) 사이의 유전적 거리(Φst)를 계산했다(그림 1c 및 온라인 표 S5). 북견(北阡) 유적(5500–5300 BP)은 현대 동아시아인과 유전적으로 더 큰 차이를 보이는 것으로 나타났다(8개 인구가 북견과 유의미한 Φst 값을 보임). 반면 더 후대의 산동(山東) 인구는 현대 동아시아인과 더 유사했다(0-4개 인구만이 유의미한 Φst 값을 보임). 우리는 더 나아가 고대 산동(山東) 인구와 현대 동아시아인 사이의 하플로타입 구성(하플로타입 빈도의 상관관계로 반영됨)을 살펴보았다. 고대 산동(山東) 인구는 다른 현대 동아시아인에 비해, 몇몇 북부 민족 그룹(카자흐, 우즈베크, 위구르) 및 남부 민족 그룹(바이, 지눠)과는 유사성이 더 낮은 것으로 관찰된다(그림 1d).
3.5. 해안과 내륙 산동(山東) 간의 가능한 유전적 교류(Possible genetic exchange between coastal and inland Shandong)
We also investigated the population dynamics between the coastal site (Beiqian, 5500–5300 BP) and inland regions across time. In the coastal region, the site contained haplogroups M8 (10.50%) and A (5.30%) (Fig. 3b). However, in the inland sites, we observed these two haplogroups (M8 10% and A 16%) only in sites younger than 3100 BP (Fig. 3b). Furthermore, we found that populations from the coastal site and older inland sites (4600–3100 BP) had a larger value of genetic distance (Φst = 0.037, P = 0.06), compared with that between the coastal site and younger inland sites (3100 to 1800 BP) (Φst = 0.005, P = 0.30). We observed a similar pattern in the AMOVA analysis, where the coastal site and older inland sites had a larger value of variance (5.19%) than that between the coastal site and younger inland sites (1.39%). These results suggest that exchange between populations from the coastal and inland regions was less frequent before 3100 BP, which is consistent with archaeological findings that there were cultural differences between coastal and inland regions before and during the Longshan culture [39–41]. An alternative explanation could be due to the influx of people with ancestry from other parts of East Asia that introduced haplogroups M8 and A [6,13,33].
우리는 또한 해안 유적인 북견(北阡, 5500–5300 BP)과 내륙 지역 간의 시간 경과에 따른 인구 역학을 조사했다. 해안 지역 유적에는 하플로그룹 M8(10.50%)과 A(5.30%)가 있었다(그림 3b). 그러나 내륙 유적에서는 이 두 하플로그룹(M8 10%, A 16%)을 3100년 전(BP)보다 후대의 유적에서만 관찰했다(그림 3b). 더 나아가, 해안 유적과 더 오래된 내륙 유적(4600–3100 BP) 인구 간의 유전적 거리가(Φst = 0.037, P = 0.06) 해안 유적과 더 후대의 내륙 유적(3100-1800 BP) 사이의 거리(Φst = 0.005, P = 0.30)보다 더 큰 값을 가짐을 발견했다. 분자 분산 분석(AMOVA)에서도 유사한 패턴을 관찰했는데, 해안 유적과 오래된 내륙 유적 간의 분산 값(5.19%)이 해안 유적과 후대 내륙 유적 간의 값(1.39%)보다 컸다. 이러한 결과는 해안과 내륙 지역 인구 간의 교류가 3100년 전(BP) 이전에는 덜 빈번했음을 시사한다. 이는 용산(龍山) 문화 이전 및 기간 동안 해안과 내륙 지역 간에 문화적 차이가 있었다는 고고학적 발견과 일치한다 [39–41]. 또 다른 대안적 설명으로는, 동아시아 다른 지역의 혈통을 가진 사람들이 유입되면서 하플로그룹 M8과 A를 들여왔을 가능성도 있다 [6,13,33].
3.6. 산동(山東)에서 하플로그룹 B5b2 계통의 발견(Discovery of the haplogroup B5b2 lineage in Shandong)
A previous study speculated that populations carrying haplogroup B5b migrated from northwestern mainland East Asia into other East Asian areas, bypassing Shandong, as this haplogroup had not been previously observed in ancient Shandong based on 3000-year-old individuals from northwestern mainland East Asia [10,34]. Here, we identified nine ancient individuals belonging to haplogroup B5b from six sites in Shandong, (9500 to 1800 BP): Bianbian (n = 1), Beiqian (n = 4), Houli (n = 1), Tonglin (n = 1), Xinzhi (n = 1), and Chengziya (n = 1). To investigate this haplogroup in more detail, we obtained 20 complete B5b mitochondrial sequences from present-day individuals (Table S6 online) representing present-day East Asians, including the Northern Han (n = 2), Southern Han (n = 3) Hezhen (n = 1), Minnan (n = 1) Makatao (n = 1), Hakka (n = 1), Kyrgyz (n = 2), and Tingri (n = 1) Buryat (n = 1), Khamnigan (n = 1), Kizhi (n = 1), Japanese (n = 1), Suay (n = 1), Shan (n = 1) and Kinh (n = 2). Mitogenome coalescence times were estimated from the complete data using BEAST [30]. Table S7 (online) shows the B5b lineage after calibrating with the radiocarbon dates of our samples. Under the B5b2 lineage, the B5b2a2 sublineage from the 5500 to 5300-year-old Beiqian (BQ-M2) shares a common ancestor with the B5b2a2 in present-day Hezhen (HGDP01238), Buryat (JN857016), and Khamnigan (JN857039) (Fig. 2a–c). The estimated Time to the Most Recent Common Ancestor (TMRCA) of B5b2a2 is 8056 BP (95% highest probability density (HPD), 5400–12,192, Table S7 online) with a posterior value of 1.00. Furthermore, two Beiqian individuals (BQ-M31-A and BQ-M24) are likely to share a common B5b2a ancestor with the Japanese (HGDP00767) around 13,040 BP (95% HPD, 7595–20,329, Table S7 online) with a posterior value of 0.99. Beiqian (BQ-M139-D) and Xinzhi (XZ-M59) individuals are likely to share a common B5b2b ancestor with Han individuals from the Southern Han (HG00690) and Northern Han (NA18643) around 11,513 BP (95% HPD, 6368–18102, Table S7 online) with a posterior value of 0.98. Accordingly, all of them share a common B5b2 ancestor related to the ~9500-year-old Bianbian individual around 17,293 years ago (95% HPD, 10,503–26,726 BP, Table S7 online). These results suggest that the B5b2 lineage found in the Bianbian individual (9500 BP) is likely ancestral to East Asians and North Asians (Fig. 2a–c and Fig. 3a). This coincides with the population dynamics in Shandong proposed in previous studies, with an outward spreading to the west and south of East Asia and interactions with other cultures (e.g., the Yangshao culture) [41–43].
이전 연구에서는 하플로그룹 B5b를 가진 인구가 중국 서북부 본토의 3000년 전 개체들에게서는 나타나지 않아, 이들이 산동(山東)을 거치지 않고 다른 동아시아 지역으로 이주했을 것이라고 추측했다 [10,34]. 하지만 이번 연구에서 우리는 산동(山東)의 6개 유적지(9500-1800 BP)에서 하플로그룹 B5b에 속하는 9명의 고대인을 확인했다: 변변(扁扁) 동굴 (1명), 북견(北阡) (4명), 후리(后李) (1명), 동림(桐林) (1명), 신지(辛置) (1명), 성자애(城子崖) (1명). 이 하플로그룹을 더 자세히 조사하기 위해, 우리는 현대 동아시아인을 대표하는 현대인들로부터 20개의 완전한 B5b 미토콘드리아 서열을 확보했다(온라인 표 S6). 여기에는 북부 한족(2명), 남부 한족(3명), 허저족(1명), 민난족(1명), 마카타오족(1명), 하카족(1명), 키르기스족(2명), 팅리족(1명), 부리야트족(1명), 캄니간족(1명), 키지족(1명), 일본인(1명), 수아이족(1명), 샨족(1명), 킨족(2명)이 포함된다. 미토콘드리아 게놈의 공통 조상 시간은 BEAST를 사용하여 전체 데이터로부터 추정했다 [30]. 온라인 표 S7은 우리 시료의 방사성 탄소 연대 측정값으로 보정한 후의 B5b 계통을 보여준다. B5b2 계통 하에서, 5500-5300년 전 북견(北阡) 유적(BQ-M2)의 B5b2a2 하위 계통은 오늘날 허저족(HGDP01238), 부리야트족(JN857016), 캄니간족(JN857039)의 B5b2a2와 공통 조상을 공유한다 (그림 2a–c). B5b2a2의 가장 가까운 공통 조상 시간(TMRCA)은 8056년 전(BP)으로 추정되며(95% 최고 확률 밀도(HPD), 5400–12,192, 온라인 표 S7), 사후 확률 값은 1.00이다. 더 나아가, 두 명의 북견(北阡) 개체(BQ-M31-A, BQ-M24)는 약 13,040년 전(BP)에 일본인(HGDP00767)과 공통 B5b2a 조상을 공유할 가능성이 높다(95% HPD, 7595–20,329, 온라인 표 S7). 사후 확률 값은 0.99이다. 북견(北阡)(BQ-M139-D)과 신지(辛置)(XZ-M59) 개체는 약 11,513년 전(BP)에 남부 한족(HG00690) 및 북부 한족(NA18643)과 공통 B5b2b 조상을 공유할 가능성이 높다(95% HPD, 6368–18102, 온라인 표 S7). 사후 확률 값은 0.98이다. 따라서, 이들 모두는 약 17,293년 전(95% HPD, 10,503–26,726 BP, 온라인 표 S7)에 약 9500년 된 변변(扁扁) 동굴 개체와 관련된 공통 B5b2 조상을 공유한다. 이러한 결과는 변변(扁扁) 동굴 개체(9500 BP)에서 발견된 B5b2 계통이 동아시아인과 북아시아인의 조상일 가능성이 높다는 것을 시사한다(그림 2a–c 및 그림 3a). 이는 이전 연구에서 제안된 산동(山東)의 인구 역학과 일치하는데, 즉 동아시아의 서쪽과 남쪽으로 확산하고 다른 문화(예: 양사오(仰韶) 문화)와 상호 작용했다는 것이다 [41–43].

그림 2. B5b 계통에 속하는 인구의 유전 분석. (a) B5b 계통의 베이즈 연대 분석 트리. 변변(扁扁) 동굴 개체의 기저 위치가 붉은 별로 표시됨. (하나의 모계 혈족에 속하는 5명의 개체 BQ-M2-B, BQ-M2-E, BQ-M2-H, BQ-M2-L, BQ-M2-J는 BQ-M2로 간주하고, 하나의 모계 혈족인 BQ-M24-4와 BQ-M24-23은 BQ-M24로 간주함). 시료 ID와 연대만 표시된 모든 개체는 고대 산동(山東) 유적지에서 나온 것이며, 전체 트리는 온라인 그림 S3에서 볼 수 있음. (b) 고대 산동(山東)과 현대 아시아인의 전체 미토콘드리아 게놈을 사용한 B5b 계통 네트워크 (B5b2 계통은 회색 선의 오른쪽에 있음). 변변(扁扁) 동굴 개체와 북견(北阡) 인구가 하플로그룹 B5b2의 뿌리에 가장 가까우며, 특히 일부 북견(北阡) 서열은 현대 동아시아인과 북아시아인의 조상임을 보여줌. (c) B5b2 계통 하의 고유 돌연변이. 변변(扁扁) 동굴 개체는 하플로그룹 B5b2의 뿌리에서 3개의 돌연변이(143A, 310C, 15172A)만큼 떨어져 있으며, 변변(扁扁) 동굴과 북견(北阡) 인구는 현대 동아시아인 및 북아시아인과의 공통 조상과 밀접하게 관련되어 있음을 보여줌 (@ = 역돌연변이 또는 결실 돌연변이로 추정).
4. 결론
In this study, we reconstructed the maternal genetic structure of Shandong populations over the past nine thousand years (Fig. 3). Since 9500 BP, the main haplogroups of present-day northern and southern East Asia could be observed in the ancient populations of Shandong. After 4600 BP, additional connections were identified between populations inside and outside of Shandong. After 3100 BP, a possible genetic exchange between the coastal and inland regions within Shandong was observed. Additionally, in the B5b2 lineage newly discovered in Shandong populations, we observed (1) the Bianbian individual likely belongs to a lineage ancestral to East Asians and North Asians; (2) a continuous maternal genetic structure from the ~9500-year-old Bianbian individual to the 5500–5300-year-old Beiqian population. A wider range of temporal and geographical Y-chromosome and nuclear genomic data could further build on these insights and provide a more comprehensive picture of the genetic history and population movements of the people of ancient Shandong.
이 연구에서 우리는 지난 9천 년 동안의 산동(山東) 인구의 모계 유전 구조를 재구성했다(그림 3). 9500년 전(BP) 이래로, 오늘날 북부 및 남부 동아시아의 주요 하플로그룹들이 고대 산동(山東) 인구에서 관찰될 수 있었다. 4600년 전(BP) 이후에는 산동(山東) 내부와 외부 인구 간의 추가적인 연결이 확인되었다. 3100년 전(BP) 이후에는 산동(山東) 내 해안과 내륙 지역 간의 가능한 유전적 교류가 관찰되었다. 추가적으로, 산동(山東) 인구에서 새롭게 발견된 B5b2 계통에서 우리는 (1) 변변(扁扁) 동굴 개체가 동아시아인과 북아시아인의 조상 계통에 속할 가능성이 높다는 점과, (2) 약 9500년 된 변변(扁扁) 동굴 개체에서 5500–5300년 된 북견(北阡) 인구로 이어지는 지속적인 모계 유전 구조를 관찰했다. 더 넓은 시간적, 지리적 범위의 Y-염색체 및 핵 게놈 데이터는 이러한 통찰을 더욱 발전시키고 고대 산동(山東) 사람들의 유전 역사와 인구 이동에 대한 더 포괄적인 그림을 제공할 수 있을 것이다.

그림 3. 9500년에서 1800년 전까지 고대 산동(山東) 인구의 모계 유전 역사. (a) 파이 차트는 9500년에서 4600년 전의 산동(山東) 인구가 북부 및 남부 동아시아 관련 하플로그룹을 모두 포함했음을 보여줌 (N = 북부 동아시아 관련 하플로그룹; S = 남부 동아시아 관련 하플로그룹). 여러 색의 화살표는 산동(山東) 지역의 B5b2 계통 인구(약 9500년 전 변변(扁扁) 동굴 개체와 5500-5300년 전 북견(北阡) 인구)가 현대 동아시아인과 북아시아인의 조상이었음을 나타냄. (SD = 산동(山東) 인구, 녹색; r = 한족, 허저족, 민난족, 마카타오족, 주황색; R = 부리야트족과 캄니간족(북아시아 위치), 파란색; j = 일본인, 보라색; QH와 갈색선 = 진령-회하선(秦嶺-淮河線)). (b) 용산(龍山) 문화 시기(4600–4000 BP) 이래로 산동(山東)의 모계 유전적 출처가 더 다양해짐. 4600년 전 이후 고대 산동(山東) 인구에 새로운 하플로그룹(C, M9, F)이 나타났으며, 이는 산동(山東)에 북부(파란색 화살표)와 남부(붉은색 화살표) 모계 혈통이 등장했음을 나타냄. 해안과 내륙 지역 인구 간에 하플로그룹 M8과 A의 교류 가능성은 3100년 전 이전에는 드물었지만, 3100년 전 이후에는 빈번해짐 (물음표가 있는 녹색 화살표). (NE = 북동아시아, SE = 남동아시아) .
이해 상충 Conflict of interest
The authors declare that they have no conflict of interest.
저자들은 이해 상충이 없음을 선언한다.
감사의 글 Acknowledgments
This work was supported by the National Natural Science Foundation of China (41672021, 41925009, 91731303, and 41630102), “Research on the Roots of Chinese Civilization” of Zhengzhou University (XKZDJC202006), the Chinese Academy of Sciences (XDB26000000, XDA1905010, and QYZDB-SSW-DQC003), the Tencent Foundation through the XPLORER PRIZE, the Howard Hughes Medical Institute (55008731), the National Social Science Foundation of China (15CKG013), the Shandong University Multidisciplinary Research and Innovation Team of Young Scholars (2020QNQT018). We would like to thank Albert Min-Shan Ko, Jacob Gardner, Mian Li, Tianyi Wang, and Wenjun Wang from the Institute of Vertebrate Paleontology and Paleoanthropology of Chinese Academy of Sciences, and Chao Ning from the Max Planck Institute for the Science of Human History for their comments, as well as archaeological teams from Shandong. Maps in this paper were reviewed by the Ministry of Natural Resources of the People’s Republic of China (GS(2021)184).
이 연구는 중국 국가자연과학기금(41672021, 41925009, 91731303, 41630102), 정주대학(鄭州大學)의 “중화 문명 뿌리 연구”(XKZDJC202006), 중국과학원(中國科學院)(XDB26000000, XDA1905010, QYZDB-SSW-DQC003), 텐센트 재단의 XPLORER PRIZE, 하워드 휴즈 의학 연구소(55008731), 중국 국가사회과학기금(15CKG013), 산동대학(山東大學) 청년학자 다학제 연구 혁신팀(2020QNQT018)의 지원을 받았다. 중국과학원(中國科學院) 척추고생물 및 고인류 연구소의 앨버트 민샨 코(Albert Min-Shan Ko), 제이콥 가드너(Jacob Gardner), 리몐(李勉), 왕톈이(王天軼), 왕원쥔(王文君)과 막스 플랑크 인류사 과학 연구소의 닝차오(寧超)가 제공한 조언에 감사한다. 또한 산동(山東)의 고고학 팀들에게도 감사를 표한다. 이 논문의 지도는 중화인민공화국(中華人民共和國) 자연자원부의 검토를 받았다(GS(2021)184).
저자 기여 Author contributions
Qiaomei Fu designed the research project. Qiaomei Fu, Juncen Liu, Wen Zeng, Bo Sun, and Xiaowei Mao managed the project. Wen Zeng, Bo Sun, Yongsheng Zhao, Fen Wang, Zhenguang Li, Fengshi Luan, Junfeng Guo, Chao Zhu, Zimeng Wang, Chengmin Wei, Ming Zhang, Weihong Hou, Wanjing Ping, and Xiaohong Wu collected archaeological samples and dating. Qiaomei Fu, Peng Cao, Ruowei Yang, Feng Liu, Xiaotian Feng, and Qinyan Dai, performed or supervised wet laboratory work. Qiaomei Fu and Xiaotian Feng did the data processing and quality control. Qiaomei Fu, Ming Zhang, Juncen Liu, and Xiaowei Mao supervised or performed the analyses. Juncen Liu, Wen Zeng, Xiaowei Mao, and Qiaomei Fu wrote the manuscript. E. Andrew Bennett, Yichen Liu, and all other authors discussed, critically revised, and approved the final version of the manuscript.
부교매(付巧妹)가 연구 프로젝트를 설계했다. 부교매(付巧妹), 유준잠(劉俊岑), 증문(曾雯), 손파(孫波), 모효위(毛曉偉)가 프로젝트를 관리했다. 증문(曾雯), 손파(孫波), 조영생(趙永生), 왕분(王芬), 이진광(李振光), 난풍실(欒豐實), 곽준봉(郭俊鋒), 주초(朱超), 왕자맹(王子孟), 위성민(魏成敏), 장명(張明), 후위홍(侯衛紅), 평만정(平萬靜), 오소홍(吳小紅)이 고고학 시료 수집과 연대 측정을 수행했다. 부교매(付巧妹), 조붕(曹鵬), 양약위(楊若煒), 유봉(劉鋒), 풍효념(馮曉恬), 대경염(代慶豔)이 실험실 연구를 수행하거나 감독했다. 부교매(付巧妹)와 풍효념(馮曉恬)이 데이터 처리 및 품질 관리를 수행했다. 부교매(付巧妹), 장명(張明), 유준잠(劉俊岑), 모효위(毛曉偉)가 분석을 감독하거나 수행했다. 유준잠(劉俊岑), 증문(曾雯), 모효위(毛曉偉), 부교매(付巧妹)가 원고를 작성했다. E. 앤드루 베넷(E. Andrew Bennett), 유일신(劉逸宸) 및 다른 모든 저자들이 원고의 최종 버전을 논의하고, 비판적으로 수정했으며, 승인했다.
부록 A. 보충 자료 Appendix A. Supplementary materials
Supplementary materials to this article can be found online at https://linkinghub.elsevier.com/retrieve/pii/S2095927321000657.
이 논문의 보충 자료는 https://doi.org/10.1016/j.scib.2021.01.029에서 온라인으로 찾을 수 있다.
참고문헌
[1] Ko AS, Chen CY, Fu Q, et al. Early austronesians: into and out of Taiwan. Am J Hum Genet 2014;94:426–36.
[2] Lipson M, Cheronet O, Mallick S, Rohland N, Oxenham M, Pietrusewsky M, et al. Ancient genomes document multiple waves of migration in Southeast Asian prehistory. Science 2018;361:92–5.
[3] McColl H, Racimo F, Vinner L, et al. The prehistoric peopling of Southeast Asia. Science 2018;361:88–92.
[4] Ning C, Wang CC, Gao S, et al. Ancient genomes reveal Yamnaya-related ancestry and a potential source of Indo-European speakers in Iron Age Tianshan. Curr Biol 2019;29:2526–2532.e4.
[5] Siska V, Jones ER, Jeon S, et al. Genome-wide data from two early Neolithic East Asian individuals dating to 7700 years ago. Sci Adv 2017;3:e1601877.
[6] Yang MA, Fan X, Sun B, et al. Ancient DNA indicates human population shifts and admixture in northern and southern China. Science 2020;369:282–8.
[7] Yang MA, Fu Q. Insights into modern human prehistory using ancient genomes. Trends Genet 2018;34:184–96.
[8] Yang MA, Gao X, Theunert C, et al. 40,000-Year-Old individual from Asia provides insight into early population structure in Eurasia. Curr Biol 2017;27:3202–3208.e9.
[9] Zhang M, Fu Q. Human evolutionary history in eastern Eurasia using insights from ancient DNA. Curr Opin Genet Dev 2020;62:78–84.
[10] Zhang F. Study on mtDNA polymorphism of ancient Chinese population. Thesis. Fudan University 2005 (in Chinese).
[11] Dong Y, Li C, Luan F, et al. Low mitochondrial DNA diversity in an ancient population from China: Insight into social organization at the Fujia site. Hum Biol 2015;87:71–84.
[12] Wang L, Oota H, Saitou N, et al. Genetic structure of a 2,500-year-old human population in China and its spatiotemporal changes. Mol Biol Evol 2000;17:1396–400.
[13] Yao Y, Kong Q, Man X, et al. Reconstructing the evolutionary history of China: a caveat about inferences drawn from ancient DNA. Mol Biol Evol 2003;20:214–9.
[14] Dabney J, Knapp M, Glocke I, et al. Complete mitochondrial genome sequence of a middle pleistocene cave bear reconstructed from ultrashort DNA fragments. Proc Natl Acad Sci U S A 2013;110:15758–63.
[15] Kircher M, Sawyer S, Meyer M. Double indexing overcomes inaccuracies in multiplex sequencing on the Illumina platform. Nucleic Acids Res 2012;40:e3.
[16] Meyer M, Kircher M, Gansauge MT, et al. A high-coverage genome sequence from an archaic Denisovan individual. Science 2012;338:222–6.
[17] Rohland N, Harney E, Mallick S, et al. Partial uracil-DNA-glycosylase treatment for screening of ancient DNA. Philos Trans R Soc Lond B Biol Sci 2015;370:20130624.
[18] Fu Q, Meyer M, Gao X, et al. DNA analysis of an early modern human from Tianyuan Cave, China. Proc Natl Acad Sci U S A 2013;110:2223–7.
[19] Li H, Durbin R. Fast and accurate short read alignment with Burrows–Wheeler transform. Bioinformatics 2009;25:1754–60.
[20] Fu Q, Mittnik A, Johnson PLF, et al. A revised timescale for human evolution based on ancient mitochondrial genomes. Curr Biol 2013;23:553–9.
[21] Reich D, Patterson N, Campbell D, et al. Reconstructing native American population history. Nature 2012;488:370–4.
[22] Li J, Zeng W, Zhang Y, et al. Ancient DNA reveals genetic connections between early Di-Qiang and Han Chinese. BMC Evol Biol 2017;17:239.
[23] van Oven M, Kayser M. Updated comprehensive phylogenetic tree of global human mitochondrial DNA variation. Hum Mutat 2009;30:E386–94.
[24] Weissensteiner H, Pacher D, Kloss-Brandstätter A, et al. HaploGrep 2: mitochondrial haplogroup classification in the era of high-throughput sequencing. Nucleic Acids Res 2016;44:W58–63.
[25] Edgar RC. MUSCLE: multiple sequence alignment with high accuracy and high throughput. Nucleic Acids Res 2004;32:1792–7.
[26] Excoffier L, Lischer HEL. Arlequin suite ver 3.5: a new series of programs to perform population genetics analyses under Linux and Windows. Mol Ecol Resour 2010;10:564–7.
[27] Jia J, He X, Jin Y. Statistics, 6th edition. Beijing: China Renmin University Press; 2015 (in Chinese).
[28] Bandelt HJ, Forster P, Rohl A. Median-joining networks for inferring intraspecific phylogenies. Mol Biol Evol 1999;16:37–48.
[29] Leigh JW, Bryant D. PopART: Full-feature software for haplotype network construction. Methods Ecol Evol 2015;6:1110–6.
[30] Drummond AJ, Rambaut A. BEAST: Bayesian evolutionary analysis by sampling trees. BMC Evol Biol 2007;7:214.
[31] Darriba D, Taboada GL, Doallo R, et al. jModelTest 2: more models, new heuristics and parallel computing. Nat Methods 2012;9:772.
[32] Kivisild T, Tolk HV, Parik J, et al. The emerging limbs and twigs of the East Asian mtDNA tree. Mol Biol Evol 2002;19:1737–51.
[33] Kong QP, Yao YG, Liu M, et al. Mitochondrial DNA sequence polymorphisms of five ethnic populations from northern China. Hum Genet 2003;113:391–405.
[34] Tanaka M, Cabrera VM, González AM, et al. Mitochondrial genome variation in eastern Asia and the peopling of Japan. Genome Res 2004;14:1832–50.
[35] Yao YG, Kong QP, Bandelt HJ, et al. Phylogeographic differentiation of mitochondrial DNA in Han Chinese. Am J Hum Genet 2002;70:635–51.
[36] Yao Y, Kong Q, Wang C, et al. Different matrilineal contributions to genetic structure of ethnic groups in the silk road region in China. Mol Biol Evol 2004;21:2265–80.
[37] Yao YG, Nie L, Harpending H, et al. Genetic relationship of Chinese ethnic populations revealed by mtDNA sequence diversity. Am J Phys Anthropol 2002;118:63–76.
[38] Derenko M, Malyarchuk B, Denisova G, et al. Complete mitochondrial DNA analysis of eastern Eurasian haplogroups rarely found in populations of northern Asia and eastern Europe. PLoS One 2012;7:e32179.
[39] Gao G, Shao W. One of the birthplaces of Chinese civilization-Haidai historical and cultural district. Prehistory 1984;1:7–26 (in Chinese).
[40] Guo N. Research on the historical evolution of Shandong culture and the division of Shandong culture. Thesis. Anhui Normal University 2006 (in Chinese).
[41] He D. Study on environmental archaeology of Neolithic age in Shandong. Cultural Relics of the East 2004;2:26–40 (in Chinese).
[42] He D. A new study of the origin of civilization between Haidai area and central plains. Cultural Relics of Central China 2007;6:22–7+38 (in Chinese).
[43] Zhao Y, Xiao Y, Zheng W. Talking about the westward migration of Dawenkou cultural residents from human bone materials. Southeast Culture 2019;5:56–65 (in Chinese).