동영상 25 분

 

PPT 85 페이지

 

PPT 10 페이지

 

엑셀 데이터

 

DICTATION 26 페이지

 

 

반갑습니다. 오늘은 코로나와 관련해서 치명률에 대해서 말씀드리겠습니다.

치명. 한자말로 보면, 이를 치(致), 목숨 명(命)입니다. 그래서 국립국어원 표준국어대사전을 보면 치명(致命)이란 죽을 지경에 이른다는 뜻이죠.

원래 작년 초 코로나 초기 시절에는 치사율(致死率)이라는 용어를 사용했는데요. 중간에 죽을 사(死) 자가 들어가니까 어감이 그리 좋지 않다고 해서 현재는 사(死) 자를 명(命) 자로 바꾸어서 치명률(致命率)로 통용되고 있습니다.

영어로는 fatality rate인데요. fatality라는 단어가 fate, 운명에서 나왔죠. 라틴어원으로 fata가 prediction, 운명. 운명을 예측한다. 그리고 사람은 언젠가는 죽을 운명이라는 뜻을 가지고 있는데요. 예측한다는 의미보다는 죽는다는 의미가 더 강조되어서 현재는 fatality라고 하면 death, 죽음을 의미하죠. 그러니까 fatality rate라는 것은 바로 사망률이란 뜻을 갖고 있죠. 그리고 코로나와 관련해서는 우리말로 치명률이라는 용어로 쓰고 있습니다.

치명률을 내는 공식은 지극히 간단합니다. 사망자 숫자를 확진자 숫자로 나누어서 100을 곱하면 퍼센티지가 나오죠. 가령 확진자 100명에 사망자가 1명이면 치명률은 1%입니다.

그런데 치명률에도 여러 가지 유형이 있습니다. 대략 세 가지 정도로 나누어 봤는데요. 누계 치명률, 기간 치명률, 시점 치명률이죠.

먼저 누계 치명률부터 보겠습니다. 제가 오늘 말씀드리는 통계 숫자들은 어제 8월 24일 아침 10시에 질병관리청에서 발표한 자료를 근거로 했습니다.

그 자료에 따르면 작년 1월 19일, 코로나 첫 번째 환자가 발생한 이후 8월 23일, 583일 동안 총 확진자가 23만 9천 명, 그리고 총 사망자가 2,228명. 그래서 양자를 나누면 치명률은 0.93%입니다. 거의 1%에 가깝죠. 그러니까 확진자 100명이 생기면 그중에서 한 명이 사망한다고 보는 것이죠.

대략 지난 600일 동안에 총 확진자와 총 사망자 추이를 그려보면 이렇습니다. 좌우 X축은 일자 진행이고, 상하 Y축 중에서 왼편 초록색이 확진자입니다. 그리고 오른편 빨간 부분이 사망자죠. 그런데 왼편 총 확진자 스케일이 10만, 20만으로 올라가고, 오른편 총 사망자 스케일이 천, 2천으로 올라갑니다. 그러니까 총 확진자 스케일이 총 사망자 스케일의 100배입니다.

사망자 그래프가 총 확진자 그래프 위쪽에 위치하다가 마지막 부분, 8월 8일 날에 보면 교차 크로스가 일어나는데요. 이 의미는 크로스 되는 시점의 치명률이 1%라는 뜻이겠죠. 그러니까 8월 8일 이후부터 총 사망자 숫자가 총 확진자 아래에 있으니까 치명률은 1% 미만이라는 것이죠.

치명률만 보면 이렇습니다. 초기 신천지 사태 때까지는 통계 숫자들이 채 정비가 되어있지 않아서 추이가 좀 들쑥날쑥하죠. 어쨌든 지속적으로 치명률이 올라가다가 5월 25일, 치명률이 2.40%까지 올라가서 지난 600일 동안 최대치를 보이죠. 그러다 중간중간 등락은 있습니다만 지속적으로 감소하고 있습니다. 그래서 지난 8월 23일 자 기준으로 보면 0.93%까지 떨어졌죠.

요약하면, 최대치는 작년 5월 25일 2.40%이고, 현재의 누계 치명률은 0.93%입니다. 이런 누계 치명률은 기간 전체, 그러니까 583일 동안의 현황을 조감하는 데는 의미가 크죠. 코로나에 걸리면 사망자가 얼마나 생기느냐라는 질문에 대해서는 누계 치명률, 0.93%라는 답이 가장 적절하죠.

그리고 국가 간 비교를 할 때도 용이합니다.

예컨대, 어제 자 Our Word in Data에서 자료를 보면 유효한 통계가 184개국 자료가 있는데요. 세계 전체 평균은 치명률이 2.1%, 우리나라는 0.9%로서 184개국 중에서 42번째에 위치하고 있죠.

우리보다 치명률이 낮은 국가들을 보면 제일 왼 편에 싱가포르가 0.1%. 그러니까 코로나에 천명 걸리면 한 명이 사망한다는 의미겠죠. 그다음 아이슬란드가 0.3%, 노르웨이가 0.5%, 이스라엘이 0.7%, 덴마크와 핀란드가 0.8%, 그리고 뉴질랜드와 우리나라가 0.9% 수준을 보이고 있죠.

600일이란 기간 전체에 걸쳐서 치명률이 얼마냐라고 할 때는 누계 치명률이 상당히 유용한 통계입니다만 지금 현재의 코로나 치명률은 얼마나 되나요?라고 질문을 하면 좀 답답해지죠.

여기 있는 8월 23일 자 0.93%라는 치명률은 지금 현재의 치명률이 아니라 지난 600일 동안의 숫자를 다 합한 치명률이죠. 그러니까 기간 누계 치명률이지 지금 현재의 순간 치명률은 아니라는 뜻입니다.

그래서 그 대안으로 우리가 사용할 수 있는 것은 누계 숫자가 아니라 신규 숫자를 사용하는 것이죠.

그래서 8월 23일 자 통계를 보면 신규 확진자 1,509명에 신규 사망자가 6명, 그래서 치명률이 0.40%로 나옵니다.

이런 방식으로 지난 600여 일의 신규 치명률을 그려보면 이렇게 되는데요. 그래프의 높낮이가 워낙 들쑥날쑥합니다.

신규 확진자나 신규 사망자의 등락이 일자별로 크기 때문이죠.

예컨대, 치명률이 가장 높게 나오는 날짜가 작년 5월 4일인데요. 무려 67%가 나옵니다. 그런데 그 구체적인 숫자를 보면 확진자 3명에 사망자가 2명이니까 67%로 나오죠.

결국 신규 확진자나 신규 사망자의 모수가 많을 때는 대수의 법칙이 작동해서 그나마 유효한 통계를 구할 수가 있는데, 작년 5월 4일처럼 확진자나 사망자의 숫자가 얼마 안 될 때는 상당히 비상식적인 치명률이 나오죠.

그리고 확진자나 사망자의 숫자가 들쑥날쑥하는 데는 요일 편차가 상당히 작용하고 있습니다. 다시 말해서 토요일과 일요일에는 검사 건수가 다른 요일에 비해서 뚝 떨어지죠.

예컨대, 지난 8월 둘째 주, 셋째 주, 넷째 주 3주간 신규 검사건수와 신규 확진자 숫자를 비교해보면 이렇습니다. 초록색이 검사건수이고, 주황색이 확진자 숫자인데요. 여기서 8월 7~8일, 14~15일, 21~22일이 토요일, 일요일이죠. 검사 건수가 뚝 떨어집니다. 그래서 그다음 날짜 d+1일 신규 확진자 숫자도 뚝 떨어지죠.

3주간의 숫자를 요일별로 합해보면 이런 그래프가 나오는데요. 초록색이 검사건수이고 주황색이 d+1일, 그러니까 다음 날의 신규 확진자 숫자입니다. 대략 오늘 검사하면 결과가 내일 나오죠. 그래서 d+1일을 했습니다. 보시는 바와 같이 토요일과 일요일 날에 숫자가 뚝 떨어지는 것이죠.

그래서 이런 일자별 편차나 요일별 편차를 조정하기 위해서 대략 두 가지 대안을 생각할 수 있는데요. 그 첫 번째가 기간 치명률입니다. 예컨대 한 달 동안의 치명률을 비교해 보자는 것이죠. 그다음 두 번째가 어느 시점을 기준으로 이동평균 숫자를 사용하는 것이죠.

먼저 기간 치명률을 보겠습니다. 가장 많이 활용하는 방법이 월별 치명률인데요.

먼저 월 단위로 확진자와 사망자의 그래프를 그려보면 이렇게 나오죠. 조금 들쑥날쑥합니다만 대략 추이가 비슷하게 가고 있는 모습을 보입니다.

이를 기준으로 해서 월별 기간 치명률을 구해보면 이렇습니다. 가장 높았을 때가 작년 4월, 9.36%고 가장 낮을 때가 금년 7월, 0.18%입니다. 그런데 이 기간 치명률의 결정적인 단점은 임의로 한 달이라는 기간을 정했기 때문에 결과적으로 나오는 수치가 그리 정교하지 않다는 것입니다.

예컨대 확진자나 사망자가 비슷한 추이로 움직이고 있습니다만 그 편차가 상당히 커 보이죠.

구체적으로 확진자와 사망자 두 지표 간의 상관계수를 구해보면 0.16밖에 나오지 않습니다. 양자 간의 상관관계가 지극히 낮다는 의미겠죠. 그래서 월별 치명률을 가지고 현실을 설명하기에는 상당히 무리가 따른다고 봐야죠. 그러면 어떤 대안이 있을까요? 시점 또는 순간 치명률을 사용하는 것이죠.

가장 많이 사용하는 방법이 7일 이동평균을 사용하는 것이죠.

앞서 봤습니다만 일자별 확진자와 사망자 그래프를 그려보면 이런데요.

특정 날짜 전 3일, 특정 날짜 후 3일 까지를 더해서 7일 동안의 이동평균을 사용하면 그래프가 상당히 스무드해집니다.

Our World in Data나 여러 군데 기관에서 가장 많이 사용하는 방식이죠. 이렇게 하면 그래프의 높낮이도 스무드해지면서 요일 간의 편차도 극복할 수 있다는 장점이 있죠.

이런 방식으로 치명률을 구해 보면 이런 그래프가 나옵니다. 이 역시 상당히 들쑥날쑥합니다만 앞서 살펴본 일자별 치명률에서는 피크 값이 67%까지 나왔는데요. 여기에서는 5월 2일 날 20%로 뚝 떨어져 있죠. 그리고 제일 최근 수치는 8월 20일 자 치명률이 0.44%로 나옵니다.

작년 5월 2일 자 숫자를 보면 확진자 이동 평균값이 6.4, 사망자가 1.3. 그래서 20%로 나오는 것이죠.

마찬가지로 7일 이동평균의 사망자와 확진자의 상관계수를 구해보면 0.35로 나오죠. 아까 월별 통계 0.16 보다는 신뢰도가 확 올라갔습니다. 이 정도 숫자면 어느 정도 활용 가능한 수준은 넘었죠. 그런데 문제는 일별 시차가 발생한다는 것입니다.

그래프를 보시면 초록색이 확진자고, 주황색이 사망자인데요. 신천지 때도 확진자가 피크치를 보이고 한참 있다가 사망자가 피크치에 도달하죠. 2차 8월 대란 때도 상당한 시간 차가 있습니다. 작년 연말, 오래 연초 3차 때도 마찬가지입니다. 그리고 현재 진행 중인 4차 때는 아직 피크점이 나오지 않았기 때문에 단정할 수는 없습니다만 우리들이 상식적으로 생각하면 너무나 당연한게도 시차는 발생하는 것이죠.

왜냐하면 확진자가 발생한다고 해서 바로 당일 날 사망하는 것이 아니라 병원에 입원해서 치료 과정을 거치고 가능한 모든 노력을 다 하다가 결국 모든 처방들이 듣지 않으면 사망하게 되니까 양자 간에 타임 갭이 생기는 것은 상식적인 일이죠. 그래서 치명률이라는 지표의 신뢰도를 더 높이기 위해서는 사망자가 발생하는 시차를 조정해야 됩니다.

제가 지난 에피소드에서 코로나 확진자의 격리 기간이 대략 16.3일이라고 말씀드렸는데요. 그 통계를 구했던 이유 중 하나가 이 치명률을 구하는데 활용하려는 목적도 있었습니다.

리뷰를 해보면 지난 에피소드에서 보여드린 그림이 이것입니다. 작년 1월 20일부터 금년 8월 16일까지 그래프였죠. 그런데 앞부분, 신천지 사태가 일어나기 전 2월 16일까지는 숫자들이 워낙 작아서 통계 결과가 좀 들쑥날쑥하죠. 그리고 최근 7월 30일 이후의 확진자들은 아직도 격리 중에 있기 때문에 시간이 지나야 유효한 통계를 구할 수 있죠.

그래서 앞뒤 부분을 자르면 작년 2월 17일부터 금년 7월 30일까지 통계인데요. 최장 격리기간이 작년 4월 7일 날 43일, 그리고 현재 시점 격리기간이 15일로 나오는 것이죠.

그리고 600일 평균이 16.3일로 나옵니다. 며칠 날짜가 지났기 때문에 8월 23일까지 자료를 업데이트를 하면 유효한 날짜가 8월 7일까지인데요. 평균 격리기간 16.3일은 며칠 사이에 변화가 없습니다.

그래프를 그려보면 거의 비슷하게 나옵니다만 지난 자료에서 7월 30일 기준으로 15.3일이었는데 0.1이 줄어서 8월 7일 기준으로 15.2일로 나옵니다.

여기서부터 좀 골치 아픈 이야기가 시작되죠. 사망자 발생이 확진자 발생과 어느 정도 시차를 두고 생긴다는 문제를 극복하기 위해서 두 가지 정도를 가정을 했습니다. 그 첫 번째가 지난 에피소드와 마찬가지로 확진자와 사망자는 선입선출법으로 생긴다고 본 것이죠.

다시 말해서 어떤 확진자는 30~40일 있다가 완치가 돼서 격리해제가 되는 경우도 있고 또 어떤 경우에는 코로나로 확진 판정받은 후 3~4일 있다가 사망하는 경우도 있죠.

그런데 현실적으로 22만 명 모두를 개별적으로 발생일자와 사망 일자를 추적하기에는 제가 가진 통계로써는 한계가 있기 때문에 일단 먼저 확진된 사람이 먼저 격리해제가 되거나 먼저 사망했다고 가정을 한 것입니다.

그다음 두 번째 가정은 특정 일자의 격리자가 동일한 확률로 사망한다고 본 것이죠.

조금 말이 어렵습니다만 특정 일자의 격리자라 함은 예컨대 작년 12월 28일 기준으로 보면 격리자가 17,148명이었고 그날 사망자가 40명이었습니다. 그런데 17,148명의 격리자가 다 동일하게 확진 판정을 받은 것이 아니라 그 이전, 18일간에 걸쳐서 확진 판정을 받고 아직 치유가 안 된 분들이죠.

예컨대 이 17,000명 속에는 12월 11일 자에 확진된 분이 166명 포함이 되고 12월 12일 자에 확진된 분이 1,030명이 포함되어 있다는 것이죠. 그래서 그날 사망자 40명을 이 비율대로 나누어 보면 12월 11일에는 0.4명, 12월 12일에는 2.4명 이렇게 나오죠. 그러니까 12월 28일 날 사망자가 40명 발생했는데 그 구성을 보면 12월 11일 자 확진자 해당분이 0.4명이라는 것입니다. 그래서 이 12월 11일 자 해당분을 쭉 더하면 12월 11일 자 확진자에 해당되는 사망자 숫자가 나오는 것이죠.

그 결과를 그래프로 그려보죠. 먼저 이 그래프는 시차 조정을 하지 않은, 그러니까 7일 이동평균만 적용한 그래프죠. 보시는 바와 같이 한눈에 봐도 확진자와 사망자 간에는 상당 기간의 시차가 발생을 하죠.

여기에 사망자의 시차 조정을 하면 주황색 선이 나옵니다. 얼핏 봐도 거의 시차가 없어졌죠.

주황색 선이 들쑥날쑥하기 때문에 주황색 선을 7일 이동평균으로 스무드하게 그려보면 이렇습니다. 빨간색 선으로 나오죠. 보시는 바와 같이 그 시간 차가 거의 극복이 되었습니다.

이를 바탕으로 치명률을 구해보면 이런 결과를 구할 수 있는데 상당히 들쑥날쑥합니다.

날짜별로 보죠. 가장 피크치가 4.75%, 3월 28일입니다. 신천지 때죠. 5월 9일 날 치명률이 3.6% 나오죠. 이태원 클럽 사태가 발생했을 때죠. 7월 2일 날 1.68%로 상당히 높게 나온 것은 그 당시 사망자와 확진자 숫자가 너무 적어서 대수의 법칙이 작동하지 않은 결과입니다. 무시할 수 있고요. 9월 13일 날 2.5%까지 올라가죠. 8월 2차 대란 때입니다. 금년 1월 4일 날, 2.47%까지 올라갑니다. 연말연시 3차 대란 때죠. 그리고 지난 7월 10일 날 가장 낮은 숫자, 0.19%가 나오죠. 코로나에 100명이 걸려도 그중에서 사망자가 0.2명이 채 안 된다는 것이죠. 그다음 가장 최근 숫자가 8월 7일인데요. 아까 말씀드렸습니다만 8월 8일 이후 확진자들은 아직 격리 중에 있기 때문에 그 최종 숫자는 시간이 지나야 되고 현재는 8월 7일까지가 제일 최신 숫자인데요. 0.38%로 나옵니다. 그러니까 확진자 1000명에 사망자 4명이 채 안 된다는 것이죠.

7월 10일 날 0.19%는 작년 3월 28일 날 신천지 때 4.75%의 25분의 1밖에 안 됩니다. 그냥 이 표만 보고 말씀드리면 코로나의 독성이 25분의 1로 떨어졌다는 것이죠.

물론 신천지 때는 우리가 처음 당하는 일이었고 여러 가지 백업 시스템이 완비가 되지 않았기 때문에 숫자가 상대적으로 높았다고 보지만 2~3차 대란 때 2.53%와 2.47%는 현재 0.19%, 0.38%와 비교를 하면 코로나의 치명률이 거의 10분 1 미만으로 떨어졌다고 볼 수 있는 것이죠. 그러니까 코로나에 걸려도 작년 8~9월이나 연말연초 당시보다는 사망할 확률이 10분의 1 밑으로 떨어졌다는 것입니다.

여러 가지 원인이 있겠습니다만 제 상식으로는, 최근 우리나라에서 발생하는 코로나 확진자의 90% 이상이 델타 변이라는 자료들이 나와 있는데요. 아마 이 델타 변이가 감염력, 확산력, 전파력, 전염력에서는 훨씬 높지만 독성이나 사망률, 치명률에서는 월등히 낮다는 가정을 해 볼 수 있겠죠. 다음 에피소드에서 바이러스 델타 변이에 대해서 좀 더 구체적으로 살펴보죠.

이상 여기까지 종합을 하겠습니다. 누계 치명률은 관점이 다르니까 별개로 하고 추가적으로 네 가지 유형의 치명률에 대해서 설명 말씀을 드렸는데요.

한 표로 그리면 이렇습니다.

처음 나오는 것보다 뒤에 나오는 그래프가 현실을 더욱더 잘 설명한다고 말씀을 드렸습니다. 실제 그런지 검증을 해봐야죠.

각각 방식의 확진자와 사망자 간의 상관관계를 봤죠. 그 계수가 먼저 월별 치명률의 경우에는 0.16으로 나옵니다.

그래프를 한 눈으로 봐도 큰 추이는 비슷합니다만 편차가 심하죠.

일자별로 그려보면 상관계수가 확 올라갑니다. 0.35까지 높아지죠. 월 단위로 보던 것을 일 단위로 보니까 당연히 높아지겠죠.

일자별 들쑥날쑥한 것을 7일 이동평균으로 스무드하게 만들면 0.39까지 올라갑니다.

여기서 확진자, 사망자 사이에 발생 시차를 조정을 해주면 0.49까지 올라가죠.

이 역시 선이 들쑥날쑥하기 때문에 스무드하게 다듬으면 상관계수가 무려 0.50까지 올라가죠. 그런데 시차 조정을 한 것이 0.49, 7일 평균을 한 것이 0.50인데요.

상관계수가 0.01 차이입니다만 이 표에서 보시면 최고점, 최저점에서는 큰 차이가 납니다. 시차 조정만 한 경우에는 치명률 최저치가 0.13, 최고치가 6.24인데요. 7일 이동평균을 하면 최저치는 올라가고 최고치는 낮아집니다. 그러니까 변동폭이 훨씬 줄어들었다는 것이죠.

이 표에서는 일별 치명률이 너무 높게 나와서 그 차이가 눈에 확 들어오지 않습니다만 상하 Y축의 스케일을 좀 바꿔 주면 7일 이동평균한 것이 훨씬 더 편차가 적다는 것을 알 수 있습니다.

자 요약하겠습니다. 치명률을 구하는 방식은 여러 가지가 있습니다. 지난 600일 동안에 발생한 총 숫자를 기준으로 한 누계치, 누계 치명률은 나름대로 다양한 용도가 있습니다만 특정 시점의 순간 치명률에 대해서는 알 수가 없습니다.

그래서 순간 또는 시점의 치명률을 알 수 있는 몇 가지 방식을 검토를 했는데요.

제 개인적인 생각으로는 신규 확진자는 7일 이동평균 숫자를 쓰고 신규 사망자는 발생 시점 시차를 조정한 후에 7일 이동평균을 사용하는 방식이 현실을 가장 잘 설명하고 있다는 생각입니다.

이 방식으로 순간 치명률을 구해보면 현재 4차 대란이 진행되고 있는 시점의 치명률은 작년 8~9월에 2차, 작년 연말~올해 연초에 진행됐던 3차 대란 때보다는 그 치명률이 거의 10분 1 수준으로 낮아졌다는 것이죠.

다시 말씀드려서 2~3차 때는 코로나에 걸리면 사망할 확률이 거의 2.5% 전후였는데요. 현재는 0.2% 내지 0.3% 수준을 보이고 있습니다. 이상 여기까지 마치도록 하겠습니다. 감사합니다.