OWID 교정본 다운로드 [2020.1.21.~12.17.]

“Our World in Data” 한국 통계 교정본을 올립니다

현재 코로나와 관련해서 가장 방대하고 일관성 있게 data를 upload하는 곳이 옥스포드 대학에서 운영하고 있는 “Our World in Data”입니다. 한국 자료 역시 포함되어 있어서 저는 코로나 관련 통계 작업을 할 때는 원칙적으로 이 자료를 활용합니다.

그런데 수록 data 중에서 일부 에러와 유의사항이 있습니다.

 

1. 에러

2020.1.21. 최초 신규확진자 1명이 누락, 누계치도 에러입니다. [실제로는 1/20 오전에 확진되었는데 OWID에서는 1/21로 기록되어 있습니다]

2020.2.20. 최초 신규사망자 1명이 누락, 누계치도 에러입니다.

코로나 신규검사건수는 상당 부분 누락이 있습니다. 누계치도 마찬가지입니다.

 

2. 유의사항

각종 data의 일별 편차를 극복하기 위해 OWID에서는 “smoothed”라는 용어 아래 “7일 이동평균” 값을 사용하고 있습니다. 그런데 7일간의 마지막 날짜에 이동평균값을 표기하고 있어 오해의 소지가 있습니다. 즉 smoothed 값은 당일을 포함한 지난 7일간의 평균값입니다. 그래서 교정본에서는 통상의 용례에 따라서 당일을 포함해서 앞뒤 총 7일간의 평균값을 “7일이동평균” 값으로 교정했습니다.

 

OWID수록 data 내용

  • iso 코드 iso_code
  • 대륙 continent
  • 국가 location
  • 날짜 date
  • 총확진자 total_cases
  • 신규확진자 new_cases
  • 신규확진자[7일 평균]new_cases_smoothed
  • 총사망자 total_deaths
  • 신규사망자 new_deaths
  • 신규사망자[7일 평균] new_deaths_smoothed
  • 총확진자[백만명당] total_cases_per_million
  • 신규확진자[백만명당] new_cases_per_million
  • 신규확진자[7일 평균, 백만명당] new_cases_smoothed_per_million
  • 총사망자[백만명당] total_deaths_per_million
  • 신규사망자[백만명당] new_deaths_per_million
  • 신규사망자[7일 평균, 백만명당] new_deaths_smoothed_per_million
  • 재생산률 reproduction_rate
  • 중환자실환자 icu_patients
  • 중환자실환자[백만명당] icu_patients_per_million
  • 입원환자 hosp_patients
  • 입원환자[백만명당] hosp_patients_per_million
  • 주간 중환자실입원수 weekly_icu_admissions
  • 주간 중환자실입원수[백만명당] weekly_icu_admissions_per_million
  • 주간 입원환자 weekly_hosp_admissions
  • 주간 입원환자[백만명당] weekly_hosp_admissions_per_million
  • 신규검사건수 new_tests
  • 총검사건수 total_tests
  • 총검사건수[천명당] total_tests_per_thousand
  • 신규검사건수[천명당] new_tests_per_thousand
  • 신규검사건수[7일 평균] new_tests_smoothed
  • 신규검사건수[7일 평균, 천명당] new_tests_smoothed_per_thousand
  • 양성률 positive_rate
  • 확진자당 검사건수 tests_per_case
  • 검사유닛 tests_units
  • 총백신접종건수 total_vaccinations
  • 총백신접종건수[백명당] total_vaccinations_per_hundred
  • 엄중도지수 stringency_index
  • 인구 population
  • 인구밀도 population_density
  • 중위연령 median_age
  • 65세이상 인구비중 aged_65_older
  • 70세이상 인구비중 aged_70_older
  • 인당소득 gdp_per_capita
  • 극빈층비중 extreme_poverty
  • 순환기질환사망율[인구 십만명당] cardiovasc_death_rate
  • 당뇨유병률 diabetes_prevalence
  • 여성흡연비중 female_smokers
  • 남성흡연비중 male_smokers
  • 손씻기설비 handwashing_facilities
  • 병상수[천명당] hospital_beds_per_thousand
  • 기대수명 life_expectancy
  • 인간계발지수 human_development_index