3얼 4일 0시 기준 질병관리본부 국내 일별 누적확진자수 동향
한국의 발디스 크렙스 권수근 박사, N=exp(0.194×t) 추정식 통해 확진자 수 추이 예측
(전국= KTN) 김도형 기자= 국내 신종 코로나 확진자 수 예측모델링과 관련해 의료 역학(Epidemiolory) 분야에서도 감염병 확산 예측을 위해 통계모델링을 활용하고 있다.
역학에서 다루는 SIR모델을 참고로 기초적인 예측모델링은 다음과 같다.
로지스틱 함수의 기본형
최근 확진자수의 증가가 기하급수적으로 증가하는 양상이나 계속해서 이와 같은 지수함수의 모습으로 갈지는 아직 미지수다.
역학모델링에서는 바이러스 확산이 로지스틱 함수를 따른다고 가정한다. 이는 감염병의 발생, 확산, 감소, 종식의 주기를 가장 잘 나타내는 모형이기 때문이다.
지난 2015년도 당시 메르스 사태 때의 누적 환자수 그래프의 추이 역시 로지스틱 함수에 근접한 양상이었다고 보고된 바가 있다.
2015년 메르스 사태 당시 누적 확진자 수 그래프
질병관리본부에서도 이와 같은 로지스틱 모형을 활용한 감염병의 수학적 모델링을 논문(아래 참조)으로 밝힌 바가 있다.
한편, 지난 2월 13일 중앙일보에 따르면 코로나 확산 추이와 관련해 "2월말 99% 도달, 3월초 종료"로 예상한 물리학자의 계산법에 대해 보도한 사실이 있다.
당시 통계물리학으로 사회 현상을 분석하는 수도권 대학교의 복잡계 물리학자 K교수는 신종 코로나바이러스 감염증(우한 폐렴) 확진자수는 메르스 사태때와 같은 추이로 흘러 갈 것으로 보고 사실상 2월 말에 멈출 것으로 예측했다.
K교수가 자신있게 3월 초에 코로나19가 종료될 것이라고 주장한 이유는 중국 정부가 발표해온 확진자 숫자가 정확하고, 감염병 확산을 위해 기울이고 있는 노력이 유지된다는 전제 하에 가능한 예측이었기 때문이다.
하지만 2월 18일 슈퍼전파자로 알려진 31번 확진자 발생 이후 K교수의 예측은 크게 빗나갔다. 신천지 교인들의 집단 감염의 영향으로 대구.경북의 급격한 확진자수 증가는 로지스틱 모형에서 큰 변수로 작용한 것이다.
K교수팀은 중국에서 발표하는 확진자 수를 '로지스틱 모형'(Logistic model)에 시점별로 확진자 수를 대입해 감염율과 최종 확진자수 결과값을 예측했다. 로지스틱 모형은 미분 방정식을 따르는 'S자' 꼴(로지스틱 커브)의 함수로 dN/dt=rN(1-(N/K)) 방정식을 쓰며 t는 시간, N은 확진자수〈N(t)는 t시점에서의 확진자수〉, r은 감염율, K는 이 방정식을 풀면 나오는 수렴 값(최종 확진자수)이다.
한편, LG필립스디스플레이 대표를 역임한 권수근 박사는 4일 0시를 기준으로 확진자수가 5,328명을 기록한 것과 그동안의 누적 자료를 토대로 추정식을 만들었다. 권 박사는 추정식을 통해 확진자수가 1만명을 넘아가게 될 시점이 3월 7일~3월8일 경으로 추정했다.
권수근 박사가 사용한 추정식은 N=exp(0.194×t)이며 t는 1월 20일 후 경과한 일수이며 N은 확진자수이다.
2020년 3월 4일 0시 기준 질병관리본부 발표 확진자 수 발표 토대로 예측한 추정값
2020.3.5일 코로나 확진자수 예측모델 추정식 통계치 데이터값 업그레드
*질병관리본부의 발표 데이터값의 신뢰도가 높을 수록 예상치의 정확도는 향상된다.
권수근 박사는 향후 누적된 확진자수 추이 자료를 토대로 코로나19가 어느 시점에 고개를 숙일지 예측할 수 있도록 추정식을 계산해 낼 예정이다.
감염병과 수학모형: SIR 모형과 SEIR 모형
Infectious diseases and mathematical modeling: SIR model and SEIR model
질병관리본부 전염병대응센터 역학조사과
Ⅰ. 들어가는 말
모든 모형(modeling)은 일반적으로 체계(또는 개체 시스템)가 어떻게 작동하는 것인가를 설명하는 개념적인 도구로 생각할 수 있다. 수학모형은 수학 언어를 사용하여 어느 체계를 보다 세련되고 정확하게 설명한다. 역학(epidemiology)에 적용되는 수학모형은 역학적 요인들의 개별 수준의 지식으로부터 모집단 수준의 유행 역학(epidemic dynamics)을 예측하게 하고, 또한 초기 유행양상에서부터 장기적인 유행양상을 예측하게 할 뿐만 아니라 감염의 전파에 백신 등이 미치는 영향 등을 예측 가능하게 한다.
감염병의 진행은 숙주 내의 병원체 수준에 따라 정성적으로 정의되며, 그 후에 병원체의 성장률과 병원체와 숙주의 면역반응의 상호작용에 의해 결정된다. 처음 단계에서 숙주는 감염에 감수성이 있는 개인(susceptible, S)이 되며, 어떠한 병원체도 존재하지 않고, 그냥 숙주 내에서 하위 수준의 비특이적 면역(nonspecific immunity)만이 있는 것으로 가정된다. 그러나 0(zero) 시간 이후부터 숙주는 감염력이 있는 개인(infectious, I)을 만나서 병원체에 감염이 되고, 시간이 지남에 따라 병원체의 수가 증가된다. 이 초기 단계에서 개인은 감염의 분명한 증상이나 징후가 없을 수도 있으며, 병원체의 수가 너무 작아서 더 이상의 전파가 이루어지지 않는데, 이 단계를 개인이 노출군(exposed, E)에 있다고 한다. 병원체의 수준이 숙주 내에서 충분히 커지면, 숙주는 다른 감수성이 있는 개인에게 전파할 수 있는 감염력이 있는 숙주(infectious, I) 단계로 진행된다. 마지막으로 이 숙주에서 치료, 예방접종 등을 통해 더 이상 감염력은 없어지는데 이 단계를 회복군(recovered or removed, R)이라 한다.
최근 감염병 연구에서 수학모형이 빈번히 인용되고 있는 바, 이 글은 감염병 모델링에서 가장 기본이 되는 두 수학모형(SIR과 SEIR)을 비교하여 모형 이해에 도움을 주고자 한다.
Ⅱ. 몸 말
1. SIR 모형
어떤 감염병의 장기적인 혹은 내적 역학에 관심이 있다면, 인구학적 과정을 명확하게 이해하는 것이 중요하다. 가장 간단하고 일반적으로 사용되는 인구학을 SIR 모형에 도입하는 것은 숙주의 자연수명 1/μ년을 가정하는 것이다. 그러면 특정 역학(dynamic) 클래스에 속하는 개인은 자연사망률(조사망률)이 μ로 주어진다. 이 요인은 질병과는 독립적이고 감염병원체의 병리학을 반영하는 것은 아니다. 또한 μ는 역사적으로 모집단의 조출생률을 나타낸다고 가정해 왔다. 따라서 모집단의 크기는 시간에 따라 변하지 않는다(dS/dt + dI/dt + dR/dt = 0). 이 틀은 선진국의 인체 감염 연구를 위해 고안된 것으로, 숙주 모집단이 고유의 독특한 역학 양상(보통의 야생모집단에서 볼 수 있듯이)을 보이는 것이라면 접근방법은 달라질 것이다. 이러한 모든 가정을 함께 넣어, 다음의 일반화된 SIR 모델을 얻을 수 있다.
ds = μ - βSI - μS,
dt
dI = βSI - γI - μI,
dt
dR = γI - μR.
dt
모수 ___________________________________________________________________
μ 는 1인당 사망률 그리고 모집단 수준의 출생률
β 는 전파율. 전파확률과 더불어 감수성군과 감염군이 만날 율
γ 는 회복률 또는 제거율. 그 역수(1/γ)는 평균감염기간을 결정
S (0) 는 모집단 내의 최초 감수성군의 분율
I (0) 는 모집단 내의 최초 감염군의 분율
* 모든 율(rate)의 단위는 일(day). 또한 모든 모수는 양수이고, S(0) + I(0) ≤ 1
다음은 빈도(frequency) 또는 밀도(density) 의존적 전파를 가진 SIR 모형에 대해 소개한다. 말라리아, 홍역, 백일해, 중증급성호흡기증후군(SARS), 뎅기열 등 수많은 감염병이 높은 사망 위험(risk)과 연관이 있다. 그렇다면 감염이 초래한 사망률은 어떻게 탐구할 수 있을까? 명확한 접근법은 SIR 방정식에 μI와 같은 항을 추가하는 것으로 μ는 감염군에 속한 개인의 질병으로 인한 사망률을 나타낸다. 그러나 이것은 생물학적으로 해석하거나 데이터를 통해 추정하기가 까다롭다. 따라서 그 대신에 I군에 속한 개인의 질병사망 확률 ρ, 즉 회복되기 전이나 자연적 원인으로 사망하기 전에 감염에 의한 사망 확률을 생각하는 것이 더 좋다. 빈도/밀도 의존적인 전파를 고려하면, 전체 모집단의 크기 N은 감소하는데 그 이유는 질병으로 인한 사망률 때문에 숙주들 간의 상호작용이 감소하기 때문이다. 역학(dynamics)을 보다 분명하게 하기 위하여, 분율보다 빈도(예: βXY) 또는 밀도(예: βXY/N)를 사용한다(다음 미분방정식의 X, Y, Z는 분율이 아니라 수임에 주의. Figure 1은 밀도의존 SIR 모형임).
영국 셰필드 근교의 한 마을 Eyam에서 1665년과 1666년에 발생한 페스트(plague)에 대한 수학모형은 350명의 마을 인구 중 83명만이 생존한 대재앙으로 사망자 명부 등 여러 기록을 검토한 결과, S(0)=254, I(0)=7이었음을 밝혀내고 SIR 모형을 사용한 결과, SIR 모형이 사망자 예측에 적합한 것으로 판명되었다.
dX = ν - βXY - μX,
dt
dY = βXY - γ + μ Y,
dt 1 - ρ
dZ = γY - μZ.
dt
ρ 는 사망 확률. 감염된 개인이 회복되기 전에 그 질병으로 죽을 확률
μ 는 자연적 원인으로 인한 개인의 사망률
ν 는 모집단의 출생률. ν/μ 는 보유율(carrying capacity) 과 같음
β 전파율. 전파확률과 더불어 감수성군과 감염군이 만날 율
γ 는 회복률 또는 제거율. 그 역수(1/γ)는 평균감염기간을 결정.
X (0) 는 모집단내의 최초 감수성군의 수 또는 밀도
Y (0) 는 모집단내의 최초 감염군의 수 또는 밀도
N (0) 는 모집단의 크기
* 모든 율(rate)의 단위는 일(day). 또한 모든 모수는 양수, X, Y, Z는 모두 수이고 ρ 는 확률임
2. SEIR 모형
이제부터는 잠복기를 고려한 SIR 모형보다 복잡한 모형을 소개한다. 전파 과정은 종종 최초 극소수의 병원체 단위[예: 몇 개의 박테리아 세포 또는 비리온(virions)]의 침입(inoculation)으로 시작된다. 그 후에 숙주 내의 면역체계에 상대적으로 덜 방해를 받으면서 숙주 내에서 빠르게 증가하는 기간을 거친다. 이 단계에서 다른 숙주에 활발하게 전파하기에는 병원체의 양이 충분하지 않지만 병원체는 존재한다. 따라서 숙주는 감수성군(S), 감염군(I), 회복군(R)으로 분류될 수 없다. 그래서 감염되었지만 아직 감염력이 없는 이런 개인들을 위한 새 범주를 도입할 필요가 있다. 이런 개인들을 노출군(exposed class)이라고 명명하고 SEIR 모델에서 변수 E로 표시한다. 이 모형은 노출군에서 감염군으로 이동 즉, 잠복기를 고려한 모형으로 보다 현실적이라고 할 수 있다. 동일한 전파율(β)과 평균감염기간(1/μ)을 가진 감염병의 유행역학을 비교했을 때, 동일 시점에서 SEIR 모형이 밀도의존 SIR 모형보다 잠복기(1/σ)에 따라 적은 감염자의 수를 나타내는 특성이 있다(Figure 1, Figure 2).
dS = μ - (βI + μ)S,
dt
dE = βSI - (μ + σ)E,
dt
dI = σE - (μ + γ)I,
dt
dR = γI - μR.
dt
μ 는 개인의 사망률, 그리고 모집단의 출생률
β 는 전파율. 전파확률과 더불어 감수성군과 감염군이 만날 율
γ 는 회복률 또는 제거율. 그 역수(1/γ)는 평균감염기간을 결정
σ 는 개인들의 노출군에서 감염군으로의 이동률. 그 역수(1/σ)는 평균 잠복(노출)기
S (0) 는 모집단내의 최초 감수성군의 분율
E (0) 는 모집단내의 최초 노출군의 분율 (감염되었으나 감염력이 없음)
I (0) 는 모집단내의 최초 감염군의 분율
* 모든 모수는 양수이고, S(0)+I(0) ≤ 1
Ⅲ. 맺는 말
감염병 모델링에서 가장 기본적이고 중요한 두 모형인 SIR 및 SEIR 모형은 홍역 또는 인플루엔자 등과 같은 많은 감염병의 역학적 특성 분석에서 기본재생산계수(basic reproduction number, R0) 등 질병 연구에 유용한 모수에 대한 근사치(approximation)를 제공해 왔다. 그러나 다양한 자연사와 복잡한 전파기전을 가진 감염병들은 좀 더 복잡한 수식 모델링을 필요로 한다. 그 예로 B형 간염, 포진, 또는 수두 등과 같은 감염병들은 보균자 상태로도 전파할 수 있어 개인들은 보균자에 의해 감염되거나 급성감염력이 있는 개인에게 감염될 수 있기 때문이다. 따라서 질병역학에 수학적 모형을 적용할 때에는 그 질병의 자연사 및 전파기전 특성에 부합하는 적합한 모델링을 해야 설명력을 높일 수 있음을 이해할 필요가 있겠다.
이번 원고에 소개한 모델들은 간략한 설명을 위해 감염에 대한 차별적 감수성, 접촉망(contact network), 면역반응의 차이 그리고 전파성 등과 같은 이종성(heterogeniety) 문제 등은 생략하고 기술하였다.
※ SIR 또는 SEIR 모형은 감염병 역학에서의 구획모형(compartment model)의 가장 기본이다. 수학모형은 여러 가지 형식으로 표현된다. 크게 결정모형(deterministic model)과 확률모형(stochastic model)으로 나뉘며, 결정모형은 다시 이산(discrete) 모형과 연속(continuous) 모형으로 구분되며, 연속(continuos) 모형은 상미분방정식형(ordinary differential equations)과 편미분방정식형(partial differential equations)로 나타내어진다. 이 원고에서는 상미분방정식형 연속모형을 설명하였다.
Ⅳ. 참고문헌
1. Anderson, R.M., and May, R.M, Infectious Diseases of Humans. Oxford: Oxford University Press, 1991.
2. Bailey, N.T.J., The Mathematical Theory of Infectious Diseases and its Applications. London: Charles Griffin and Company, 1975.
3. Nelson, K.E. et al. Infectious Disease Epidemiology : Theory and Practice, Maryland: Aspen Publication, 2001.
4. Brauer, F. et al. Mathematical Epidemiology, Berlin: Springer-Verlag, 2008.
5. Hunt et al. A Guide to MATLAB for Beginners and Experienced Users. Cambridge: Cambridge University Press, 2006.
<저작권자(c)한국유통신문. 무단전재-재배포 금지>
기사제보 및 사회적 공헌활동 홍보기사 문의: 010-3546-9865, flower_im@naver.com
코로나19 추이 8일경 확진자수 1만명 돌파할 것으로 예상