유전체 분석을 통한 COVID-19 유행 분석과 전망
Date 2020-10-20 01:54:07 페이스북으로 보내기 트위터로 보내기 hit 538
김 태 형
수석연구원
테라젠이텍스
hkim@therabio.kr

지난 17 년 동안 3종의 신종 코로나 바이러스가 출현했으며 또한 지난 6 년 동안 거의 지속적으로 에볼라, 지카 바이러스, 뎅기 바이러스 등이 출현해 전 세계적으로 확산되고 있다 [1]. 이들 전염병의 기원을 가만히 들여다 보면 대부분 야생 동물에 의해 전파되었다. 야생 동물들은 바이러스들과는 오랜 기간 적응해 잘 살고 있으면서도 사람과 접촉은 그렇게 많지가 않아서 동물들이 바이러스를 사람에게 옮길 가능성은 희박했던 것 같다.

그런데 최근 몇 십 년 사이에 사람들이 대규모 벌목을 하고 환경을 파괴하면서, 그리고 야생동물을 시장에서 거래하기 시작하면서 동물들은 이미 적응한 바이러스지만 사람은 한번도 경험하지 못한 신종 바이러스들이 나타났다. 사람의 면역체계가 이 새로운 항원에 전혀 적응을 못하고 있어 전 인류가 몇 번 감염되어 적응하기 전까지는 당분간은 이들 바이러스들에 의한 감염병은 치사율도 매우 높고 감염 전파력도 매우 높아 인류는 계속 고생해야 할 듯 하다. 그리고 다양한 동물 유래 SARS 코로나 바이러스 들의 게놈을 들여다 보면 이번 SARS-CoV-2 에서 발생했던 항원 대변이 (antigenic shift) 현상의 원인이 되는 바이러스 게놈 내 genetic recombination 이벤트가 이미 아주 빈번하게 일어나고 있었음을 알 수가 있다. SARS-CoV-2는 단지 이들 중 하나일 뿐인 듯 한다. 즉, 언제든지 COVID-19와 같은 팬데믹은 일어날 수 있음을 보여주고 있다. 지금이라도 전 세계 야생동물들에서 유래하는 다양한 바이러스들의 게놈맵을 만들어 앞으로 출현 가능성이 있는 신종 바이러스들을 예측하고 이 맵을 기반으로 이 바이러스들의 출현을 차단할 방법들을 찾아가야 할 것으로 보인다.

최근에 이슈가 되고 있는 SARS-CoV-2 게놈 분석 연구 중에 이 바이러스의 게놈을 인위적으로 조작했다는 설에 대해서 정리를 해보았다. 1월 10일 중국 우한시에서 처음 SARS-CoV-2 레퍼런스 게놈 서열이 해독되어 진뱅크에 공개되고 난 이후에 많은 바이러스 게놈 연구자들이 이 게놈 데이터를 통해 조작 가능성에 대해서 분석했다. 이미 많은 과학자들이 이번 COVID-19의 원인이 되는 SARS-CoV-2의 게놈은 조작된 것이 아니라 자연발생적 돌연변이에 의해 변종이 발생한 것이라는 것을 수십 편의 과학 논문을 통해 계속 보고하고 있지만 전혀 잠잠해지지 않고 있어 2월 중순에는 란셋에 전 세계 30명의 과학자들이 사회혼란만 가중시키는 바이러스 게놈 조작설에 대해서 근거가 전혀 없음을 공동성명서까지 제출하기까지 했었다 [1]. COVID-19의 주요 원인인 SARS-CoV-2가 중국 한 연구소에서 생물학 무기를 위해 만들어진 "engineered virus"가 퍼졌다는 주장은 명백히 허위라는 것이다. 전 세계 연구자들이 다양하게 그리고 독립적으로 SARS-CoV-2 게놈을 분석해본 결과를 종합했을 때 결론은 이 게놈은 절대로 생물학 무기를 위해 만들어진 "engineered virus" 일 수 없으며 오리진은 명백하게 야생동물에 유래된 것이라고 이 란셋에 보고된 공동성명서에서는 말하고 있다.

그리고 HIV 바이러스 전문가인 파우치 박사도 중국에서 HIV 바이러스 게놈과 재조합을 통해 조작했거나 또는 야생박쥐 바이러스를 실험실에서 유출했다는 증거는 없다고 발표를 했다. 실제로 올 초에 예리멍 박사처럼 SARS-CoV-2 게놈이 조작되었다고 주장하는 과학자들이 많았지만 자신들이 주장하는 서열들이 BLAST로 공개 데이터베이스에서 간단히 검색을 해봐도 이미 자연상에서도 발견되는 서열들이어서 조작을 주장하는 논문들은 학계에서 전혀 받아들여지지 않고 있다.

 

7a6a6d8ab9bed2359474b6fb64030855_1603126220_5802.jpg
그림 1. SARS-CoV-2와 influenza A(H3N2) 게놈 변이 발생 속도 계산. 출처: 넥스트스트레인 

 

COVID-19의 원인이 되는 SARS-CoV-2 게놈을 분석해보면 얼마나 빈번하게 변이가 발생하는지를 알 수 있어 계산해보면 인플루엔자 A(H3N2) 바이러스 보다 SARS-CoV-2가 2배 정도 느리게 돌연변이가 발생하고 HIV 바이러스 보다는 4배 정도 느리게 발생하는 것을 볼 수 있다. 이 바이러스가 기존의 다른 RNA 바이러스에 비해 무작위 변이가 느리다고는 하지만 언제 새로운 항원성을 가진 변종이 발생할지 모르기 때문에 전 세계 보건관련 기구들이 촉각을 세우고n이들 게놈에 발생하는 변이로 인한 새로운 변종 가능성을 확인 중에 있다.

현재까지는 공식적인 변종에 대한 보고는 없지만 D614G라고 유명한 변이가 있다. S protein의 D614G에서 발견되는 변이 타입이 G614일 경우 G그룹으로 분류가 되는데 이들이 유럽에서 갑자기 퍼지면서 펜데믹 바이러스가 되었다. 이렇게 확산이 가속화된 이유가 이 G614 타입을 가진 spike protein의 경우 사람 호스트 세포 내 감염력이 높고 이를 통해 세포 내, 인체 내 viral load 가 증가되고 이 증가된 바이러스 때문에 감염 전파력도 높아지고 있다는 것이다.

지금과 같은 팬데믹으로 진행되게 한 원인 변이로 의심되고 있는 D614G 변이에 대한 임상적 결과가 처음으로 8월 20일에 셀 저널에 발표되었다 [3]. 쉐필드 COVID-19 게놈 그룹에서 연구를 진행했으며 G614 변이를 가진 SARS-CoV-2에 대한 감염력과 중증도에 대한 나름의 과학적 근거를 제시하고 있다. 일단 이 자료를 보면 G614 변이를 가진 바이러스가 D614 변이를 가진 바이러스보다 확실히 감염력은 높아 보인다. 그래서 미국에서 감염이 확산되기 시작하던 2월 말 초창기까지는 감염력이 높지 않은 D614가 퍼지다가 3월 초부터 G614가 더 우세 (dominant)하게 되었다고 주장 하고 있으며 이 G614 변이의 특징으로는 환자의 체내 바이러스량 (viral load)을 더 높인다는 이야기를 하고 있다. 그리고 D614G 변이에 대해서 전 세계에서 가장 큰 3만개 이상의 SARS-CoV-2 게놈 빅데이터를 확보하고 분석하고 있는 영국의 COVID-19 Genomics UK (COG-UK) 컨소시엄에서 중간 결과를 발표했는데, D614 변이보다 G614 변이가 10배가 아닌 1.22 배 (range 0.96-1.39) 정도 감염 전파가 잘된다고 한다 [4]. 한국에서도 4월부터 조금씩 유입되기 시작한 G614 바이러스는 5월에 발생한 이태원 클럽을 기점으로 비율이 늘어나고 있으며 지속적으로 해외에서 유입되는 패턴을 볼 수가 있다.

 

7a6a6d8ab9bed2359474b6fb64030855_1603126401_3435.jpg
그림 2. 한국에서 공개된 SARS-CoV-2 게놈 데이터 분석을 통한 바이러스 타입별 분포. 출처: 넥스트스트레인

그런데 흥미롭게도 그렇게 난리가 났던 중국 발 대구/경북지역에 유행했던 D614 타입의 바이러스는 5월 이후로는 전혀 유입되지 않고 지역 감염도 전혀 발생되지 않는 패턴을 보인다. 즉, 대구/경북 지역에서 대규모로 확산된 코로나 바이러스는 전국적으로 완전히 소멸된 듯 보인다. 반면에 다른 국가에서는 아직도 D614 타입의 바이러스도 지속적으로 확산이 되고 있는 패턴을 보인다. 6월 이후로는 한국 데이터가 공개가 안되고 있으나, 예상하기에 최근 서울/경기 지역에서 감염 확산으로 지금은 더 극명하게 G614 타입의 바이러스가 외국과 동일하게 한국에서도 우세하게 분포하게 되었을 듯 하다. 

디코드제네틱스 (deCODE genetics)의 CEO인 카리 스태판슨 (Kári Stefánsson) 그룹이 아이슬란드 인구집단을 대상으로 3가지 COVID-19 검사 전략으로 수행한 연구결과가 NEJM에 발표가 있었다 [5]. 이 연구에서 선별된 확진자 절반 정도인 약 650 명에서 유래된 SARS-CoV-2 전장 게놈 데이터 분석을 통해 COVID-19에 대한 감염의 원인, 감염경로 추적 및 감염노출의 특징 등을 분석했는데, 감염은 초기 유럽, 미국, 아시아에서 여행하고 돌아온 다양한 지역에서 입국한 사람들에 의해 발생했으며 그 사람들로 인해 아이슬란드 내 지역감염을 대규모로 일으켰는데 시간이 지날수록 가정에서, 직장에서, 알 수 없는 곳에서 감염된 감염자들이 더 늘어나는 패턴을 보이며 이를 추적해 봤더니 우리나라 31번 같은 타입의 여러 명에게 한번에 확산시키는 패턴부터 시리얼하게 10단계 이상 까지도 감염이 전달되는 패턴까지 다양한 분석이 이루어졌고 그 결과가 보고되고 있다.

아이들에 의한 COVID-19 감염 전파 가능성은 있지만 실제 관찰해 이를 과학적으로 증명해 보고한 자료가 전혀 없어 이상하다 생각했다. 사실 아이들은 감염되어도 대부분 무증상이어서 아이들이 아이들에게 또는 어른들에게 감염을 시킬 수 있는지 관찰하기가 매우 까다로웠다. 그래서 여러 나라에서 개학을 앞두고 아이들에 의한 감염전파 가능성에 대해 논란이 많았다. 그런데 이번에 아이슬란드 디코드제네틱스 (deCODE genetics)의 CEO인 카리 스태판슨 (Kári Stefánsson)이 처음으로 아이들 감염 전파 가능성에 대해 발표 했으며 이는 감염자 유래 SARS-CoV-2 전장 게놈 데이터를 분석해 가능했다. 이 게놈 분석을 통해 아이슬란드는 초기 지역 감염은 유럽, 미국, 아시아에서 여행하고 돌아온 다양한 지역에서 입국한 사람들에 의해 발생했으며 그러다 시간이 지날수록 가정 내에서 또는 미확인 감염자들이 늘어나기 시작했는데 이때 가정에서 어른이 아이를 통해 감염되는 케이스가 관찰되었다고 한다.

올해 초만 해도 이 바이러스에 대해서 우리가 아는 것이 많지가 않아 속수무책이었지만 이처럼 COVID-19의 원인이 되는 SARS-CoV-2 게놈을 대량으로 분석할 수 있게 됨으로 인해 바이러스 기원을 예측하고 변종발생 가능성 및 고해상도의 감염 트래킹이 가능하게 되어 좀 더 선제적이고 빠른 대응을 할 수 있는 상황으로 전환이 되어 가는 듯 보인다.

 

참고문헌

1. https://www.cell.com/cell/fulltext/S0092-8674(20)31012-6

2. https://www.thelancet.com/journals/lancet/article/PIIS0140-6736(20)30418-9/fulltext

3. https://doi.org/10.1016/j.cell.2020.06.043

4. https://www.cogconsortium.uk/news/commentary-cog-uk-report-9-25th-june-2020/

5. https://www.nejm.org/doi/full/10.1056/NEJMoa2006100