모티프 기반 protein-protein interaction 연구
Date 2018-10-06 16:38:21 페이스북으로 보내기 트위터로 보내기 hit 204
서문형
선임연구원
한국과학기술연구원
mhseo@kist.re.kr

1. 서론


다양한 생명현상을 깊이 이해하기 위해서는 단백질의 기능과 특성, 역할을 충분히 파악하는 것이 필요하고, 이를 위해 그 단백질이 어떤 단백질과 결합하는지를 파악하는 것은 매우 중요하다. 단백질-단백질 상호작용(protein-protein interaction, PPI)은 유전자발현, 신호전달 또는 효소활성 등 분자 단위의 이벤트를 통해 궁극적으로 세포 또는 개체 단위의 물질대사, 면역반응, 세포발달, 항상성 유지 등 복잡하게 얽힌 생물학적 현상을 정교하게 조절하는 핵심 요소이기 때문이다. 특히 대규모의 유전체 및 단백질체 분석을 통한 시스템 수준에서의 PPI network(interactome) 연구가 본격적으로 이루어지면서, 복잡한 세포의 조절 메커니즘과 작용 기전, 외부 감염원으로부터의 공격 경로, 암을 비롯한 질병의 발생에 이르기까지 지금까지 이해하지 못한 수많은 생명현상의 실마리가 PPI 규명 및 조절 연구로부터 나오고 있다[1–4]. 뿐만 아니라, 지금까지 전세계적으로 활용하고 있는 의약품 대부분의 표적(target proteins)이 4개의 특정 단백질 패밀리(GPCR, nuclear receptor, ion channels and enzymatic targets)에 집중되어 있는 점을 고려할 때[5–8], 인류의 건강한 삶에 기여할 신약개발 연구에서 새로운 질병 타겟으로서의 PPI는 중요한 의미를 갖는다[9–13]. 이러한 관점에서 구조적으로 대체로 넓고 편평한 결합 표면을 가지는 PPI를 대상으로(작은 분자량의 화합물을 활용한) 전통적인 방식의 신약개발 전략은(작고 명확한 포켓 형태의 결합 표면을 가지는) 기존의 주요 질병 타겟에 비해 적용하기가 쉽지 않았다. 하지만 보다 풍부하고 구체적인 interactome 정보들이 제공됨과 동시에 보다 효과적인 약물 설계 및 스크리닝 전략들이 고안됨에 따라, PPI 조절 기반 의약품 개발 또한 조금씩 가능성을 보여주고 있다[9,14,15]. 특히 다양한 형태의 PPI 중에서 아래에 소개할 모티프(motif) 기반 PPI는 생물학 연구뿐만 아니라 치료제 개발의 측면에서 유리한 특징을 많이 가지고 있다. 그럼에도 불구하고 효과적인 in silico 예측 또는 스크리닝 기술의 부재로 아직 많은 부분이 베일에 가려져 있다.

 

2. 모티프 기반 PPI


PPI는 결합에 관여하는 단백질의 구조와 결합에 관여하는 서열의 특징 등 여러 기준에 따라 몇 가지로 분류할 수 있지만[13,16], 결합 모듈의 구조적인 측면에서 단순하게 (1) 구형 단백질(도메인)간의 결합과 (2) 짧은 (펩타이드) 모티프에 의한 결합으로 나눠 볼 수 있다(그림 1). (*본 글에서는 모티프 기반 PPI에 관해서만 기술하고자 한다.)

eb3284b4fac4902b6661e89794aa43ec_1538810297_1604.png

그림 1. 도메인 또는 모티프에 의한 PPI 비교


약 10개 이하의 아미노산으로 구성된 짧은 펩타이드 모티프들은 세포 내에서 단백질의 이동(localization or trafficking), 결합(binding or docking), 변형(modification), 절단(cleavage) 등 다양한 반응의 매개체로 작용한다. 여러 가지 기능을 지닌 짧은 모티프들은 전체 proteome 상에서 비정형구조(disordered structure)를 가진 서열에서 주로 나타나며, 짧은 길이로 인해 결합 면적(binding surface)이 대체로 500 Å2 이하로 작다. 결과적으로 수 μM 수준의 낮은 결합력을 가지며, 단백질 간의 짧고 순간적인 결합에 주로 관여하고 있는 것으로 알려져 있다. (표 1)

 

 

 

 

 PPIs by globular domains

 PPIs by short linear motifs

 length

 50~200 amino acids

 3~10 amino acids

 structure

 folded

 disordered

 affinity

 ~ picomolar

 low micromolar

 dynamics

 stable

 transient

 binding surface

 ~1150 Å2

 ~500 Å2

 

표 1. 단백질 결합 모듈에 따른 일반적인 PPI 특징 비교[17,18]


모티프들은 지금까지 알려진 기능들을 바탕으로 크게 6가지로 분류할 수 있다[19]. (그림 2) (1) Compelx formation:모티프들은 하나의 혹은 여러 개의 반복적인 모티프를 통해 결합 도메인과 (생물학적으로 유의미한) 결합력을 완성함으로써 여러 단백질들의 결합을 유도하고 이를 통해 신호전달이나 단백질의 활성 조절 등을 관장한다. (2)Trafficking: 특정 모티프를 지닌 단백질들은 번역된 이후에 세포 내 특정 위치나 소기관(e.g. 세포질, 핵 등)으로 이동한다. 이때 모티프들은 해당 단백질의 목적지를 결정한다. (3) Anchoring: 단백질들은 최종적으로 세포막, 소기관, 미세소관 등 세포 내 특정 영역에 고정되어 기능을 하는데, 이 때 특정 서열의 모티프가 단백질의 위치를 결정한다. (4)Docking: 효소는 기질 단백질에 대한 특이성을 갖기 위하여, 특정 모티프에 결합한다. 이 때 핵심이 되는 모티프 서열과 주변의 서열/구조에 의해 효소 활성의 정교한 발현(선택적 활성)이 가능해진다. (5) Degron: 단백질의 기능은 발현된 단백질의 활성이 얼마만큼의 시간 동안 유지되는가에 의해서도 조절될 수 있는데, degron 모티프를 가진 단백질은 E3 유비퀴틴 라이게이즈에 의해 인식되어 유비퀴틴에 결합함으로써(ubiquitination) 분해된다. (6) Post-translational modification (PTM): 모티프는 여러 효소의 기질로 작용하여 인산화, 아세틸화, 당쇄화 등 번역 후 변형(PTM)에 의해 단백질의 활성 또는 PPI를 결정한다. 모티프의 변형은 세포 내외부의 환경 변화에 의해 조절되고 이것은 다시 신호전달, 유전자발현 등을 조절한다.

eb3284b4fac4902b6661e89794aa43ec_1538810794_682.png
그림 2. 기능에 따른 모티프 분류 

 

이와 같이 모티프 기반 PPI는 결국 다양한 기능 및 역할을 담당하는 단백질의 운명을 결정하기 때문에, 모티프의 서열이나 기능에 문제가 발생하면 여러 가지 질병의 발생으로 자연스레 이어진다[20–22]. 따라서 아직 알려지지 않은 모티프 기반 PPI를 충분히 발굴하고 검증하는 것은 생물학 연구와 질병의 치료를 위해서도 매우 중요하다.


3. 모티프 기반 PPI 발굴을 위한 HTS 기술


시스템 수준의 PPI를 빠르게 스크리닝하기 위하여 일반적으로 사용되는 방법은 yeast two-hybrid(Y2H)1 또는 affinity-purification mass spectrometry (AP-MS)2이다. 최근 두 연구를 통하여 각각 약 14000개 또는 23000개의 단백질 간의 일대일 결합 (binary interaction)과 복합체 형성(complex)이 보고되었고, 기존에 알려지지 않았던 다수의 PPI(AP-MS의 경우 확인된 PPI의 약 86%가 새로운 결과)가 보고 되었다. 그럼에도 불구하고, 낮은 결합도 및 비정형의 구조적 특징으로 인해 Y2H 또는 AP-MS 등에서 자주 놓치게 되는 것이 모티프 기반 PPI이다[23]. 잠재적으로 약 10만개 이상의 모티프들이 세포의 PPI에 관련되어 있을 것으로 예상되고 있지만[24], 최근까지 실험을 통해 확인되어 데이터베이스화에 등록된 모티프들은 불과 4000개를 넘지 않는다[25].
새로운 모티프들을 효과적이고 빠르게 찾아내기 위한 여러 가지 노력이 있었다. 우선 인간 단백체(proteome) 서열 및 확인된 모티프 패턴을 바탕으로 새로운 모티프의 기능과 역할을 예측하기 위한 계산적인 방법이 고안되었다. 방대한 단백질 서열의 규모와 단순하고 짧은 패턴의 모티프를 감안하면 무수히 많은 경우의 수가 발생할 수 있는데, 정교한 알고리즘을 바탕으로 한 in siico 예측법은 새로운 모티프를 발굴하는 데 있어 큰 도움이 되고 있다[16,26].
실험적으로 새로운 모티프 기반 PPI를 스크리닝하기 위해서는 크게 세 가지 방법이 많이 활용되었다. (그림 3)

eb3284b4fac4902b6661e89794aa43ec_1538810976_9202.png
그림 3. 모티프 기반 PPI 스크리닝 

 

(1) Phage display: 파지디스플레이는 타겟 단백질에 결합하는 새로운 단백질을 탐색하기 위해 널리 활용되는 기술이다. 널리 사용되고 있는 M13 박테리오파지의 경우, 상대적으로 결합력이 강한 항체 또는 골격 단백질의 라이브러리 스크리닝에서는 파지 파티클당 1~3개 정도의 숫자가 발현되는 p3 외피 단백질에 해당 라이브러리를 발현시켜 사용하는 반면, 결합력이 수 μM 수준으로 낮은 펩타이드(모티프) 라이브러리의 결합을 스크리닝하기 위해서는 p8 외피 단백질을 이용하게 된다. 하나의 파지 파티클 당 1000개 정도의 펩타이드가 바이러스 표면에 발현됨으로써 다중결합(avidity) 효과에 의해 낮은 결합력의 모티프-도메인 결합도 효과적으로 선별 가능하다.
(2) Y2H: 앞에서 소개한 바와 같이 proteome 수준의 PPI를 빠르게 검증하기 위해 널리 활용된 기술이다. 리포터 유전자의 발현에 기초한 기술로서, 결합력이 약하고 일시적인 모티프 기반 PPI를 스크리닝하는 데에도 유용하게 활용할 수 있다. 최근에는 Y2H의 내재적인 단점(높은 false-positive 결과, 특정 도메인과 fusion하여 발현함으로써 발생하는 구조적 문제 등)을 극복하기 위한 변형 기술도 개발되어 보다 폭 넓게 활용되고 있다[27].
(3) Peptide array: 원하는 서열의 펩타이드를 칩 표면에 고정하고 결합 도메인을 스크리닝하는 방식으로 다양한 모티프-도메인 결합을 찾거나 모티프 서열 패턴을 확인하는 데 널리 활용되어 왔다. 비천연 아미노산이나 형광물질 또는 바이오틴, 인산 등 스크리닝하고자 하는 펩타이드를 원하는 대로 변형 할 수 있다는 장점을 가지고 있어, 앞의 두 방법과 차별화 된다.
컴퓨터를 이용한 예측법이나 실험적인 방법 모두 각각의 뚜렷한 장단점을 가지고 있어, 목적에 맞는 최적의 조합으로 활용하는 것이 중요하다.

 

4. Peptide phage display를 이용한 PPI 연구 소개


필자는 proteome-scale peptide library를 구축하여 특정 도메인에 결합하는 펩타이드 서열을 규명하고 이를 통해 새로운 PPI를 밝히는 연구를 수행하였다. Random한 서열의 펩타이드를 활용하면 타겟 도메인에 결합하는 새로운 펩타이드 서열을 찾거나 특징적인 모티프 패턴을 탐색하는 데 유용하게 활용할 수 있는 반면, 실제 존재하는 단백질의 서열에 기반한 라이브러리는 생명체에 존재하는 모티프 기반 PPI를 높은 확률로 발굴할 수 있다는 장점을 가진다.
인간 단백체에 존재하는 모든 단백질 서열 중 비정형 구간(intrinsically disordered region)을 모두 모아 16개의 아미노산으로 이루어진 약 50만개의 펩타이드 라이브러리를 설계하였다. 그리고 모든 펩타이드를 뉴클레오타이드 서열로 전환한 다음, 각각의 서열에 해당하는 올리고를 병렬적으로 합성하였다. 올리고를 주형으로 하여 클로닝을 통해 phagemid에 펩타이드 라이브러리를 삽입함으로써, M13 박테리오파지의 외피 단백질에 발현되는 peptide-phage 라이브러리를 완성하였다(그림 4).

eb3284b4fac4902b6661e89794aa43ec_1538811123_5075.png 

그림 4. 펩타이드 라이브러리 구축


펩타이드 라이브러리는 모티프 결합 도메인을 가진 단백질들을 대상으로 빠르게 결합 모티프를 찾는 데 유용하게 활용 가능하다. 본 연구에서는 인간 단백질에 존재하는 도메인 중 다양한 구조와 결합 특이성을 가지는 모티프 결합 도메인(EVH1, GYF, PDZ, LDB, VHS 등)을 대상으로 인간 펩타이드 라이브러리 스크리닝을 진행하였다[23]. 3~4 라운드의 파지디스플레이 스크리닝을 통해 얻어진 펩타이드 서열들은 NGS 시퀀싱을 통해서 확인하고, 확보한 수십여 개의 펩타이드는 서열 정렬(sequence alignment) 및 분석을 통하여 공통적인 모티프의 패턴을 분석하였다(그림 5).

 

eb3284b4fac4902b6661e89794aa43ec_1538811228_9679.png

그림 5. 선별된 펩타이드 서열 및 모티프 패턴 분석[23]

또한 펩타이드 서열의 단백질을 역으로 추적하여, 타겟 도메인들과 펩타이드의 근원 단백질(source protein)의 결합을 유추할 수 있었다. 확인된 단백질들 중에는 기존에 타겟 도메인과의 결합이 알려진 것(known binder)들도 일부 있는 반면, 약 95%에 해당하는 대부분의 단백질들은 새롭게 발견한 PPI로 확인되었다. 선별된 펩타이드를 포함하는 단백질들은 유전자 온톨로지(Gene Ontology) 분석 결과 유사한 기능군에 포함된 단백질들이 높은 비율을 차지한다는 것(GO term enrichment)을 확인할 수 있었고, 동시에 타겟 도메인을 포함하는 단백질들과도 상당히 유사한 GO 패턴(shared localization or role)을 보여 주었다. 이는 결국, 선별된 모든 펩타이드의 실제 작용기전을 검증하기에 앞서, 펩타이드와 도메인의 물리적 결합만을 바탕으로 찾은 새로운 PPI라 하더라도 생물학적 기능 측면에서 높은 관련성(functional relevance)이 있을 것임을 시사한다.
이들 중 일부는 추가적인 생화학적 분석(Isothermal titration calorimetry, co-immunoprecipitation)을 진행하였고, 그 결과 세포 내에서(full length) 단백질 수준에서도 결합하는 단백질들임을 검증할 수 있었다. 본 연구를 통해 실제 proteome에 존재하는 서열로 이루어진 펩타이드 라이브러리를 특정 도메인에 대하여 스크리닝하면 모티프 기반의 새로운 PPI를 빠르게 찾을 수 있음을 확인하였고, 특히 기존의 Y2H 혹은 AP-MS 방법에서 쉽게 누락된 낮은 결합력의 모티프 기반 PPI 연구에 유용하게 활용 가능함을 보여주었다(그림 6).

eb3284b4fac4902b6661e89794aa43ec_1538811348_9614.png 

그림 6. 선별된 펩타이드를 통한 신규 PPI 네트워크[23]


5. 전망


모티프 기반 PPI 연구를 위한 펩타이드 라이브러리 활용 기술은 다양한 생물학적 반응과 조절메커니즘을 규명하는 것뿐만 아니라, 직접적으로 치료제 후보를 선별하기 위한 목적으로도 활용 가능하다. 다양한 질병 모델에 펩타이드 라이브러리를 적용한 활성기반 펩타이드 탐색을 통해, 새로운 치료제 후보물질을 빠르게 찾을 수 있으며 동시에 기존에 알려지지 않았던 새로운 질병 타겟(모티프 기반) PPI를 밝히는 데도 유용하게 활용 가능하다[28].
아직까지 해결하지 못한 다양한 생명현상을 이해하고 질병의 원인과 치료법을 연구하기 위해 새로운 PPI를 발굴하고 생명체에 작용하는 역할과 기능을 이해하는 것은 매우 중요하다. 특히 모티프 기반 PPI 연구는 상대적으로 느리게 그 중요성이 알려졌지만, 최근에는 암의 발생이나 병원성 바이러스 및 세균에 의한 감염 등에 이르기까지 다양한 질병과 밀접한 관계가 있다는 보고와 함께 점차 많은 연구자들이 주목하고 있다[21,22,29]. 저분자화합물의 결합포켓과 유사한 특징을 가지는 모티프 결합 표면은 저분자화합물, 펩타이드, 재조합단백질 등 다양한 소재를 활용한 신약개발을 가능케 하는(druggable) 새로운 질병 타겟으로서 많은 장점을 지니고 있어, 여러 연구 그룹과 제약 회사에서 활발히 연구되고 있다. 필자 또한 모티프 기반 PPI 연구에 많은 관심을 가지고 펩타이드 라이브러리를 활용한 연구를 수행 중이며, 다양한 질병 모델에 적용한 치료제 개발 연구 및 모티프의 기능을 도입한 신기능 단백질 개발 연구를 준비 중이다. 국내외 여러 연구자들과 활발한 협력 연구를 진행할 수 있기를 기대한다.

 

참고문헌
1. Rolland, T. et al. A proteome-scale map of the human interactome network. Cell 159, 1212–1226 (2014).
2. Huttlin, E. L. et al. The BioPlex Network: A Systematic Exploration of the Human Interactome. Cell 162, 425–440 (2015).
3. Sahni, N. et al. Widespread macromolecular interaction perturbations in human genetic disorders. Cell 161, 647–660 (2015).
4. Huttlin, E. L. et al. Architecture of the human interactome defines protein communities and disease networks. Nature 545, 505–509 (2017).

5. Hopkins, A. L. & Groom, C. R. The druggable genome. Nat. Rev. Drug Discov. 1, 727–730 (2002).
6. Finan, C. et al. The druggable genome and support for target identification and validation in drug development. Sci. Transl. Med. 9,1–16 (2017).
7. Rask-Andersen, M., Masuram, S. & Schiöth, H. B. The Druggable Genome: Evaluation of Drug Targets in Clinical Trials Suggests Major Shifts in Molecular Class and Indication. Annu. Rev. Pharmacol. Toxicol. 54, 9–26 (2014).
8. Griffith, M. et al. DGIdb: Mining the druggable genome. Nat. Methods 10, 1209–1210 (2013).
9. Milroy, L. G., Grossmann, T. N., Hennig, S., Brunsveld, L. & Ottmann, C. Modulators of protein-protein interactions. Chem. Rev.114, 4695–4748 (2014).
10. Fuller, J. C., Burgoyne, N. J. & Jackson, R. M. Predicting druggable binding sites at the protein-protein interface. Drug Discov.Today 14, 155–161 (2009).
11. Wells, J. A. & McClendon, C. L. Reaching for high-hanging fruit in drug discovery at protein-protein interfaces. Nature 450, 1001–1009 (2007).
12. Ran, X. & Gestwicki, J. E. Inhibitors of protein–protein interactions (PPIs): an analysis of scaffold choices and buried surface area.Curr. Opin. Chem. Biol. 44, 75–86 (2018).
13. Scott, D. E., Bayly, A. R., Abell, C. & Skidmore, J. Small molecules, big targets: drug discovery faces the protein–protein interaction challenge. Nat. Rev. Drug Discov. 15, 533–550 (2016).
14. Sheng, C., Dong, G., Miao, Z., Zhang, W. & Wang, W. State-of-the-art strategies for targeting protein– protein interactions by small-molecule inhibitors. Chem. Soc. Rev 44, (2015).
15. Laraia, L., McKenzie, G., Spring, D. R., Venkitaraman, A. R. & Huggins, D. J. Overcoming Chemical, Biological, and Computational Challenges in the Development of Inhibitors Targeting Protein-Protein Interactions. Chem. Biol. 22, 689–703 (2015).
16. Stein, A., Mosca, R. & Aloy, P. Three-dimensional modeling of protein interactions and complexes is going ‘omics. Curr. Opin.Struct. Biol. 21, 200–208 (2011).
17. London, N., Movshovitz-Attias, D. & Schueler-Furman, O. The Structural Basis of Peptide-Protein Binding Strategies. Structure 18, 188–199 (2010).
18. Van Roey, K. et al. Short linear motifs: Ubiquitous and functionally diverse protein interaction modules directing cell regulation. Chem. Rev. 114, 6733–6778 (2014).
19. Seo, M.-H. & Kim, P. M. The present and the future of motif-mediated protein–protein interactions. Curr. Opin. Struct. Biol. 50, 162–170 (2018).
20. Mészáros, B., Kumar, M., Gibson, T. J., Uyar, B. & Dosztányi, Z. Degrons in cancer. Sci. Signal. 10, eaak9982 (2017).
21. Hagai, T., Azia, A., Babu, M. M. & Andino, R. Use of host-like peptide motifs in viral proteins is a prevalent strategy in host-virus interactions. Cell Rep. 7, 1729–1739 (2014).
22. Uyar, B., Weatheritt, R. J., Dinkel, H., Davey, N. E. & Gibson, T. J. Proteome-wide analysis of human disease mutations in short linear motifs: neglected players in cancer? Mol. Biosyst. 10, 2626 (2014).
23. Davey, N. E. et al. Discovery of short linear motif-mediated interactions through phage display of intrinsically disordered regions of the human proteome. FEBS J. 284, 485–498 (2017).
24. Tompa, P., Davey, N. E., Gibson, T. J. & Babu, M. M. A Million peptide motifs for the molecular biologist. Mol. Cell 55, 161–169 (2014).
25. Gouw, M. et al. The eukaryotic linear motif resource – 2018 update. Nucleic Acids Res. 46, D428–D434 (2018).
26. Edwards, R. J. & Palopoli, N. Computational prediction of short linear motifs from protein sequences. in Computational Peptidology
89–141 (Humana Press, New York, NY, 2015). doi:10.1007/978-1-4939-2285-7_6
27. Snider, J. et al. Detecting interactions with membrane proteins using a membrane two-hybrid assay in yeast. Nat. Protoc. 5, 1281–1293 (2010).
28. Nim, S. et al. Pooled screening for antiproliferative inhibitors of protein-protein interactions. Nat. Chem. Biol. 12, 275–281 (2016).
29. Becerra, A., Bucheli, V. A. & Moreno, P. A. Prediction of virus-host protein-protein interactions mediated by short linear motifs. BMC Bioinformatics 18, 163 (2017).