단백질 도메인
Protein domain단백질 도메인은 단백질의 폴리펩타이드 사슬에서 자기 안정적이고 나머지 영역과 독립적으로 접히는 영역이다.각 도메인은 콤팩트하게 접힌 3차원 구조를 형성한다.많은 단백질은 여러 개의 도메인으로 구성되어 있다.하나의 도메인은 다양한 단백질에서 나타날 수 있다.분자 진화는 도메인을 빌딩 블록으로 사용하며 이들은 다른 기능을 가진 단백질을 만들기 위해 다른 배열로 재결합될 수 있다.일반적으로 도메인의 길이는 [1]약 50개의 아미노산부터 250개의 아미노산까지 다양합니다.아연 핑거와 같은 최단 도메인은 금속 이온 또는 디술피드 브릿지에 의해 안정화됩니다.도메인은 종종 칼모듈린의 칼슘 결합 EF 손 도메인과 같은 기능 단위를 형성합니다.그것들은 독립적으로 안정적이기 때문에, 도메인은 키메라 단백질을 만들기 위해 한 단백질과 다른 단백질 사이의 유전 공학에 의해 "스왑"될 수 있습니다.
배경
도메인의 개념은 1973년 암탉[2] 리소자임과 파파인[3] X선 결정학 연구와 면역글로불린의 [4][5]제한적 단백질 분해 연구를 통해 Wetlaufer에 의해 처음 제안되었다.Wetlaufer는 도메인을 자율적으로 접을 수 있는 단백질 구조의 안정적인 단위로 정의했다.지금까지 도메인은 다음과 같은 단위로 설명되었습니다.
각 정의는 유효하고 종종 중복될 것이다. 즉, 다양한 단백질 사이에서 발견되는 콤팩트한 구조 도메인은 구조 환경 내에서 독립적으로 접힐 가능성이 있다.자연은 [9]종종 다양한 가능성을 가진 다도메인 및 다기능 단백질을 형성하기 위해 여러 도메인을 하나로 묶는다.다도메인 단백질에서 각 도메인은 독립적으로 또는 인접 도메인과 일치된 방식으로 자신의 기능을 수행할 수 있다.도메인은 바이러스 입자 또는 근육 섬유와 같은 큰 조립체를 구축하기 위한 모듈 역할을 하거나 효소 또는 조절 단백질에서 발견되는 특정 촉매 또는 결합 부위를 제공할 수 있습니다.
예: 피루브산인산화효소
적절한 예는 과당-1,6-이인산으로부터 피루브산으로의 플럭스를 조절하는 데 중요한 역할을 하는 해당과정 효소인 피루브산 키나제(첫 번째 그림 참조)이다.α/β-기질 [11]결합 도메인(파란색), α/β-기질 결합 도메인(회색) 및 α/β-조절 도메인(올리브 녹색)[10]을 포함하고 있으며, 여러 폴리펩타이드 링커에 의해 연결되어 있다.이 단백질의 각 도메인은 다양한 단백질 [12]패밀리에서 발생합니다.
중심 α/β-배럴 기질 결합 도메인은 가장 일반적인 효소 접힘 중 하나이다.그것은 전혀 관련이 없는 반응을 [13]촉매하는 많은 다른 효소 계열에서 볼 수 있다.α/β-배럴은 일반적으로 트리오스 인산 이성질화효소의 이름을 딴 TIM 배럴로 불리며,[14] 이러한 구조는 최초로 해결되었다.현재 CATH 도메인 데이터베이스에서 [15]26개의 상동 패밀리로 분류됩니다.TIM 배럴은 첫 번째와 마지막 가닥의 수소 결합에 의해 닫힌 일련의 β-α-β 모티브로 형성되며, 8개의 가닥 배럴을 형성합니다.이 도메인의 진화적 기원에 대한 논쟁이 있다.한 연구는 하나의 조상 효소가 여러 [16]과로 분리될 수 있다는 것을 암시하는 반면, 다른 연구는 안정된 TIM-배럴 구조가 수렴 [17]진화를 통해 진화했다는 것을 암시한다.
피루브산 키나아제에서 TIM-배럴은 '불연속'이며, 이는 도메인을 형성하기 위해 폴리펩타이드의 둘 이상의 세그먼트가 필요하다는 것을 의미한다.이것은 단백질의 진화 과정에서 한 도메인을 다른 도메인으로 삽입한 결과일 가능성이 높다.알려진 구조로부터 구조 영역의 약 1/4이 [18][19]불연속적이라는 것이 입증되었다.삽입된 β-배럴 조절 영역은 '연속'이며, 단일 폴리펩타이드 스트레치로 구성됩니다.
단백질 구조 단위
단백질의 1차 구조(아미노산 줄)는 궁극적으로 독특하게 접힌 3차원([20]3D) 구조를 암호화한다.단백질이 3D 구조로 접히는 가장 중요한 요소는 극성 및 비극성 [21]측쇄의 분포입니다.접힘은 소수성 측쇄를 분자 내부로 매설함으로써 구동되어 수성 환경과의 접촉을 회피한다.일반적으로 단백질은 친수성 잔류물의 껍질에 둘러싸인 소수성 잔류물의 핵심을 가지고 있다.펩타이드 결합 자체는 극성이기 때문에 소수성 환경에서는 서로 수소 결합에 의해 중화된다.이것은 2차 구조라고 불리는 규칙적인 3D 구조 패턴을 형성하는 폴리펩타이드 영역을 발생시킨다.이차 구조에는 α-헬리체와 β-시트의 두 가지 주요 유형이 있습니다.
2차 구조 요소의 일부 단순한 조합은 단백질 구조에서 자주 발생하는 것으로 밝혀졌으며 초2차 구조 또는 모티브로 언급된다.예를 들어 β헤어핀 모티브는 작은 루프로 결합된 2개의 인접한 역평행β스트랜드로 구성된다.대부분의 역평행β 구조에는 고립 리본과 보다 복잡한 β 시트의 일부로 존재한다.또 다른 일반적인 초2차 구조는 β-α-β 모티브로, 두 개의 평행 β-스트랜드를 연결하는 데 자주 사용된다.중심α-나선은 첫 번째 가닥의 C-termini와 두 번째 가닥의 N-termini를 연결하여 β-시트에 대한 측쇄를 채우고, 따라서 β 가닥의 소수성 잔류물을 표면으로부터 보호한다.
두 도메인의 공유 결합은 비공유 [22]결합 구조와 비교할 때 안정성이 증가하므로 기능적, 구조적 이점을 나타낸다.다른 장점은 수성 환경에서 불안정할 수 있는 도메인 간 효소 간 균열 내의 중간체 보호와 순차적 [23]반응에 필요한 효소 활성의 고정 화학량비이다.
구조 정렬은 도메인을 결정하는 데 중요한 도구입니다.
3차 구조
여러 모티브가 모여 [6]도메인이라고 불리는 작고 국소적이며 반독립적인 단위를 형성합니다.폴리펩타이드 사슬의 전체 3D 구조를 단백질의 3차 구조라고 한다.도메인은 3차 구조의 기본 단위이며, 각 도메인은 루프 영역에 의해 연결된 2차 구조 단위로 구성된 개별 소수성 코어를 포함한다.폴리펩타이드의 패킹은 일반적으로 도메인의 외부보다 내부가 훨씬 더 촘촘하게 되어 고체 상태의 코어 및 유체 상태의 [24]표면을 생성합니다.코어 잔류물은 종종 단백질 계열에서 보존되는 반면, 루프의 잔류물은 단백질의 기능에 관여하지 않는 한 덜 보존된다.단백질 3차 구조는 도메인의 [25]2차 구조 함량에 따라 크게 4가지로 나눌 수 있다.
- all-α 도메인은 α-헬리스크에서만 구축된 도메인 코어를 가지고 있습니다.이 클래스는 작은 주름이 주를 이루며, 많은 주름이 나선형으로 위아래로 이어지는 단순한 다발을 형성합니다.
- all-β 도메인은 반평행 β-시트로 구성된 코어를 가지고 있으며, 보통 서로에 대해 두 개의 시트가 채워져 있다.스트랜드 배열에서 다양한 패턴을 식별할 수 있으며, 그리스 키 [26]모티브와 같은 반복 모티브의 식별이 종종 발생한다.
- α+β 도메인은 all-α와 all-β 모티브의 혼합물이다.단백질을 이 등급으로 분류하는 것은 다른 세 등급과 겹치기 때문에 어렵기 때문에 CATH 도메인 [15]데이터베이스에서 사용되지 않는다.
- α/β 도메인은 β-α-β 모티브의 조합으로 이루어지며, β-β 모티브는 주로 양친매성 α-아카데미로 둘러싸인 평행 β-시트를 형성한다.2차 구조는 층 또는 배럴로 배열됩니다.
크기 제한
도메인 [27]크기에는 제한이 있습니다.개별 구조 도메인의 크기는 E-셀렉틴의 36잔기부터 리폭시게나아제-1의 [18]692잔기까지 다양하지만, 대부분 90%는 200잔기[28] 미만으로 평균 [29]약 100잔기이다.40개 미만의 매우 짧은 도메인은 종종 금속 이온 또는 디술피드 결합에 의해 안정화된다.300개 이상의 잔류물이 있는 더 큰 도메인은 여러 소수성 [30]코어로 구성될 수 있다.
4차 구조
많은 단백질은 올리고머 분자와 결합하는 여러 개의 폴리펩타이드 사슬로 구성된 4차 구조를 가지고 있다.이러한 단백질의 각 폴리펩타이드 사슬은 서브유닛이라고 불린다.예를 들어 헤모글로빈은 2개의 α와 2개의 β 서브유닛으로 구성됩니다.4개의 체인 각각은 헴 포켓이 있는 전체 알파 글로빈 접힘을 가지고 있습니다.
도메인 스왑
도메인 스왑은 올리고머 어셈블리를 [31]형성하기 위한 메커니즘입니다.도메인 스와핑에서 단량체 단백질의 2차 또는 3차 원소를 다른 단백질의 동일 원소로 치환한다.도메인 스왑은 보조 구조 요소에서 전체 구조 도메인에 이르기까지 다양합니다.또한 소단위 [32]계면에 활성 부위를 갖는 올리고머 효소 등 올리고머화에 의한 기능적 적응을 위한 진화 모델을 나타낸다.
진화 모듈로서의 도메인
자연은 [33]발명가가 아닌 주석 제작자이며, 새로운 시퀀스는 발명된 것이 아니라 기존의 시퀀스에서 수정됩니다.도메인은 자연이 새로운 서열을 생성하기 위해 사용하는 일반적인 물질이다. 도메인은 '모듈'이라고 불리는 유전적으로 이동 가능한 단위로 생각할 수 있다.종종 도메인의 C와 N 끝자리는 공간적으로 서로 가깝기 때문에 진화 과정에서 쉽게 부모 구조로 "슬롯"될 수 있다.많은 도메인 과는 세 가지 형태의 생명체, 즉 고세균,[34] 박테리아 그리고 진핵생물에서 모두 발견됩니다.단백질 모듈은 특히 다용도 구조를 가진 다양한 단백질 범위에서 발견되는 단백질 도메인의 하위 집합이다.응고, 섬유소 분해, 보체, 세포외 매트릭스, 세포표면 접착 분자 및 사이토카인 수용체와 [35]관련된 세포외 단백질 중에서 예를 찾을 수 있다.광범위한 단백질 모듈의 4가지 구체적인 예는 SH2, 면역글로불린, 피브로넥틴 타입 3 및 크링글이다.[36]
분자 진화는 유사한 염기서열과 구조를 가진 관련 단백질 패밀리를 발생시킨다.그러나 동일한 구조를 공유하는 단백질 간 배열 유사성은 매우 낮을 수 있다.단백질 구조는 단백질이 공통의 조상으로부터 분리되었기 때문에 비슷할 수 있다.또는, 일부 접힘은 2차 구조의 안정적인 배치를 나타내며, 일부 단백질은 진화 과정에서 이러한 접힘을 향해 수렴될 수 있기 때문에 다른 접힘보다 더 선호될 수 있다.현재 단백질 데이터 뱅크(PDB)[37]에는 약 11만 개의 실험적으로 결정된 단백질 3D 구조가 축적되어 있습니다.그러나 이 세트에는 동일하거나 매우 유사한 구조가 많이 포함되어 있습니다.모든 단백질은 그들의 진화적 관계를 이해하기 위해 구조적인 패밀리로 분류되어야 한다.구조 비교는 도메인 수준에서 수행하는 것이 가장 좋습니다.이러한 이유로 알려진 3D 구조를 가진 단백질에서 도메인을 자동으로 할당하기 위해 많은 알고리즘이 개발되었습니다. '구조 좌표에서 도메인 정의'를 참조하십시오.
CATH 도메인 데이터베이스는 도메인을 약 800개의 폴드 패밀리로 분류합니다. 이러한 폴드 중 10개는 매우 높은 인구로 '슈퍼폴드'라고 합니다.슈퍼폴드는 유의한 시퀀스 [38]유사성이 없는 최소 3개의 구조가 있는 접힘으로 정의된다.앞에서 설명한 바와 같이 가장 많이 채워진 것은 α/β-배럴 초배율이다.
다도메인
단세포 유기체의 3분의 2와 메타조아의 80% 이상의 단백질은 다도메인 [39]단백질이다.그러나, 다른 연구들은 진핵생물들이 약 65%의 다중 도메인 [40]단백질을 가지고 있는 반면, 원핵생물 단백질의 40%는 다중 도메인으로 구성된다고 결론지었다.
진핵생물 다도메인 단백질의 많은 도메인은 원핵생물에서 [41]독립 단백질로 발견될 수 있으며, 이는 다도메인 단백질의 도메인이 한때 독립 단백질로 존재했음을 암시한다.예를 들어 척추동물은 GAR합성효소, AIR합성효소 및 GAR변환효소 도메인(GARs-AIRs-GART, GAR: 글리신아미드리보뉴클레오티드합성효소/전달효소, AIR: 아미노이미다졸리보뉴클레오티드합성효소)을 포함한 다효소 폴리펩타이드를 가진다.곤충에서는 폴리펩타이드가 GARs-(AIRs)2-GART로 나타나며 효모 GARs-AIRs는 GARt와 별도로 부호화되며 세균에서는 [42]각 도메인이 별도로 부호화된다.
기원.
다도메인 단백질은 새로운 기능을 만들기 위해 진화 과정에서 선택적인 압력에서 나왔을 가능성이 있다.다양한 단백질은 도메인의 다른 조합과 연관성에 의해 공통의 조상으로부터 분리되었다.모듈러 유닛은 유전자 교환 메커니즘을 통해 생물학적 시스템 내에서 또는 시스템 간에 자주 이동한다.
조직의 종류

단백질에서 볼 수 있는 가장 단순한 다중 도메인 구성은 동시에 [46]반복되는 단일 도메인의 조직이다.도메인은 서로 상호 작용(도메인-도메인 상호 작용)하거나 문자열의 비즈처럼 분리된 상태로 유지될 수 있습니다.거대 30,000개의 잔류 근육 단백질 티틴은 약 120개의 피브로넥틴-II-타입 도메인과 Ig-타입 도메인을 포함한다.[47]세린단백질가수분해효소에서는 유전자 복제 이벤트가 2개의 β배럴 도메인 [48]효소의 형성을 가져왔다.반복이 너무 광범위하게 분산되어 있어서 그들 사이에 명확한 순서 유사성은 없다.활성 부위는 기능적으로 중요한 잔류물이 각 도메인에서 기여하는 두 β-배럴 도메인 사이의 틈새에 위치한다.키모트립신세린단백질가수분해효소의 유전자 조작 돌연변이는 활성부위 잔기가 제거되었음에도 불구하고 단백질 분해효소 활성을 갖는 것으로 나타났으며, 따라서 복제 이벤트가 효소의 [48]활성을 증가시켰다고 가정되었다.
모듈은 키네신 및 ABC 트랜스포터에서 알 수 있듯이 서로 다른 연결 관계를 표시하는 경우가 많습니다.키네신 모터 도메인은 코일 코일 영역 및 화물 [49]도메인을 포함하는 폴리펩타이드 사슬의 양 끝에 있을 수 있습니다.ABC 트랜스포터는 ATP 결합 카세트와 일체형 멤브레인 모듈이라는 두 개의 관련되지 않은 모듈로 구성된 최대 4개의 도메인으로 구성되어 있으며 다양한 조합으로 배열되어 있습니다.
도메인이 재결합할 뿐만 아니라 도메인이 다른 도메인에 삽입된 사례도 많이 있습니다.다른 도메인과의 시퀀스 또는 구조적 유사성은 삽입된 도메인과 상위 도메인의 상동성이 독립적으로 존재할 수 있음을 보여줍니다.예를 들어 Pol I 패밀리의 [50]중합효소 내의 '팜' 도메인에 삽입된 '핑거'가 있습니다.도메인을 다른 도메인에 삽입할 수 있으므로 다중 도메인 단백질에는 항상 적어도 하나의 연속 도메인이 있어야 합니다.이것은 구조적 영역과 진화적/기능적 영역의 정의 사이의 주요 차이이다.진화 도메인은 도메인 간에 하나 또는 두 개의 연결로 제한되지만 구조 도메인은 공통 코어의 존재에 대한 주어진 기준 내에서 무제한 연결을 가질 수 있습니다.여러 구조 도메인이 진화 도메인에 할당될 수 있다.
슈퍼 도메인은 명목상 독립적 기원이지만 이후 단일 구조/기능 [51]단위로 상속되는 두 개 이상의 보존 도메인으로 구성됩니다.이 결합된 슈퍼 도메인은 유전자 복제만으로는 관련이 없는 다양한 단백질에서 발생할 수 있습니다.슈퍼 도메인의 예로는 PTEN, 텐신, 옥실린 및 막단백질 TPTE2의 단백질 티로신 포스파타아제-C2 도메인 쌍이 있다.이 슈퍼 도메인은 동물, 식물, 곰팡이의 단백질에서 발견됩니다.PTP-C2 슈퍼도메인의 주요 특징은 도메인 인터페이스에서의 아미노산 잔기 보존이다.
도메인은 자율 폴딩 단위입니다.
접이식
단백질 접힘 - 해결되지 않은 문제: 1960년대 [20]초 Anfinsen의 주요 연구 이후, 폴리펩타이드가 안정적인 자연배치로 빠르게 접히는 메커니즘을 완전히 이해하려는 목표는 여전히 모호합니다.많은 실험적인 접기 연구가 우리의 이해에 많은 기여를 했지만, 단백질 접기를 지배하는 원리는 여전히 접기의 첫 번째 연구에서 발견된 원리에 기초하고 있다.Anfinsen은 단백질의 고유 상태가 열역학적으로 안정적이며, 배치는 자유 에너지의 전지구적 최소값임을 보여주었다.
접힘은 단백질이 생물학적으로 실현 가능한 시간 척도로 접힐 수 있도록 하는 구조 공간의 직접적인 탐색이다.레빈탈의 역설은 만약 평균 크기의 단백질이 가장 낮은 에너지를 가진 단백질을 찾기 전에 가능한 모든 형태를 표본으로 추출한다면, 전체 과정은 수십억 년이 [52]걸릴 것이라고 말한다.단백질은 보통 0.1초에서 1000초 안에 접힙니다.따라서 단백질 접힘 과정은 특정 접힘 경로를 통해 어떤 방식으로든 유도되어야 한다.이 조사를 지휘하는 힘은 다양한 [53]반응 단계에서 영향을 받는 국지적 영향과 세계적 영향의 조합일 가능성이 높다.
실험 및 이론적 연구의 진보에 따르면 접힘은 에너지 [54][55]환경의 관점에서 볼 수 있으며, 접힘 역학은 단백질이 접힌 구조로 이동하는 과정에서 부분적으로 접힌 구조의 집합체의 점진적인 조직으로 간주된다.이는 접이식 깔때기의 관점에서 설명되었으며, 접힌 단백질은 사용 가능한 많은 구성 상태를 가지며 접힌 단백질은 사용 가능한 상태가 적다.깔때기는 단백질 접힘의 경우 3차 구조 형성이 증가함에 따라 에너지 감소와 엔트로피 손실이 있음을 암시한다.깔때기의 국소 거칠기는 잘못 접힌 중간체의 축적에 해당하는 운동 트랩을 반영한다.접이식 체인은 그 콤팩트함을 높여 체인 내 자유 에너지를 낮추기 위해 진행됩니다.체인의 구조화 선택권은 궁극적으로 하나의 네이티브 구조를 향해 점점 좁아지고 있습니다.
단백질 폴딩 도메인 장점
구조 도메인에 의한 큰 단백질의 구성은 각 도메인이 개별적으로 접을 수 있고 접힘 과정을 가속화하고 잠재적으로 큰 잔류물 상호작용 조합을 감소시키는 단백질 접힘의 이점을 나타낸다.또한 단백질 [56]중 소수성 잔류물의 관찰된 무작위 분포를 고려할 때 도메인 형성은 친수성 잔류물을 [57][58]표면에 유지하면서 소수성 잔류물을 묻기 위한 큰 단백질의 최적의 솔루션인 것으로 보인다.
그러나 단백질 접힘 및 자연구조 안정화의 에너지학에서 도메인 간 상호작용의 역할은 단백질마다 다를 수 있다.T4 리소자임에서, 한 도메인이 다른 도메인에 미치는 영향은 너무 강해서 전체 분자가 단백질 분해 분열에 내성이 있다.이 경우, 접힘은 C-말단 도메인이 초기 단계에서 독립적으로 접혀야 하는 순차적 과정이며, 다른 도메인은 접힘 및 [59]안정화를 위해 접힌 C-말단 도메인의 존재를 필요로 한다.
고립된 도메인의 접힘은 통합 [60]도메인의 접힘과 동일한 속도로 또는 때로는 더 빠르게 일어날 수 있다는 것이 밝혀졌으며, 이는 접힘 중에 나머지 단백질과의 불리한 상호작용이 발생할 수 있음을 시사한다.몇몇 주장들은 큰 단백질의 접힘에서 가장 느린 단계가 접힌 도메인의 [30]쌍이라는 것을 암시한다.이는 도메인이 완전히 올바르게 접히지 않았거나 도메인 인터페이스에서 물 제거와 같이 상호 작용에 필요한 작은 조정이 에너지적으로 [61]바람직하지 않기 때문이다.
도메인 및 단백질 유연성
단백질 도메인 역학은 다수의 분자 인식 및 신호 전달 과정에서 중요한 역할을 합니다.본질적으로 무질서한 유연한 링커 도메인으로 연결된 단백질 도메인은 단백질 도메인 역학을 통해 장거리 알로스테리를 유도한다.결과 동적 모드는 일반적으로 전체 단백질 또는 개별 도메인의 정적 구조에서 예측할 수 없다.그러나 단백질의 다른 구조를 비교함으로써 추론할 수 있다(분자 운동 데이터베이스와 같다).또한 광범위한 분자 역학[62] 궤적 및 주성분 [63]분석에서 표본을 추출하여 제안하거나 중성자 스핀 에코 분광법에 의해 측정된 스펙트럼을 사용하여[64][65] 직접 관찰할 수 있다.
구조 좌표에서 영역 정의
구조적 구성 요소 및 진화의 요소로서의 도메인의 중요성은 알려진 구조의 단백질에서 도메인 식별과 분류를 위한 많은 자동화된 방법을 가져왔다.신뢰할 수 있는 도메인 할당을 위한 자동 절차는 도메인 데이터베이스의 생성에 필수적이며, 특히 알려진 단백질 구조의 수가 증가하고 있습니다.도메인의 경계는 육안으로 확인할 수 있지만 자동화된 방법의 구축은 간단하지 않다.불연속적이거나 관련성이 [66]높은 도메인이 있는 경우 문제가 발생합니다.도메인이 실제로 무엇인지에 대한 표준 정의가 없다는 사실은 각 연구자들이 고유한 기준을 [67]사용하면서 도메인 할당이 엄청나게 다양해졌다는 것을 의미합니다.
구조 도메인은 단백질의 [68]나머지 부분보다 더 많은 상호작용을 하는 작고 구상적인 하위 구조이다.따라서 구조적 영역은 두 가지 시각적 특성, 즉 콤팩트성과 격리 [69]정도에 의해 결정될 수 있다.단백질의 국소적 콤팩트성 측정은[70][71][72][73] 도메인 할당의 많은 초기 방법 및 최근의 몇 가지 [28][74][75][76][77]방법에서 사용되어 왔다.
방법들
첫 번째 알고리즘[70] 중 하나는 단백질을 여러 개의 작은 세그먼트, 길이 10개의 잔류물로 간주하는 계층적 클러스터링 루틴과 함께 Cα-Cα 거리 맵을 사용했다.초기 세그먼트는 세그먼트 간 거리를 기반으로 차례로 클러스터화되었고, 가장 짧은 거리를 가진 세그먼트는 클러스터화되었고 그 후 단일 세그먼트로 간주되었습니다.단계적 군집화는 마침내 완전한 단백질을 포함시켰다.Go는[73] 또한 일반적으로 도메인 간 거리가 도메인 내 거리보다 크다는 사실을 이용했다. 가능한 모든 Cα-Cα 거리는 나선형, 확장된 가닥 및 2차 구조의 조합에 대한 뚜렷한 패턴이 있는 대각선으로 표현되었다.
Sowdhamini와 Blundell의 방법은 Cα-Cα 거리에 기초하여 단백질의 2차 구조를 클러스터하고 덴드로그램의 [66]패턴에서 도메인을 식별한다.단백질은 아미노산의 연속사슬로서 고려되지 않기 때문에 불연속 도메인 처리에 문제가 없다.이러한 덴드로그램의 특정 노드는 단백질의 3차 구조 클러스터로 식별되며, 이들은 초2차 구조와 도메인을 모두 포함한다.DOMAK 알고리즘은 3Dee 도메인 [75]데이터베이스를 작성하는 데 사용됩니다.단백질을 임의로 두 부분으로 나눌 때 각 접촉 유형별로 '분할값'을 계산한다.구조의 두 부분이 서로 다른 경우 이 분할 값이 큽니다.
Wodak과 Janin의[78] 방법은 다양한 잔류 위치에서 반복적으로 절단된 두 체인 세그먼트 사이의 계산된 인터페이스 영역을 기반으로 했습니다.절단된 세그먼트의 표면적을 네이티브 구조의 표면적과 비교하여 계면적을 계산했다.잠재적인 도메인 경계는 인터페이스 영역이 최소였던 사이트에서 식별할 수 있습니다.다른 방법에서는 [28][79][80]콤팩트함을 계산하기 위해 용매 접근성 측정을 사용했습니다.
PUU 알고리즘은[19] 도메인 간 역학을 근사하기 위해 사용되는 고조파 모델을 통합합니다.기본적인 물리적 개념은 각 도메인 내에서 많은 경직된 상호작용이 발생하고 도메인 간에 느슨한 상호작용이 발생한다는 것입니다.이 알고리즘은 FSSP 도메인 데이터베이스 [74]내의 도메인을 정의하기 위해 사용됩니다.
Swindells(1995)는 도메인이 소수성 내부를 가지고 있다는 생각에 기초하여 단백질 구조에서 도메인을 식별하는 방법인 DECTION을 개발했다.결손은 다른 영역의 소수성 코어가 인터페이스 영역을 통해 지속될 때 발생하는 것으로 밝혀졌다.
RigidFinder는 두 가지 다른 구성에서 단백질 강체 블록(도메인 및 루프)을 식별하는 새로운 방법입니다.강체 블록은 전체 구성에 걸쳐 모든 잔여물 간 거리가 보존되는 블록으로 정의됩니다.
판두랑간과 Topf에 의해 개발된 RIBFIND 방법은 [81]단백질의 2차 구조 요소의 공간적 클러스터링을 수행함으로써 단백질 구조의 강체를 식별한다.RIBFIND 강체는 단백질 구조를 저온 전자 현미경 밀도 [82]맵에 유연하게 맞추기 위해 사용되었습니다.
동적 도메인을 식별하기 위한 일반적인 방법,[62] 즉 구조적 변동 과정에서 대략적으로 단단한 단위로 작용하는 단백질 영역이 Potestio 등에 의해 도입되었으며, 다른 응용 프로그램들 중에서 동적 기반 영역 세분화의 일관성을 표준 구조 기반 영역과 비교하기 위해 사용되었다.PiSQRD라고 하는 이 방법은 웹 [83]서버 형태로 공개적으로 사용할 수 있습니다.후자는 사용자가 단일 사슬 또는 다중 단백질을 시스템의 집단 변동 모드에 기초하여 준강체 도메인으로[62][83] 최적으로 세분할 수 있게 한다.디폴트로는 후자는 탄력적인 네트워크 [84]모델을 통해 계산됩니다.또는 사용자가 미리 계산된 필수 동적 공간을 업로드 할 수도 있습니다.
도메인 예시
- 아르마딜로 반복: 초파리 드로소필라 멜라노가스터의 β-카테닌과 비슷한 아르마딜로 단백질에서 이름을 따왔다.
- 기본 류신 지퍼 도메인(bZIP 도메인): 많은 DNA 결합 진핵생물 단백질에서 발견됩니다.도메인의 한 부분은 배열 특이적 DNA 결합 특성을 매개하는 영역과 두 개의 DNA 결합 영역의 이량화에 필요한 류신 지퍼를 포함한다.DNA 결합 영역은 아르기닌 및 리신과 같은 많은 염기성 아미노산으로 구성됩니다.
- Cadherin 반복:카드헤린은 Ca 의존성2+ 세포-세포 접착 단백질로 기능한다.카드헤린 도메인은 인접한 세포의 표면에 있는 카드헤린 사이의 세포 간 호모성 결합을 매개하는 세포 외 영역이다.
- 데스 이펙터 도메인(DED): 호모타입 상호작용(DED-DED)에 의한 단백질-단백질 결합을 가능하게 한다.카스파아제 단백질 분해효소는 단백질 분해 캐스케이드를 통해 아포토시스를 유발한다.pro-caspase-8 및 pro-caspase-9는 DED 도메인을 통해 특정 어댑터 분자에 결합하며, 이는 카스파아제의 자동 활성화로 이어집니다.
- EF핸드: 시그널링 단백질 칼모듈린의 각 구조영역 및 근육단백질 트로포닌-C에서 발견되는 나선-턴-나선 구조 모티브.
- 면역글로불린 유사 도메인: 면역글로불린 슈퍼패밀리(IgSF)[85]의 단백질에서 발견됩니다.그것들은 약 70-110개의 아미노산을 포함하고 있으며 크기와 기능에 따라 다른 범주(IgV, IgC1, IgC2, IgI)로 분류된다.그들은 보존된 시스테인과 다른 하전 아미노산 사이의 상호작용에 의해 안정화된 두 개의 베타 시트가 "샌드위치"를 형성하는 특징적인 접힘을 가지고 있다.그것들은 세포 접착, 세포 활성화 및 분자 인식 과정에서 단백질-단백질 상호작용에 중요하다.이러한 도메인은 면역계에서 역할을 하는 분자에서 흔히 발견됩니다.
- 포스포티로신 결합 도메인(PTB): PTB 도메인은 일반적으로 인산화 티로신 잔기에 결합한다.그것들은 종종 신호 전달 단백질에서 발견됩니다.PTB 도메인 결합특성은 포스포티로신의 아미노 말단 측에 대한 잔류물에 의해 결정된다.예: SHC 와 IRS-1 의 양쪽 모두의 PTB 도메인이 NPXpY 시퀀스에 바인드 됩니다.SHC, IRS-1과 같은 PTB 함유 단백질은 인간 세포의 인슐린 반응에 중요하다.
- 플렉스트린 호몰로지 도메인(PH): PH 도메인은 높은 친화력으로 포스포이노시티드를 결합한다.PtdIns(3)P, PtdIns(4)P, PtdIns(3,4)P2, PtdIns(4,5)P2, PtdIns(3,4,5)P3의 특이성이 모두 관찰되었다.포스포이노시티드가 다양한 세포막에 격리되어 있다는 사실(긴 친유성 꼬리 때문에)을 고려할 때, PH 도메인은 일반적으로 단백질이 세포 신호 전달, 세포 골격 재구성 또는 막 밀매에서 특정 기능을 발휘할 수 있는 막으로 문제의 단백질을 모집하게 한다.
- Src 호몰로지 2 도메인(SH2) : SH2 도메인은 신호 전달 단백질에서 종종 발견된다.SH2 도메인은 인산화 티로신(pTyr)에 결합을 부여한다.Src 바이러스 종양 유전자의 포스포티로신 결합 도메인의 이름을 따서 명명되었으며, 그 자체가 티로신 키나아제입니다.「SH3 도메인」도 참조해 주세요.
- 아연 핑거 DNA 결합 도메인(ZnF_GATA): ZnF_GATA 도메인을 포함하는 단백질은 일반적으로 DNA 염기서열에 결합하는 전사 인자이다 [AT]프로모터의 GATA[AG]
알 수 없는 기능의 도메인
도메인의 대부분은 기능을 알 수 없습니다.DUF(Domain of Unknown Function)는 특성화된 기능이 없는 단백질 도메인입니다.이들 패밀리는 프리픽스 DUF에 이은 번호를 사용하여 Pfam 데이터베이스에 수집되었습니다.예를 들어 DUF2992 및 DUF1220입니다.현재 Pfam 데이터베이스에는 알려진 [86]가족의 20% 이상을 나타내는 3,000개 이상의 DUF 가족이 있습니다.놀랍게도, Pfam의 DUF 수는 주로 새로운 게놈 배열의 수가 증가했기 때문에, 20%(2010년)에서 22%(2019년)로 증가했다.Pfam 릴리즈 32.0(2019)에는 3,961개의 DUF가 포함되어 [87]있다.
「 」를 참조해 주세요.
- 바인딩 도메인
- 단백질 도메인을 포함하는 생물학적 데이터베이스인 PANDIT
- Pfam: 단백질 도메인 데이터베이스
- 단백질
- 짧은 선형 모티브
- 구조생물학
- 단백질 구조분류(SCOP)
- CATH 단백질 구조 분류 데이터베이스
레퍼런스
이 기사는 저자가 기고한 런던 유니버시티 칼리지의 조지, R. A. (2002) "단백질의 구조적 도메인 예측" 논문의 텍스트와 수치를 통합한다.
- ^ Xu D, Nussinov R (1 February 1998). "Favorable domain size in proteins". Folding & Design. 3 (1): 11–7. doi:10.1016/S1359-0278(98)00004-2. PMID 9502316.
- ^ Phillips DC (November 1966). "The three-dimensional structure of an enzyme molecule". Scientific American. 215 (5): 78–90. Bibcode:1966SciAm.215e..78P. doi:10.1038/scientificamerican1166-78. PMID 5978599. S2CID 39959172.
- ^ Drenth J, Jansonius JN, Koekoek R, Swen HM, Wolthers BG (June 1968). "Structure of papain". Nature. 218 (5145): 929–32. Bibcode:1968Natur.218..929D. doi:10.1038/218929a0. PMID 5681232. S2CID 4169127.
- ^ Porter RR (May 1973). "Structural studies of immunoglobulins". Science. 180 (4087): 713–6. Bibcode:1973Sci...180..713P. doi:10.1126/science.180.4087.713. PMID 4122075.
- ^ Edelman GM (May 1973). "Antibody structure and molecular immunology". Science. 180 (4088): 830–40. Bibcode:1973Sci...180..830E. doi:10.1126/science.180.4088.830. PMID 4540988.
- ^ a b Richardson JS (1981). "The anatomy and taxonomy of protein structure". Advances in Protein Chemistry. 34: 167–339. doi:10.1016/S0065-3233(08)60520-3. ISBN 9780120342341. PMID 7020376.
- ^ Bork P (July 1991). "Shuffled domains in extracellular proteins". FEBS Letters. 286 (1–2): 47–54. doi:10.1016/0014-5793(91)80937-X. PMID 1864378. S2CID 22126481.
- ^ Wetlaufer DB (March 1973). "Nucleation, rapid folding, and globular intrachain regions in proteins". Proceedings of the National Academy of Sciences of the United States of America. 70 (3): 697–701. Bibcode:1973PNAS...70..697W. doi:10.1073/pnas.70.3.697. PMC 433338. PMID 4351801.
- ^ Chothia C (June 1992). "Proteins. One thousand families for the molecular biologist". Nature. 357 (6379): 543–4. Bibcode:1992Natur.357..543C. doi:10.1038/357543a0. PMID 1608464. S2CID 4355476.
- ^ Bakszt R, Wernimont A, Allali-Hassani A, Mok MW, Hills T, Hui R, Pizarro JC (September 2010). "The crystal structure of Toxoplasma gondii pyruvate kinase 1". PLOS ONE. 5 (9): e12736. Bibcode:2010PLoSO...512736B. doi:10.1371/journal.pone.0012736. PMC 2939071. PMID 20856875.
- ^ George RA, Heringa J (November 2002). "An analysis of protein domain linkers: their classification and role in protein folding". Protein Engineering. 15 (11): 871–9. doi:10.1093/protein/15.11.871. PMID 12538906.
- ^ "Protein Domains, Domain Assignment, Identification and Classification According to CATH and SCOP Databases". proteinstructures.com. Retrieved 14 October 2018.
- ^ Hegyi H, Gerstein M (April 1999). "The relationship between protein structure and function: a comprehensive survey with application to the yeast genome". Journal of Molecular Biology. 288 (1): 147–64. CiteSeerX 10.1.1.217.9806. doi:10.1006/jmbi.1999.2661. PMID 10329133.
- ^ Banner DW, Bloomer AC, Petsko GA, Phillips DC, Pogson CI, Wilson IA, et al. (June 1975). "Structure of chicken muscle triose phosphate isomerase determined crystallographically at 2.5 angstrom resolution using amino acid sequence data". Nature. 255 (5510): 609–14. Bibcode:1975Natur.255..609B. doi:10.1038/255609a0. PMID 1134550. S2CID 4195346.
- ^ a b Orengo CA, Michie AD, Jones S, Jones DT, Swindells MB, Thornton JM (August 1997). "CATH--a hierarchic classification of protein domain structures". Structure. 5 (8): 1093–108. doi:10.1016/S0969-2126(97)00260-8. PMID 9309224.
- ^ Copley RR, Bork P (November 2000). "Homology among (betaalpha)(8) barrels: implications for the evolution of metabolic pathways". Journal of Molecular Biology. 303 (4): 627–41. doi:10.1006/jmbi.2000.4152. PMID 11054297.
- ^ Lesk AM, Brändén CI, Chothia C (1989). "Structural principles of alpha/beta barrel proteins: the packing of the interior of the sheet". Proteins. 5 (2): 139–48. doi:10.1002/prot.340050208. PMID 2664768. S2CID 15340449.
- ^ a b Jones S, Stewart M, Michie A, Swindells MB, Orengo C, Thornton JM (February 1998). "Domain assignment for protein structures using a consensus approach: characterization and analysis". Protein Science. 7 (2): 233–42. doi:10.1002/pro.5560070202. PMC 2143930. PMID 9521098.
- ^ a b Holm L, Sander C (July 1994). "Parser for protein folding units". Proteins. 19 (3): 256–68. doi:10.1002/prot.340190309. PMID 7937738. S2CID 525264.
- ^ a b Anfinsen CB, Haber E, Sela M, White FH (September 1961). "The kinetics of formation of native ribonuclease during oxidation of the reduced polypeptide chain". Proceedings of the National Academy of Sciences of the United States of America. 47 (9): 1309–14. Bibcode:1961PNAS...47.1309A. doi:10.1073/pnas.47.9.1309. PMC 223141. PMID 13683522.
- ^ Cordes MH, Davidson AR, Sauer RT (February 1996). "Sequence space, folding and protein design". Current Opinion in Structural Biology. 6 (1): 3–10. doi:10.1016/S0959-440X(96)80088-1. PMID 8696970.
- ^ Ghélis C, Yon JM (July 1979). "[Conformational coupling between structural units. A decisive step in the functional structure formation]". Comptes Rendus de l'Académie des Sciences, Série D. 289 (2): 197–9. PMID 117925.
- ^ Ostermeier M, Benkovic SJ (2000). "Evolution of protein function by domain swapping". Evolutionary Protein Design. Adv Protein Chem. Advances in Protein Chemistry. Vol. 55. pp. 29–77. doi:10.1016/s0065-3233(01)55002-0. ISBN 9780120342556. PMID 11050932.
- ^ Zhou Y, Vitkup D, Karplus M (January 1999). "Native proteins are surface-molten solids: application of the Lindemann criterion for the solid versus liquid state". Journal of Molecular Biology. 285 (4): 1371–5. doi:10.1006/jmbi.1998.2374. PMID 9917381. S2CID 8702994.
- ^ Levitt M, Chothia C (June 1976). "Structural patterns in globular proteins". Nature. 261 (5561): 552–8. Bibcode:1976Natur.261..552L. doi:10.1038/261552a0. PMID 934293. S2CID 4154884.
- ^ Hutchinson EG, Thornton JM (April 1993). "The Greek key motif: extraction, classification and analysis". Protein Engineering. 6 (3): 233–45. doi:10.1093/protein/6.3.233. PMID 8506258.
- ^ Savageau MA (March 1986). "Proteins of Escherichia coli come in sizes that are multiples of 14 kDa: domain concepts and evolutionary implications". Proceedings of the National Academy of Sciences of the United States of America. 83 (5): 1198–202. Bibcode:1986PNAS...83.1198S. doi:10.1073/pnas.83.5.1198. PMC 323042. PMID 3513170.
- ^ a b c Islam SA, Luo J, Sternberg MJ (June 1995). "Identification and analysis of domains in proteins". Protein Engineering. 8 (6): 513–25. doi:10.1093/protein/8.6.513. PMID 8532675.
- ^ Wheelan SJ, Marchler-Bauer A, Bryant SH (July 2000). "Domain size distributions can predict domain boundaries". Bioinformatics. 16 (7): 613–8. doi:10.1093/bioinformatics/16.7.613. PMID 11038331.
- ^ a b Garel, J. (1992). "Folding of large proteins: Multidomain and multisubunit proteins". In Creighton, T. (ed.). Protein Folding (First ed.). New York: W.H. Freeman and Company. pp. 405–454. ISBN 978-0-7167-7027-5.
- ^ Bennett MJ, Schlunegger MP, Eisenberg D (December 1995). "3D domain swapping: a mechanism for oligomer assembly". Protein Science. 4 (12): 2455–68. doi:10.1002/pro.5560041202. PMC 2143041. PMID 8580836.
- ^ Heringa J, Taylor WR (June 1997). "Three-dimensional domain duplication, swapping and stealing". Current Opinion in Structural Biology. 7 (3): 416–21. doi:10.1016/S0959-440X(97)80060-7. PMID 9204285.
- ^ Jacob F (June 1977). "Evolution and tinkering". Science. 196 (4295): 1161–6. Bibcode:1977Sci...196.1161J. doi:10.1126/science.860134. PMID 860134. S2CID 29756896.
- ^ Ren S, Yang G, He Y, Wang Y, Li Y, Chen Z (October 2008). "The conservation pattern of short linear motifs is highly correlated with the function of interacting protein domains". BMC Genomics. 9: 452. doi:10.1186/1471-2164-9-452. PMC 2576256. PMID 18828911.
- ^ Campbell ID, Downing AK (May 1994). "Building protein structure and function from modular units". Trends in Biotechnology. 12 (5): 168–72. doi:10.1016/0167-7799(94)90078-7. PMID 7764899.
- ^ Bruce, Alberts (18 November 2014). Molecular biology of the cell (Sixth ed.). New York, NY. ISBN 9780815344322. OCLC 887605755.
- ^ wwPDB.org. "wwPDB: Worldwide Protein Data Bank". www.pdb.org. Archived from the original on 7 April 2015. Retrieved 25 July 2007.
- ^ Orengo CA, Jones DT, Thornton JM (December 1994). "Protein superfamilies and domain superfolds". Nature. 372 (6507): 631–4. Bibcode:1994Natur.372..631O. doi:10.1038/372631a0. PMID 7990952. S2CID 4330359.
- ^ Apic G, Gough J, Teichmann SA (July 2001). "Domain combinations in archaeal, eubacterial and eukaryotic proteomes". Journal of Molecular Biology. 310 (2): 311–25. doi:10.1006/jmbi.2001.4776. PMID 11428892. S2CID 11894663.
- ^ Ekman D, Björklund AK, Frey-Skött J, Elofsson A (April 2005). "Multi-domain proteins in the three kingdoms of life: orphan domains and other unassigned regions". Journal of Molecular Biology. 348 (1): 231–43. doi:10.1016/j.jmb.2005.02.007. PMID 15808866.
- ^ Davidson JN, Chen KC, Jamison RS, Musmanno LA, Kern CB (March 1993). "The evolutionary history of the first three enzymes in pyrimidine biosynthesis". BioEssays. 15 (3): 157–64. doi:10.1002/bies.950150303. PMID 8098212. S2CID 24897614.
- ^ Henikoff S, Greene EA, Pietrokovski S, Bork P, Attwood TK, Hood L (October 1997). "Gene families: the taxonomy of protein paralogs and chimeras". Science. 278 (5338): 609–14. Bibcode:1997Sci...278..609H. CiteSeerX 10.1.1.562.2262. doi:10.1126/science.278.5338.609. PMID 9381171.
- ^ Walker WP, Aradhya S, Hu CL, Shen S, Zhang W, Azarani A, et al. (December 2007). "Genetic analysis of attractin homologs". Genesis. 45 (12): 744–56. doi:10.1002/dvg.20351. PMID 18064672. S2CID 20878849.
- ^ "SMART: Main page". smart.embl.de. Retrieved 1 January 2017.
- ^ Bork P, Doolittle RF (October 1992). "Proposed acquisition of an animal protein domain by bacteria". Proceedings of the National Academy of Sciences of the United States of America. 89 (19): 8990–4. Bibcode:1992PNAS...89.8990B. doi:10.1073/pnas.89.19.8990. PMC 50050. PMID 1409594.
- ^ Heringa J (June 1998). "Detection of internal repeats: how common are they?". Current Opinion in Structural Biology. 8 (3): 338–45. doi:10.1016/S0959-440X(98)80068-7. PMID 9666330.
- ^ Politou AS, Gautel M, Improta S, Vangelista L, Pastore A (February 1996). "The elastic I-band region of titin is assembled in a "modular" fashion by weakly interacting Ig-like domains". Journal of Molecular Biology. 255 (4): 604–16. doi:10.1006/jmbi.1996.0050. PMID 8568900.
- ^ a b McLachlan AD (February 1979). "Gene duplications in the structural evolution of chymotrypsin". Journal of Molecular Biology. 128 (1): 49–79. doi:10.1016/0022-2836(79)90308-5. PMID 430571.
- ^ Moore JD, Endow SA (March 1996). "Kinesin proteins: a phylum of motors for microtubule-based motility". BioEssays. 18 (3): 207–19. doi:10.1002/bies.950180308. PMID 8867735. S2CID 46012215.
- ^ Russell RB (December 1994). "Domain insertion". Protein Engineering. 7 (12): 1407–10. doi:10.1093/protein/7.12.1407. PMID 7716150.
- ^ Haynie DT, Xue B (May 2015). "Superdomains in the protein structure hierarchy: The case of PTP-C2". Protein Science. 24 (5): 874–82. doi:10.1002/pro.2664. PMC 4420535. PMID 25694109.
- ^ Levinthal C (1968). "Are there pathways for protein folding?" (PDF). J Chim Phys. 65: 44–45. Bibcode:1968JCP....65...44L. doi:10.1051/jcp/1968650044. Archived from the original (PDF) on 2 September 2009.
- ^ Dill KA (June 1999). "Polymer principles and protein folding". Protein Science. 8 (6): 1166–80. doi:10.1110/ps.8.6.1166. PMC 2144345. PMID 10386867.
- ^ Leopold PE, Montal M, Onuchic JN (September 1992). "Protein folding funnels: a kinetic approach to the sequence-structure relationship". Proceedings of the National Academy of Sciences of the United States of America. 89 (18): 8721–5. Bibcode:1992PNAS...89.8721L. doi:10.1073/pnas.89.18.8721. PMC 49992. PMID 1528885.
- ^ Dill KA, Chan HS (January 1997). "From Levinthal to pathways to funnels". Nature Structural Biology. 4 (1): 10–9. doi:10.1038/nsb0197-10. PMID 8989315. S2CID 11557990.
- ^ White SH, Jacobs RE (April 1990). "Statistical distribution of hydrophobic residues along the length of protein chains. Implications for protein folding and evolution". Biophysical Journal. 57 (4): 911–21. Bibcode:1990BpJ....57..911W. doi:10.1016/S0006-3495(90)82611-4. PMC 1280792. PMID 2188687.
- ^ George RA, Heringa J (February 2002). "SnapDRAGON: a method to delineate protein structural domains from sequence data". Journal of Molecular Biology. 316 (3): 839–51. CiteSeerX 10.1.1.329.2921. doi:10.1006/jmbi.2001.5387. PMID 11866536.
- ^ George RA, Lin K, Heringa J (July 2005). "Scooby-domain: prediction of globular domains in protein sequence". Nucleic Acids Research. 33 (Web Server issue): W160-3. doi:10.1093/nar/gki381. PMC 1160142. PMID 15980446.
- ^ Desmadril M, Yon JM (July 1981). "Existence of intermediates in the refolding of T4 lysozyme at pH 7.4". Biochemical and Biophysical Research Communications. 101 (2): 563–9. doi:10.1016/0006-291X(81)91296-1. PMID 7306096.
- ^ Teale JM, Benjamin DC (July 1977). "Antibody as immunological probe for studying refolding of bovine serum albumin. Refolding within each domain". The Journal of Biological Chemistry. 252 (13): 4521–6. doi:10.1016/S0021-9258(17)40192-X. PMID 873903.
- ^ 크레이튼, T.E. (1983)단백질: 구조와 분자 특성.프리먼, 뉴욕.제2판
- ^ a b c Potestio R, Pontiggia F, Micheletti C (June 2009). "Coarse-grained description of protein internal dynamics: an optimal strategy for decomposing proteins in rigid subunits". Biophysical Journal. 96 (12): 4993–5002. Bibcode:2009BpJ....96.4993P. doi:10.1016/j.bpj.2009.03.051. PMC 2712024. PMID 19527659.
- ^ Baron R, Vellore NA (July 2012). "LSD1/CoREST is an allosteric nanoscale clamp regulated by H3-histone-tail molecular recognition". Proceedings of the National Academy of Sciences of the United States of America. 109 (31): 12509–14. Bibcode:2012PNAS..10912509B. doi:10.1073/pnas.1207892109. PMC 3411975. PMID 22802671.
- ^ Farago B, Li J, Cornilescu G, Callaway DJ, Bu Z (November 2010). "Activation of nanoscale allosteric protein domain motion revealed by neutron spin echo spectroscopy". Biophysical Journal. 99 (10): 3473–82. Bibcode:2010BpJ....99.3473F. doi:10.1016/j.bpj.2010.09.058. PMC 2980739. PMID 21081097.
- ^ Bu Z, Biehl R, Monkenbusch M, Richter D, Callaway DJ (December 2005). "Coupled protein domain motion in Taq polymerase revealed by neutron spin-echo spectroscopy". Proceedings of the National Academy of Sciences of the United States of America. 102 (49): 17646–51. Bibcode:2005PNAS..10217646B. doi:10.1073/pnas.0503388102. PMC 1345721. PMID 16306270.
- ^ a b Sowdhamini R, Blundell TL (March 1995). "An automatic method involving cluster analysis of secondary structures for the identification of domains in proteins". Protein Science. 4 (3): 506–20. doi:10.1002/pro.5560040317. PMC 2143076. PMID 7795532.
- ^ Swindells MB (January 1995). "A procedure for detecting structural domains in proteins". Protein Science. 4 (1): 103–12. doi:10.1002/pro.5560040113. PMC 2142966. PMID 7773168.
- ^ Janin J, Wodak SJ (1983). "Structural domains in proteins and their role in the dynamics of protein function". Progress in Biophysics and Molecular Biology. 42 (1): 21–78. doi:10.1016/0079-6107(83)90003-2. PMID 6353481.
- ^ Tsai CJ, Nussinov R (January 1997). "Hydrophobic folding units derived from dissimilar monomer structures and their interactions". Protein Science. 6 (1): 24–42. doi:10.1002/pro.5560060104. PMC 2143523. PMID 9007974.
- ^ a b Crippen GM (December 1978). "The tree structural organization of proteins". Journal of Molecular Biology. 126 (3): 315–32. doi:10.1016/0022-2836(78)90043-8. PMID 745231.
- ^ Rossmann MG, Moras D, Olsen KW (July 1974). "Chemical and biological evolution of nucleotide-binding protein". Nature. 250 (463): 194–9. Bibcode:1974Natur.250..194R. doi:10.1038/250194a0. PMID 4368490. S2CID 4273028.
- ^ Rose GD (November 1979). "Hierarchic organization of domains in globular proteins". Journal of Molecular Biology. 134 (3): 447–70. doi:10.1016/0022-2836(79)90363-2. PMID 537072.
- ^ a b Go N, Taketomi H (February 1978). "Respective roles of short- and long-range interactions in protein folding". Proceedings of the National Academy of Sciences of the United States of America. 75 (2): 559–63. Bibcode:1978PNAS...75..559G. doi:10.1073/pnas.75.2.559. PMC 411294. PMID 273218.
- ^ a b Holm L, Sander C (January 1997). "Dali/FSSP classification of three-dimensional protein folds". Nucleic Acids Research. 25 (1): 231–4. doi:10.1093/nar/25.1.231. PMC 146389. PMID 9016542.
- ^ a b Siddiqui AS, Barton GJ (May 1995). "Continuous and discontinuous domains: an algorithm for the automatic generation of reliable protein domain definitions". Protein Science. 4 (5): 872–84. doi:10.1002/pro.5560040507. PMC 2143117. PMID 7663343.
- ^ Zehfus MH (June 1997). "Identification of compact, hydrophobically stabilized domains and modules containing multiple peptide chains". Protein Science. 6 (6): 1210–9. doi:10.1002/pro.5560060609. PMC 2143719. PMID 9194181.
- ^ Taylor WR (March 1999). "Protein structural domain identification". Protein Engineering. 12 (3): 203–16. doi:10.1093/protein/12.3.203. PMID 10235621.
- ^ Wodak SJ, Janin J (November 1981). "Location of structural domains in protein". Biochemistry. 20 (23): 6544–52. doi:10.1021/bi00526a005. PMID 7306523.
- ^ 라신, 1985년[full citation needed]
- ^ Zehfus MH, Rose GD (September 1986). "Compact units in proteins". Biochemistry. 25 (19): 5759–65. doi:10.1021/bi00367a062. PMID 3778881.
- ^ Pandurangan AP, Topf M (September 2012). "RIBFIND: a web server for identifying rigid bodies in protein structures and to aid flexible fitting into cryo EM maps" (PDF). Bioinformatics. 28 (18): 2391–3. doi:10.1093/bioinformatics/bts446. PMID 22796953.
- ^ Pandurangan AP, Topf M (February 2012). "Finding rigid bodies in protein structures: Application to flexible fitting into cryoEM maps". Journal of Structural Biology. 177 (2): 520–31. doi:10.1016/j.jsb.2011.10.011. PMID 22079400.
- ^ a b Aleksiev T, Potestio R, Pontiggia F, Cozzini S, Micheletti C (October 2009). "PiSQRD: a web server for decomposing proteins into quasi-rigid dynamical domains". Bioinformatics. 25 (20): 2743–4. doi:10.1093/bioinformatics/btp512. PMID 19696046. S2CID 28106759.
- ^ 미첼레티, C., 카를로니, P., 마리탄, A.단백질 진동 역학의 정확하고 효율적인 기술: 분자 역학과 가우스 모델 비교, 단백질, 55, 635, 2004.
- ^ Barclay AN (August 2003). "Membrane proteins with immunoglobulin-like domains--a master superfamily of interaction molecules". Seminars in Immunology. 15 (4): 215–23. doi:10.1016/S1044-5323(03)00047-2. PMID 14690046.
- ^ Bateman A, Coggill P, Finn RD (October 2010). "DUFs: families in search of function". Acta Crystallographica. Section F, Structural Biology and Crystallization Communications. 66 (Pt 10): 1148–52. doi:10.1107/S1744309110001685. PMC 2954198. PMID 20944204.
- ^ El-Gebali S, Mistry J, Bateman A, Eddy SR, Luciani A, Potter SC, et al. (January 2019). "The Pfam protein families database in 2019". Nucleic Acids Research. 47 (D1): D427–D432. doi:10.1093/nar/gky995. PMC 6324024. PMID 30357350.
키페이퍼
- Berman HM, Westbrook J, Feng Z, Gilliland G, Bhat TN, Weissig H, et al. (January 2000). "The Protein Data Bank". Nucleic Acids Research. 28 (1): 235–42. doi:10.1093/nar/28.1.235. PMC 102472. PMID 10592235.
- Tooze J, Brändén C (1999). Introduction to protein structure. New York: Garland Pub. ISBN 978-0-8153-2305-1.
- Das S, Smith TF (2000). "Identifying nature's protein Lego set". Advances in Protein Chemistry. 54: 159–83. doi:10.1016/S0065-3233(00)54006-6. ISBN 978-0-12-034254-9. PMID 10829228.
- Dietmann S, Park J, Notredame C, Heger A, Lappe M, Holm L (January 2001). "A fully automatic evolutionary classification of protein folds: Dali Domain Dictionary version 3". Nucleic Acids Research. 29 (1): 55–7. doi:10.1093/nar/29.1.55. PMC 29815. PMID 11125048.
- Dyson HJ, Sayre JR, Merutka G, Shin HC, Lerner RA, Wright PE (August 1992). "Folding of peptide fragments comprising the complete sequence of proteins. Models for initiation of protein folding. II. Plastocyanin". Journal of Molecular Biology. 226 (3): 819–35. doi:10.1016/0022-2836(92)90634-V. PMID 1507228.
- Fersht AR (February 1997). "Nucleation mechanisms in protein folding". Current Opinion in Structural Biology. 7 (1): 3–9. doi:10.1016/S0959-440X(97)80002-4. PMID 9032066.
- George DG, Hunt LT, Barker WC (1996). "PIR-International Protein Sequence Database". Methods in Enzymology. 266: 41–59. doi:10.1016/S0076-6879(96)66005-4. ISBN 978-0-12-182167-8. PMC 145575. PMID 8743676.
- Go M (May 1981). "Correlation of DNA exonic regions with protein structural units in haemoglobin". Nature. 291 (5810): 90–2. Bibcode:1981Natur.291...90G. doi:10.1038/291090a0. PMID 7231530. S2CID 4313732.
- Hadley C, Jones DT (September 1999). "A systematic comparison of protein structure classifications: SCOP, CATH and FSSP". Structure. 7 (9): 1099–112. doi:10.1016/S0969-2126(99)80177-4. PMID 10508779.
- Hayward S (September 1999). "Structural principles governing domain motions in proteins". Proteins. 36 (4): 425–35. doi:10.1002/(SICI)1097-0134(19990901)36:4<425::AID-PROT6>3.0.CO;2-S. PMID 10450084.
- Heringa J, Argos P (July 1991). "Side-chain clusters in protein structures and their role in protein folding". Journal of Molecular Biology. 220 (1): 151–71. doi:10.1016/0022-2836(91)90388-M. PMID 2067014.
- Honig B (October 1999). "Protein folding: from the levinthal paradox to structure prediction". Journal of Molecular Biology. 293 (2): 283–93. CiteSeerX 10.1.1.332.955. doi:10.1006/jmbi.1999.3006. PMID 10550209.
- Kim PS, Baldwin RL (1990). "Intermediates in the folding reactions of small proteins". Annual Review of Biochemistry. 59 (1): 631–60. doi:10.1146/annurev.bi.59.070190.003215. PMID 2197986.
- Murvai J, Vlahovicek K, Barta E, Cataletto B, Pongor S (January 2000). "The SBASE protein domain library, release 7.0: a collection of annotated protein sequence segments". Nucleic Acids Research. 28 (1): 260–2. doi:10.1093/nar/28.1.260. PMC 102474. PMID 10592241.
- Murzin AG, Brenner SE, Hubbard T, Chothia C (April 1995). "SCOP: a structural classification of proteins database for the investigation of sequences and structures" (PDF). Journal of Molecular Biology. 247 (4): 536–40. doi:10.1016/S0022-2836(05)80134-2. PMID 7723011. Archived from the original (PDF) on 26 April 2012.
- Janin J, Chothia C (1985). "Domains in proteins: definitions, location, and structural principles". Methods in Enzymology. 115: 420–30. doi:10.1016/0076-6879(85)15030-5. ISBN 978-0-12-182015-2. PMID 4079796.
- Schultz J, Copley RR, Doerks T, Ponting CP, Bork P (January 2000). "SMART: a web-based tool for the study of genetically mobile domains". Nucleic Acids Research. 28 (1): 231–4. doi:10.1093/nar/28.1.231. PMC 102444. PMID 10592234.
- Siddiqui AS, Dengler U, Barton GJ (February 2001). "3Dee: a database of protein structural domains". Bioinformatics. 17 (2): 200–1. doi:10.1093/bioinformatics/17.2.200. PMID 11238081.
- Srinivasarao GY, Yeh LS, Marzec CR, Orcutt BC, Barker WC, Pfeiffer F (January 1999). "Database of protein sequence alignments: PIR-ALN". Nucleic Acids Research. 27 (1): 284–5. doi:10.1093/nar/27.1.284. PMC 148157. PMID 9847202.
- Tatusov RL, Natale DA, Garkavtsev IV, Tatusova TA, Shankavaram UT, Rao BS, et al. (January 2001). "The COG database: new developments in phylogenetic classification of proteins from complete genomes". Nucleic Acids Research. 29 (1): 22–8. doi:10.1093/nar/29.1.22. PMC 29819. PMID 11125040.
- Taylor WR, Orengo CA (July 1989). "Protein structure alignment". Journal of Molecular Biology. 208 (1): 1–22. doi:10.1016/0022-2836(89)90084-3. PMID 2769748.
- Yang AS, Honig B (September 1995). "Free energy determinants of secondary structure formation: I. alpha-Helices". Journal of Molecular Biology. 252 (3): 351–65. doi:10.1006/jmbi.1995.0502. PMID 7563056.
- Yang AS, Honig B (September 1995). "Free energy determinants of secondary structure formation: II. Antiparallel beta-sheets". Journal of Molecular Biology. 252 (3): 366–76. doi:10.1006/jmbi.1995.0503. PMID 7563057.
- Gough J, Chothia C (January 2002). "SUPERFAMILY: HMMs representing all proteins of known structure. SCOP sequence searches, alignments and genome assignments". Nucleic Acids Research. 30 (1): 268–72. doi:10.1093/nar/30.1.268. PMC 99153. PMID 11752312.
외부 링크
구조 도메인 데이터베이스
- 국립생명공학센터 웹사이트의 보존 도메인
- 3Dee
- 캐스
- 다리
- 웨이백 머신에서 단백질의 구조 도메인 정의 및 할당 (아카이브 2006-09-11)
- PFAM 클랜 브라우저
시퀀스 도메인 데이터베이스
- 인터프로
- 의회 도서관 웹 아카이브의 Pfam(2011-05-06)
- 프로 사이트
- 프로돔[영구 데드링크]
- 스마트
- NCBI 보존 도메인 데이터베이스
- 모든 완전 염기서열 유기체에 대한 슈퍼패밀리와 (슈퍼패밀리와 패밀리) 주석 데이터베이스를 나타내는 HMM의 SUPERFAMPARY 라이브러리
기능 도메인 데이터베이스
- dcGO 기능, 표현형 및 질병에 대한 도메인 중심 온톨로지의 포괄적인 데이터베이스.