Protein Data Bank: diferenças entre revisões
Linha 61: | Linha 61: | ||
== Como é extraída a informação que compõe os ficheiros PDB? == | == Como é extraída a informação que compõe os ficheiros PDB? == | ||
A grande maioria das contribuições para este portal provêm da difração de raio-x | A grande maioria das contribuições para este portal provêm da difração de raio-x[3]. A difração por raio-x é uma técnica utilizada na determinação da estrutura das proteínas. Baseia-se na interação entre raios-x monocromáticos e a amostra proteica. O padrão da radiação difratada permite identificar o composto, pois cada composto tem um padrão único, como se tratasse de uma impressão digital da proteína[7]. | ||
A ressonância magnética nuclear (NMR) é também uma técnica muito importante na produção de ficheiros PDB[3]. Esta técnica consiste na interação entre os vários momentos magnéticos de um núcleo com os vários átomos em seu redor e o campo magnético produzido por estes[8]. | |||
A difração por raio-x é uma técnica utilizada na determinação da estrutura das proteínas. Baseia-se na interação entre raios-x monocromáticos e a amostra proteica. O padrão da radiação difratada permite identificar o composto, pois cada composto tem um padrão único, como se tratasse de uma impressão digital da proteína | Com menor expressão, no PDB também existem estruturas obtidas através de microscopia eletrónica (EM) [1]. | ||
A ressonância magnética nuclear (NMR) é também uma técnica muito importante na produção de ficheiros PDB | Na figura 3, é possível compreender a evolução do input de informação desde que o PDB foi criado e comparar a frequência da utilização e o impacto que as diferentes técnicas têm no PDB. | ||
Esta técnica consiste na interação entre os vários momentos magnéticos de um núcleo com os vários átomos em seu redor e o campo magnético produzido por estes | |||
== Data Mining e o PDB == | == Data Mining e o PDB == |
Revisão das 16h34min de 7 de abril de 2017
Protein Data Bank | |
---|---|
Designação | Protein Data Bank |
Sigla | PDB |
Ano de Criação | Inicio dos anos 70 |
Entidade Criadora | Walter Hamilton & Edgar Meyer pela Brookhaven National Laboratory |
Entidade Gestora | |
Versão Atual | |
Área(s) de Aplicação | Farmacêutica |
O que é o PDB?
O Protein Data Bank foi criado no inicio dos anos 70, aquando dum seminário de cristalografia de proteínas, onde Walter Hamilton sugeriu o que se veio a tornar o PDB. Esta plataforma foi lançada na Brookhaven National Library, denominando-se Protein Structure Library, da autoria de Edgar Meyer[1]. Atualmente, constitui um importante reservatório de conhecimento científico. Tal como o seu nome indica, o PDB é um “portfólio” de proteínas. As proteínas são complexos macromoleculares que, a temperatura fisiológica, apresenta um conjunto de estruturas que estão intimamente ligadas à função que estas desempenham[2].
Na sua génese, este portal apenas possuía a estrutura tridimensional de cerca de 7 proteínas. Enquanto que, no início, a disponibilização da informação fosse voluntária, constitui nos dias de hoje um pré-requisito para uma possível publicação científica[1], o que permitiu que, de acordo com os dados mais recentes do próprio portal, o volume de informação ultrapassasse as 120,000 estruturas macromoleculares, englobando as mais variadas estruturas proteicas, desde ribossomas a vírus, incluído estruturas moleculares que ascende, na sua constituição, aos milhares de átomos[3], [4].
Que tipo de informação disponibiliza o PDB?
A informação presente no portal PDB encontra-se agrupada em ficheiros PDB. Nestes ficheiros, é possível encontrar informação nos seguintes parâmetros[1],[3]:
- Coordenadas 3D dos átomos
- Tipo de molécula (proteína, solvente ou ligando);
- Nome do átomo;
- Resíduo a que pertence (aminoácido);
- Coordenadas x,y,z (em Å);
- B-factor (mede vibração dos átomos);
- Metadata acerca das condições experimentais;
- Estrutura secundária e quaternária;
- Mapeamento da densidade eletrónica;
Os ficheiros PDB podem ser exportados em dois formatos. O primeiro, a extensão .cif, permite exportar a informação cristalográfica. A extensão ”.cif” faz a ponte da informação contida nos ficheiros PDB com softwares de visualização de moléculas. O Rasmol[5] e outras ferramentas (como o PyMOL[6]) são softwares que permitem a integração da extensa informação contida nos ficheiros PDB e, a partir desta, realizar algumas funções que não seriam possíveis de se realizar “à mão”:
- Manipulação das coordenadas correção da geometria molecular;
- Visualização da estrutura tridimensional;
- Conformação Ramachandran;
- Análise de B-factor;
- Análise da carga da superfície proteica;
Os ficheiros PDB podem ser exportados em dois formatos. O primeiro, a extensão .cif, permite exportar a informação cristalográfica. A extensão ”.cif” faz a ponte da informação contida nos ficheiros PDB com softwares de visualização de moléculas. O Rasmol[5] e outras ferramentas (como o PyMOL[6]) são softwares que permitem a integração da extensa informação contida nos ficheiros PDB e, a partir desta, realizar algumas funções que não seriam possíveis de se realizar “à mão”:
- Manipulação das coordenadas correção da geometria molecular;
- Visualização da estrutura tridimensional;
- Conformação Ramachandran;
- Análise de B-factor;
- Análise da carga da superfície proteica;
- ↑ 1,0 1,1 H. M. Berman, S. K. Burley, G. J. Kleywegt, J. L. Markley, H. Nakamura, and S. Velankar, “The archiving and dissemination of biological structure data,” Curr. Opin. Struct. Biol., vol. 40, pp. 17–22, 2016.
- ↑ 2,0 2,1 D. Coles, “The Young Person’s Guide to the Data,” pp. 242–249, 1968.
- ↑ V. M. Burger, D. O. Nolasco, and C. M. Stultz, “Expanding the Range of Protein Function at the Far End of the Order-Structure Continuum.,” J. Biol. Chem., vol. 291, no. 13, pp. 6706–13, Mar. 2016.
- ↑ RCSB Protein Data Bank - RCSB PDB.” [Online]. Available: http://www.rcsb.org/pdb/home/home.do. [Accessed: 30-Mar-2017].
- ↑ RasMol and OpenRasMol. [Online]. Available: http://www.openrasmol.org/. [Accessed: 30-Mar-2017].
- ↑ A. A. Bunaciu, E. gabriela Udriştioiu, and H. Y. Aboul-Enein, “X-Ray Diffraction: Instrumentation and Applications,” Crit. Rev. Anal. Chem., vol. 45, no. 4, pp. 289–299, Oct. 2015.
- ↑ V. Mlynárik, “Introduction to nuclear magnetic resonance,” Anal. Biochem., May 2016.
- ↑ www.pymol.org.” [Online]. Available: https://www.pymol.org/. [Accessed: 06-Apr-2017].
Figura 1. Representação, em ribbon, da frankensteinase. Encontra-se assinalado algumas características estruturais atípicas: À esquerda, um centro de ligação formado por resíduos apolares; À direita, uma ponte dissulfureto numa região não-ordenada. Adaptado[3]
Quais os passos que são tomados quando é depositada informação?
Esta base de dados possui um determinado protocolo para os vários passos necessários para criar um ficheiro PDB (deposição, integração, validação e disseminação). A globalização quase imediata do PDB contribuiu para o seu crescimento sustentado. Em 2003, um memorando entre os vários parceiros (Estados Unidos, Japão e Europa) permitiu a formação da World Wide Portein Data Bank (wwPDB). Esta parceria tornou-se responsável pela formalização dos procedimentos associados à recolha, estandardização, anotação e disseminação dos dados enviados[1] (Figura 1).
Figura 2. Esquema dos processos que são necessários para a criação de um ficheiro PDB. Adaptado [1]
Como é extraída a informação que compõe os ficheiros PDB?
A grande maioria das contribuições para este portal provêm da difração de raio-x[3]. A difração por raio-x é uma técnica utilizada na determinação da estrutura das proteínas. Baseia-se na interação entre raios-x monocromáticos e a amostra proteica. O padrão da radiação difratada permite identificar o composto, pois cada composto tem um padrão único, como se tratasse de uma impressão digital da proteína[7]. A ressonância magnética nuclear (NMR) é também uma técnica muito importante na produção de ficheiros PDB[3]. Esta técnica consiste na interação entre os vários momentos magnéticos de um núcleo com os vários átomos em seu redor e o campo magnético produzido por estes[8]. Com menor expressão, no PDB também existem estruturas obtidas através de microscopia eletrónica (EM) [1]. Na figura 3, é possível compreender a evolução do input de informação desde que o PDB foi criado e comparar a frequência da utilização e o impacto que as diferentes técnicas têm no PDB.
Data Mining e o PDB
O PDB tem sido cada vez mais utilizado para data mining de modelos estruturais. Enquanto que numa primeira fase, o PDB suscitava maior interesse na área da cristalografia e a sua informação era mais direccionada para essa mesma área (com maior enfâse na descrição do tipo de folding e motivos estruturais), posteriormente, a procura por novos compostos por parte da área farmacêutica transformou este portal num depósito de estruturas biológica [2].
Referências
[3] [1] [2] [4] [5] [6] [7] [8]