Protein Data Bank

Fonte: aprendis
Saltar para a navegaçãoSaltar para a pesquisa
Protein Data Bank
Designação Protein Data Bank
Sigla PDB
Ano de Criação Inicio dos anos 70
Entidade Criadora Walter Hamilton & Edgar Meyer pela Brookhaven National Laboratory
Entidade Gestora
Versão Atual
Área(s) de Aplicação Farmacêutica


O que é o PDB?

O Protein Data Bank foi criado no inicio dos anos 70, aquando dum seminário de cristalografia de proteínas, onde Walter Hamilton sugeriu o que se veio a tornar o PDB. Esta plataforma foi lançada na Brookhaven National Library, denominando-se Protein Structure Library, da autoria de Edgar Meyer1 [1]. Atualmente, constitui um importante reservatório de conhecimento científico. Tal como o seu nome indica, o PDB é um “portfólio” de proteínas. As proteínas são complexos macromoleculares que, a temperatura fisiológica, apresenta um conjunto de estruturas que estão intimamente ligadas à função que estas desempenham [2].

Na sua génese, este portal apenas possuía a estrutura tridimensional de cerca de 7 proteínas. Enquanto que, no início, a disponibilização da informação fosse voluntária, constitui nos dias de hoje um pré-requisito para uma possível publicação científica[1], o que permitiu que, de acordo com os dados mais recentes do próprio portal, o volume de informação ultrapassasse as 120,000 estruturas macromoleculares, englobando as mais variadas estruturas proteicas, desde ribossomas a vírus, incluído estruturas moleculares que ascende, na sua constituição, aos milhares de átomos [3], [4].

Que tipo de informação disponibiliza o PDB?

A informação presente no portal PDB encontra-se agrupada em ficheiros PDB. Nestes ficheiros, é possível encontrar informação nos seguintes parâmetros1.[1],[3] :

  1. Coordenadas 3D dos átomos
    • Tipo de molécula (proteína, solvente ou ligando);
    • Nome do átomo;
    • Resíduo a que pertence (aminoácido);
    • Coordenadas x,y,z (em Å);
    • B-factor (mede vibração dos átomos);
  2. Metadata acerca das condições experimentais;
  3. Estrutura secundária e quaternária;
  4. Mapeamento da densidade eletrónica;

Os ficheiros PDB podem ser exportados em dois formatos. O primeiro, a extensão .cif, permite exportar a informação cristalográfica. A extensão ”.cif” faz a ponte da informação contida nos ficheiros PDB com softwares de visualização de moléculas. O Rasmol [5] e outras ferramentas (como o PyMOL[6] ) são softwares que permitem a integração da extensa informação contida nos ficheiros PDB e, a partir desta, realizar algumas funções que não seriam possíveis de se realizar “à mão”:

  • Manipulação das coordenadas correção da geometria molecular;
  • Visualização da estrutura tridimensional;
  • Conformação Ramachandran;
  • Análise de B-factor;
  • Análise da carga da superfície proteica;
Pdb2.png

Figura 1. Representação, em ribbon, da frankensteinase. Encontra-se assinalado algumas características estruturais atípicas: À esquerda, um centro de ligação formado por resíduos apolares; À direita, uma ponte dissulfureto numa região não-ordenada. Adaptado[3]

Quais os passos que são tomados quando é depositada informação?

Esta base de dados possui um determinado protocolo para os vários passos necessários para criar um ficheiro PDB (deposição, integração, validação e disseminação). A globalização quase imediata do PDB contribuiu para o seu crescimento sustentado. Em 2003, um memorando entre os vários parceiros (Estados Unidos, Japão e Europa) permitiu a formação da World Wide Portein Data Bank (wwPDB). Esta parceria tornou-se responsável pela formalização dos procedimentos associados à recolha, estandardização, anotação e disseminação dos dados enviados[1] (Figura 2).


Pdb.jpg

Figura 2. Esquema dos processos que são necessários para a criação de um ficheiro PDB. Adaptado [2]

Como é extraída a informação que compõe os ficheiros PDB?

A grande maioria das contribuições para este portal provêm da difração de raio-x[3]. A difração por raio-x é uma técnica utilizada na determinação da estrutura das proteínas. Baseia-se na interação entre raios-x monocromáticos e a amostra proteica. O padrão da radiação difratada permite identificar o composto, pois cada composto tem um padrão único, como se tratasse de uma impressão digital da proteína[7].

A ressonância magnética nuclear (NMR) é também uma técnica muito importante na produção de ficheiros PDB[3]. Esta técnica consiste na interação entre os vários momentos magnéticos de um núcleo com os vários átomos em seu redor e o campo magnético produzido por estes[8]. Com menor expressão, no PDB também existem estruturas obtidas através de microscopia eletrónica (EM) [9]. Na figura 3, é possível compreender a evolução do input de informação desde que o PDB foi criado e comparar a frequência da utilização e o impacto que as diferentes técnicas têm no PDB.


Pdb3.jpg

Figura 3. Evolução, ao longo do tempo, do input de informação, quer em números absolutos, quer por tipo de técnica aplicada. (a) Número de entradas anuais (barra escura) e número de entradas disponíveis no final desse ano (barra clara); (b) Número de estruturas determinadas por difração de raios-x; (c) Número de estruturas determinadas por NMR; (d) Número de estruturas determinadas por EM. Adaptado[1]

Data Mining e o PDB

O PDB tem sido cada vez mais utilizado para data mining de modelos estruturais. Enquanto que numa primeira fase, o PDB suscitava maior interesse na área da cristalografia e a sua informação era mais direccionada para essa mesma área (com maior enfâse na descrição do tipo de folding e motivos estruturais), posteriormente, a procura por novos compostos por parte da área farmacêutica transformou este portal num depósito de estruturas biológica [3].

Referências

[1] [2] [3] [4] [5] [7] [9] [8]

  1. 1,0 1,1 1,2 1,3 1,4 V. M. Burger, D. O. Nolasco, and C. M. Stultz, “Expanding the Range of Protein Function at the Far End of the Order-Structure Continuum.,” J. Biol. Chem., vol. 291, no. 13, pp. 6706–13, Mar. 2016.
  2. 2,0 2,1 2,2 H. M. Berman, S. K. Burley, G. J. Kleywegt, J. L. Markley, H. Nakamura, and S. Velankar, “The archiving and dissemination of biological structure data,” Curr. Opin. Struct. Biol., vol. 40, pp. 17–22, 2016.
  3. 3,0 3,1 3,2 3,3 3,4 3,5 3,6 D. Coles, “The Young Person’s Guide to the Data,” pp. 242–249, 1968.
  4. 4,0 4,1 RCSB Protein Data Bank - RCSB PDB.” [Online]. Available: http://www.rcsb.org/pdb/home/home.do. [Accessed: 30-Mar-2017].
  5. 5,0 5,1 RasMol and OpenRasMol. [Online]. Available: http://www.openrasmol.org/. [Accessed: 30-Mar-2017].
  6. Erro de citação: Etiqueta <ref> inválida; não foi fornecido texto para as refs de nome PyMOL
  7. 7,0 7,1 A. Bunaciu, E. gabriela Udriştioiu, and H. Y. Aboul-Enein, “X-Ray Diffraction: Instrumentation and Applications,” Crit. Rev. Anal. Chem., vol. 45, no. 4, pp. 289–299, Oct. 2015.
  8. 8,0 8,1 www.pymol.org.” [Online]. Available: https://www.pymol.org/. [Accessed: 06-Apr-2017].
  9. 9,0 9,1 V. Mlynárik, “Introduction to nuclear magnetic resonance,” Anal. Biochem., May 2016.