Protein Data Bank: diferenças entre revisões

Fonte: aprendis
Saltar para a navegaçãoSaltar para a pesquisa
Sem resumo de edição
 
(Há 38 edições intermédias do mesmo utilizador que não estão a ser apresentadas)
Linha 2: Linha 2:




== O que é o PDB? ==


O Protein Data Bank foi criado no inicio dos anos 70, num seminário de cristalografia de proteínas, onde Walter Hamilton sugeriu o que se veio a tornar o PDB. Esta plataforma foi lançada, primordialmente na Brookhaven National Library, denominando-se Protein Structure Library, da autoria de Edgar Meyer1 <ref name="Burger"/>. Atualmente, constitui um importante reservatório de conhecimento científico. Tal como o seu nome indica, o PDB é um “portfólio” de proteínas. As proteínas são complexos macromoleculares que, a temperatura fisiológica, apresenta um conjunto de estruturas que estão intimamente ligadas à função que estas desempenham <ref name="Berman"/>.


== O que é o PDB? ==
Na sua génese, este portal apenas possuía a estrutura tridimensional de cerca de 7 proteínas. Enquanto que, no início, a disponibilização da informação fosse voluntária, constitui nos dias de hoje um pré-requisito para uma possível publicação científica[1], o que permitiu que, de acordo com os dados mais recentes do próprio portal, o volume de informação ultrapassasse as 120,000 estruturas macromoleculares, englobando as mais variadas estruturas proteicas, desde ribossomas a vírus, incluído estruturas moleculares que ascende, na sua constituição, aos milhares de átomos
 
<ref name="Coles"/>, <ref name="RCSB"/>.
O PDB foi criado em 1972 e, atualmente, constitui um importante reservatório de conhecimento científico. Tal como o seu nome indica, o PDB é um “portfólio” de proteínas.
As proteínas são complexos macromoleculares que, a temperatura fisiológica, apresenta um conjunto de estruturas que estão intimamente ligadas à função que estas desempenham <ref name="Burger"/>.
Na sua génese, este portal apenas possuía a estrutura tridimensional acerca de 7 proteínas. Enquanto que, no início, a disponibilização da informação fosse voluntária, constitui nos dias de hoje um pré-requisito para uma possível publicação científica <ref name="Berman"/>.
Atualmente, o volume de informação presente no PDB ultrapassa as 120,000 estruturas macromoleculares, englobando as mais variadas estruturas proteicas, desde ribossomas a vírus, incluído estruturas moleculares que ascende, na sua constituição, aos milhares de átomos <ref name="Coles"/> , <ref name="RCSB"/>.


== Que tipo de informação disponibiliza o PDB? ==
== Que tipo de informação disponibiliza o PDB? ==


A informação presente no portal PDB encontra-se agrupada em ficheiros PDB. Estes ficheiros são constituídos por três componentes<ref name="Coles"/>:  
A informação presente no portal PDB encontra-se agrupada em ficheiros PDB. Nestes ficheiros, é possível encontrar informação nos seguintes parâmetros1.<ref name="Burger"/>,<ref name="Coles"/> :
<ol>
<li>Coordenadas 3D dos átomos </li>
<ul>
<li>Tipo de molécula (proteína, solvente ou ligando); </li>
<li>Nome do átomo; </li>
<li>Resíduo a que pertence (aminoácido);</li>
<li>Coordenadas x,y,z (em Å);</li>
<li>B-factor (mede vibração dos átomos);</li>
</ul>
<li>Metadata acerca das condições experimentais;</li>
<li>Estrutura secundária e quaternária;</li>
<li>Mapeamento da densidade eletrónica;</li>
</ol>


1. Informação sobre as condições de obtenção da estrutura tridimensional;
Os ficheiros PDB podem ser exportados em dois formatos. O primeiro, a extensão .cif, permite exportar a informação cristalográfica. A extensão ”.cif” faz a ponte da informação contida nos ficheiros PDB com softwares de visualização de moléculas. O Rasmol <ref name="RasMol"/> é um software que permite a integração da extensa informação contida nos ficheiros PDB e, a partir desta, realizar algumas funções que não seriam possíveis de  se realizar “à mão”:


2. Coordenadas de todos os átomos que constituem a estrutura;
<ul>
<li> Manipulação das coordenadas correção da geometria molecular; </li>
<li> Visualização da estrutura tridimensional; </li>
<li> Conformação Ramachandran;</li>
<li> Análise de B-factor;</li>
<li> Análise da carga da superfície proteica;</li>
</ul>


3. Fatores estruturais de todos os pontos de difração;
[[Ficheiro:Pdb2.png | center ]]
 
<p align=center> Figura 1. Representação, em ribbon, da frankensteinase. Encontra-se assinalado algumas características estruturais atípicas: À esquerda, um centro de ligação formado por resíduos apolares; À direita, uma ponte dissulfureto numa região não-ordenada. Adaptado<ref name="Coles"/> </p>
Os ficheiros PDB podem ser exportados em dois formatos. O primeiro, a extensão .cif, permite exportar a informação cristalográfica. A extensão ”.cif” faz a ponte da informação contida nos ficheiros PDB com softwares de visualização de moléculas, como o RasMol.  
O RasMol é uma ferramenta que permite a visualização de estruturas tridimensionais moleculares<ref name="RasMol"/>.  
É possível também exportar sob a forma de extensão “.pdb”. Esta extensão consiste num ficheiro texto, com toda a informação acerca da macromolécula, dos autores responsáveis pelo input da informação, das condições de obtenção da estrutura cristalográfica, das coordenadas dos átomos, entre outros parâmetros<ref name="Coles"/>.


== Quais os passos que são tomados quando é depositada informação? ==
== Quais os passos que são tomados quando é depositada informação? ==


Esta base de dados possui um determinado protocolo para os vários passos necessários para criar um ficheiro PDB (deposição, integração, validação e disseminação). Toda a cadeia de processos encontra-se esquematizada na figura 1.
Esta base de dados possui um determinado protocolo para os vários passos necessários para criar um ficheiro PDB (deposição, integração, validação e disseminação). A globalização quase imediata do PDB contribuiu para o seu crescimento sustentado. Em 2003, um memorando entre os vários parceiros (Estados Unidos, Japão e Europa) permitiu a formação da World Wide Portein Data Bank (wwPDB). Esta parceria tornou-se responsável pela formalização dos procedimentos associados à recolha, estandardização, anotação e disseminação dos dados enviados<ref name="Burger"/> (Figura 2).  




[[Ficheiro:Pdb.jpg | center ]]
[[Ficheiro:Pdb.jpg | center ]]
<p align=center> Figura 1. Esquema dos processos que são necessários para a criação de um ficheiro PDB. Adaptado <ref name="Berman"/> </p>
<p align=center> Figura 2. Esquema dos processos que são necessários para a criação de um ficheiro PDB. Adaptado <ref name="Berman"/> </p>


== Como é extraída a informação que compõe os ficheiros PDB? ==


A grande maioria das contribuições para este portal provêm da difração de raio-x<ref name="Coles"/>. A difração por raio-x é uma técnica utilizada na determinação da estrutura das proteínas. Baseia-se na interação entre raios-x monocromáticos e a amostra proteica. O padrão da radiação difratada permite identificar o composto, pois cada composto tem um padrão único, como se tratasse de uma impressão digital da proteína<ref name="Bunaciu"/>.


A ressonância magnética nuclear (NMR) é também uma técnica muito importante na produção de ficheiros PDB<ref name="Coles"/>. Esta técnica consiste na interação entre os vários momentos magnéticos de um núcleo com os vários átomos em seu redor e o campo magnético produzido por estes.
Com menor expressão, no PDB também existem estruturas obtidas através de microscopia eletrónica (EM) <ref name="Nuclear"/>.
Na figura 3, é possível compreender a evolução do input de  informação desde que o PDB foi criado e comparar a frequência da utilização e o impacto que as diferentes técnicas têm no PDB.


Como é extraída a informação que compõe os ficheiros PDB?
A grande maioria das contribuições para este portal provêm da difração de raio-x <ref name="Coles"/>  .


A difração por raio-x é uma técnica utilizada na determinação da estrutura das proteínas. Baseia-se na interação entre raios-x monocromáticos e a amostra proteica. O padrão da radiação difratada permite identificar o composto, pois cada composto tem um padrão único, como se tratasse de uma impressão digital da proteína
[[Ficheiro:Pdb3.jpg | center ]]
A ressonância magnética nuclear (NMR) é também uma técnica muito importante na produção de ficheiros PDB
<p align=center> Figura 3. Evolução, ao longo do tempo, do input de informação, quer em números absolutos, quer por tipo de técnica aplicada. (a) Número de entradas anuais (barra escura) e número de entradas disponíveis no final desse ano (barra clara); (b) Número de estruturas determinadas por difração de raios-x; (c) Número de estruturas determinadas por NMR; (d) Número de estruturas determinadas por EM. Adaptado<ref name="Burger"/> </p>
Esta técnica consiste na interação entre os vários momentos magnéticos de um núcleo com os vários átomos em seu redor e o campo magnético produzido por estes <ref name="Nuclear"/> <ref name="Coles"/> <ref name="Bunaciu"/>


== Data Mining e o PDB ==
== Data Mining e o PDB ==
Linha 48: Linha 64:


==Referências==
==Referências==
<ref name="Burger"> V. M. Burger, D. O. Nolasco, and C. M. Stultz, “Expanding the Range of Protein Function at the Far End of the Order-Structure Continuum.,” J. Biol. Chem., vol. 291, no. 13, pp. 6706–13, Mar. 2016. </ref>
<ref name=Burger> V. M. Burger, D. O. Nolasco, and C. M. Stultz, “Expanding the Range of Protein Function at the Far End of the Order-Structure Continuum.,” J. Biol. Chem., vol. 291, no. 13, pp. 6706–13, Mar. 2016. </ref>
<ref name="Berman"> H. M. Berman, S. K. Burley, G. J. Kleywegt, J. L. Markley, H. Nakamura, and S. Velankar, “The archiving and dissemination of biological structure data,” Curr. Opin. Struct. Biol., vol. 40, pp. 17–22, 2016. </ref>
<ref name=Berman> H. M. Berman, S. K. Burley, G. J. Kleywegt, J. L. Markley, H. Nakamura, and S. Velankar, “The archiving and dissemination of biological structure data,” Curr. Opin. Struct. Biol., vol. 40, pp. 17–22, 2016. </ref>
<ref name="Coles">  D. Coles, “The Young Person’s Guide to the Data,” pp. 242–249, 1968. </ref>
<ref name=Coles>  D. Coles, “The Young Person’s Guide to the Data,” pp. 242–249, 1968. </ref>
<ref name="RCSB"> RCSB Protein Data Bank - RCSB PDB.” [Online]. Available: http://www.rcsb.org/pdb/home/home.do. [Accessed: 30-Mar-2017]. </ref>
<ref name=RCSB>   RCSB Protein Data Bank - RCSB PDB.” [Online]. Available: http://www.rcsb.org/pdb/home/home.do. [Accessed: 30-Mar-2017]. </ref>
<ref name="RasMol"> RasMol and OpenRasMol. [Online]. Available: http://www.openrasmol.org/. [Accessed: 30-Mar-2017].</ref>
<ref name=RasMol> RasMol and OpenRasMol. [Online]. Available: http://www.openrasmol.org/. [Accessed: 30-Mar-2017].</ref>
<ref name="Bunaciu"> A. A. Bunaciu, E. gabriela Udriştioiu, and H. Y. Aboul-Enein, “X-Ray Diffraction: Instrumentation and Applications,” Crit. Rev. Anal. Chem., vol. 45, no. 4, pp. 289–299, Oct. 2015. </ref>
<ref name=Bunaciu> A. Bunaciu, E. gabriela Udriştioiu, and H. Y. Aboul-Enein, “X-Ray Diffraction: Instrumentation and Applications,” Crit. Rev. Anal. Chem., vol. 45, no. 4, pp. 289–299, Oct. 2015. </ref>
<ref name="Nuclear"> V. Mlynárik, “Introduction to nuclear magnetic resonance,” Anal. Biochem., May 2016. </ref>
<ref name=Nuclear> V. Mlynárik, “Introduction to nuclear magnetic resonance,” Anal. Biochem., May 2016. </ref>
 
<references />
<references />

Edição atual desde as 22h13min de 14 de junho de 2017

Protein Data Bank
Designação Protein Data Bank
Sigla PDB
Ano de Criação Inicio dos anos 70
Entidade Criadora Walter Hamilton & Edgar Meyer pela Brookhaven National Laboratory
Entidade Gestora
Versão Atual
Área(s) de Aplicação Farmacêutica


O que é o PDB?

O Protein Data Bank foi criado no inicio dos anos 70, num seminário de cristalografia de proteínas, onde Walter Hamilton sugeriu o que se veio a tornar o PDB. Esta plataforma foi lançada, primordialmente na Brookhaven National Library, denominando-se Protein Structure Library, da autoria de Edgar Meyer1 [1]. Atualmente, constitui um importante reservatório de conhecimento científico. Tal como o seu nome indica, o PDB é um “portfólio” de proteínas. As proteínas são complexos macromoleculares que, a temperatura fisiológica, apresenta um conjunto de estruturas que estão intimamente ligadas à função que estas desempenham [2].

Na sua génese, este portal apenas possuía a estrutura tridimensional de cerca de 7 proteínas. Enquanto que, no início, a disponibilização da informação fosse voluntária, constitui nos dias de hoje um pré-requisito para uma possível publicação científica[1], o que permitiu que, de acordo com os dados mais recentes do próprio portal, o volume de informação ultrapassasse as 120,000 estruturas macromoleculares, englobando as mais variadas estruturas proteicas, desde ribossomas a vírus, incluído estruturas moleculares que ascende, na sua constituição, aos milhares de átomos [3], [4].

Que tipo de informação disponibiliza o PDB?

A informação presente no portal PDB encontra-se agrupada em ficheiros PDB. Nestes ficheiros, é possível encontrar informação nos seguintes parâmetros1.[1],[3] :

  1. Coordenadas 3D dos átomos
    • Tipo de molécula (proteína, solvente ou ligando);
    • Nome do átomo;
    • Resíduo a que pertence (aminoácido);
    • Coordenadas x,y,z (em Å);
    • B-factor (mede vibração dos átomos);
  2. Metadata acerca das condições experimentais;
  3. Estrutura secundária e quaternária;
  4. Mapeamento da densidade eletrónica;

Os ficheiros PDB podem ser exportados em dois formatos. O primeiro, a extensão .cif, permite exportar a informação cristalográfica. A extensão ”.cif” faz a ponte da informação contida nos ficheiros PDB com softwares de visualização de moléculas. O Rasmol [5] é um software que permite a integração da extensa informação contida nos ficheiros PDB e, a partir desta, realizar algumas funções que não seriam possíveis de se realizar “à mão”:

  • Manipulação das coordenadas correção da geometria molecular;
  • Visualização da estrutura tridimensional;
  • Conformação Ramachandran;
  • Análise de B-factor;
  • Análise da carga da superfície proteica;
Pdb2.png

Figura 1. Representação, em ribbon, da frankensteinase. Encontra-se assinalado algumas características estruturais atípicas: À esquerda, um centro de ligação formado por resíduos apolares; À direita, uma ponte dissulfureto numa região não-ordenada. Adaptado[3]

Quais os passos que são tomados quando é depositada informação?

Esta base de dados possui um determinado protocolo para os vários passos necessários para criar um ficheiro PDB (deposição, integração, validação e disseminação). A globalização quase imediata do PDB contribuiu para o seu crescimento sustentado. Em 2003, um memorando entre os vários parceiros (Estados Unidos, Japão e Europa) permitiu a formação da World Wide Portein Data Bank (wwPDB). Esta parceria tornou-se responsável pela formalização dos procedimentos associados à recolha, estandardização, anotação e disseminação dos dados enviados[1] (Figura 2).


Pdb.jpg

Figura 2. Esquema dos processos que são necessários para a criação de um ficheiro PDB. Adaptado [2]

Como é extraída a informação que compõe os ficheiros PDB?

A grande maioria das contribuições para este portal provêm da difração de raio-x[3]. A difração por raio-x é uma técnica utilizada na determinação da estrutura das proteínas. Baseia-se na interação entre raios-x monocromáticos e a amostra proteica. O padrão da radiação difratada permite identificar o composto, pois cada composto tem um padrão único, como se tratasse de uma impressão digital da proteína[6].

A ressonância magnética nuclear (NMR) é também uma técnica muito importante na produção de ficheiros PDB[3]. Esta técnica consiste na interação entre os vários momentos magnéticos de um núcleo com os vários átomos em seu redor e o campo magnético produzido por estes. Com menor expressão, no PDB também existem estruturas obtidas através de microscopia eletrónica (EM) [7]. Na figura 3, é possível compreender a evolução do input de informação desde que o PDB foi criado e comparar a frequência da utilização e o impacto que as diferentes técnicas têm no PDB.


Pdb3.jpg

Figura 3. Evolução, ao longo do tempo, do input de informação, quer em números absolutos, quer por tipo de técnica aplicada. (a) Número de entradas anuais (barra escura) e número de entradas disponíveis no final desse ano (barra clara); (b) Número de estruturas determinadas por difração de raios-x; (c) Número de estruturas determinadas por NMR; (d) Número de estruturas determinadas por EM. Adaptado[1]

Data Mining e o PDB

O PDB tem sido cada vez mais utilizado para data mining de modelos estruturais. Enquanto que numa primeira fase, o PDB suscitava maior interesse na área da cristalografia e a sua informação era mais direccionada para essa mesma área (com maior enfâse na descrição do tipo de folding e motivos estruturais), posteriormente, a procura por novos compostos por parte da área farmacêutica transformou este portal num depósito de estruturas biológica [3].

Referências

[1] [2] [3] [4] [5] [6] [7]

  1. 1,0 1,1 1,2 1,3 1,4 V. M. Burger, D. O. Nolasco, and C. M. Stultz, “Expanding the Range of Protein Function at the Far End of the Order-Structure Continuum.,” J. Biol. Chem., vol. 291, no. 13, pp. 6706–13, Mar. 2016.
  2. 2,0 2,1 2,2 H. M. Berman, S. K. Burley, G. J. Kleywegt, J. L. Markley, H. Nakamura, and S. Velankar, “The archiving and dissemination of biological structure data,” Curr. Opin. Struct. Biol., vol. 40, pp. 17–22, 2016.
  3. 3,0 3,1 3,2 3,3 3,4 3,5 3,6 D. Coles, “The Young Person’s Guide to the Data,” pp. 242–249, 1968.
  4. 4,0 4,1 RCSB Protein Data Bank - RCSB PDB.” [Online]. Available: http://www.rcsb.org/pdb/home/home.do. [Accessed: 30-Mar-2017].
  5. 5,0 5,1 RasMol and OpenRasMol. [Online]. Available: http://www.openrasmol.org/. [Accessed: 30-Mar-2017].
  6. 6,0 6,1 A. Bunaciu, E. gabriela Udriştioiu, and H. Y. Aboul-Enein, “X-Ray Diffraction: Instrumentation and Applications,” Crit. Rev. Anal. Chem., vol. 45, no. 4, pp. 289–299, Oct. 2015.
  7. 7,0 7,1 V. Mlynárik, “Introduction to nuclear magnetic resonance,” Anal. Biochem., May 2016.