As Estruturas da Vida
Capítulo 1: As proteínas são as moléculas trabalhadoras do corpo
Provavelmente já ouviste dizer que as proteínas são nutrientes importantes que ajudam a construir os nossos músculos. Mas elas são muito mais do que isso. As proteínas são moléculas trabalhadoras que são necessárias para praticamente todas as atividades do nosso corpo. Circulam no sangue, penetram nos tecidos e crescem em longos fios a partir da nossa cabeça. As proteínas são também os componentes chave dos materiais biológicos, desde a seda até às hastes dos veados.
As proteínas são moléculas trabalhadoras necessárias para virtualmente todas as atividades do nosso corpo.
As proteínas são feitas de pequenas unidades estruturais
As proteínas assemelham-se a longos "colares" com contas de diferentes formas. Cada "conta" é uma pequena molécula designada por aminoácido. Existem 20 aminoácidos padrão, cada um com a sua forma, tamanho e propriedades específicas.
Tipicamente, as proteínas contêm 50 a 2000 aminoácidos ligados pelas extremidades em muitas combinações. Cada proteína tem a sua própria sequência de aminoácidos.
Estas cadeias de aminoácidos não se mantêm lineares e ordenadas. Elas enrolam e deformam-se, dobrando-se sobre si mesmas (folding), ficando as saliências de uns aminoácidos encaixadas nos entalhes de outros.
Este processo completa-se imediatamente após o fabrico das proteínas. A maioria das proteínas dobra-se em menos de um segundo, embora as maiores e mais complexas possam demorar vários segundos. A maioria das proteínas necessita da ajuda de outras proteínas, designadas por chaperoninas, para se dobrarem de forma eficiente.
Proteínas de todos os tamanhos e feitios
Uma vez que as proteínas têm papéis diversos no corpo, as formas e tamanhos que apresentam são também muito diversificados. O estudo destas formas ensina-nos como é que as proteínas funcionam no corpo e ajuda-nos a perceber as doenças que são causadas por proteínas anormais.
Para aprenderes mais sobre as proteínas aqui referidas e muitas outras, visita a secção "Molécula do Mês" no sítio RCSB Protein Data Bank (sítio em inglês). (http://www.pdb.org)
Imagens da Molécula do Mês por David S. Goodsell, The Scripps Research Institute
A computação gráfica no avanço da investigação
Há algumas décadas, os cientistas que pretendiam estudar estruturas moleculares tridimensionais passavam dias, semanas ou mais a construir modelos com varetas, bolas e suportes de arame.
Hoje, usam imagens geradas computacionalmente. Em segundos, os cientistas podem mostrar uma molécula de diferentes formas (como as três representações desta proteína), manipulá-la no ecrã do computador, simular como poderá interagir com outras moléculas e estudar de que modo os defeitos na sua estrutura poderão causar doenças.
Para experimentar um desses programas de computador, vai a http://www.proteinexplorer.org ou a http://www.pdb.org (sítios em inglês).
Pequenos erros nas proteínas podem causar doenças
Por vezes, um erro num só aminoácido pode causar uma doença. A anemia falciforme, que afeta frequentemente as pessoas de descendência africana, é causada por um único erro no gene da hemoglobina, a proteína transportadora do oxigénio nos glóbulos vermelhos.
Este erro, ou mutação, resulta num aminoácido incorreto numa posição da molécula. As moléculas de hemoglobina com o aminoácido errado aderem umas às outras e distorcem a forma dos glóbulos vermelhos, que ficam a parecer foices (normalmente são lisos e côncavos), daí a designação de falciforme.
O sintoma mais comum da doença são dores imprevisíveis em qualquer órgão ou articulação do corpo, provocadas pela aglomeração das células distorcidas, incapazes de passar pelos pequenos vasos sanguíneos. Estas obstruções impedem que o sangue carregado de oxigénio chegue aos órgãos e tecidos. A frequência, duração e severidade da dor varia muito entre indivíduos.
A doença afeta cerca de 1 em cada 500 norte-americanos de origem africana e 1 em cada 12 são portadores, o que significa que, embora não sofram da doença, a podem passar aos seus filhos.
Outra doença causada por um defeito num aminoácido é a fibrose quística. Esta doença é muito comum nos norte-americanos descendentes de norte-europeus, afetando 1 em cada 2500 nos Estados Unidos da América (EUA). Um em cada 25 ou 30 indivíduos são portadores da doença.
A doença ocorre quando a proteína CFTR é enrolada de forma incorreta. Este erro no enrolamento é geralmente causado pela deleção de um único aminoácido da CFTR. A função da CFTR (cystic fibrosis transmembrane conductance regulator – regulador da condutância transmembranar de fibrose quística) é permitir a passagem de iões cloreto (componente do sal de mesa) através das membranas celulares.
Quando esta função é alterada na fibrose quística, as glândulas produtoras de suor e muco são as mais afetadas. Um muco espesso e pegajoso acumula-se nos pulmões e nos órgãos digestivos, provocando desnutrição, atrasos no crescimento, infeções respiratórias frequentes e dificuldades em respirar. Os doentes geralmente morrem de doença pulmonar com cerca de 35 anos de idade.
Partes de algumas proteínas enrolam-se numa hélice
Quando as proteínas se enrolam, elas não formam uma massa amorfa ao acaso. Frequentemente, pequenas secções da proteína originam formas reconhecíveis. Quando a cadeia proteica se enrola em espiral, essa secção é chamada de hélice alfa. Quando forma uma tira plana, é uma folha beta.
Estas secções organizadas da proteína aglomeram-se entre si – ou com outras secções menos organizadas – para formar a proteína final enrolada. Algumas proteínas têm maioritariamente hélices alfa (a vermelho nas representações acima). Outras contêm maioritariamente folhas beta (a azul claro) ou uma mistura de hélices alfa e folhas beta.
Muitos cientistas usam os computadores para tentar resolver o problema do enrolamento das proteínas.
David Baker, montanhista e biólogo computacional na University of Washington, é um exemplo. Ele desenvolve
software para prever a estrutura das proteínas – e, para o fazer, aproveita o poder computacional que fica por
usar nas residências universitárias.
Lê mais sobre o David
Baker em http://publications.nigms.nih.gov/findings/
sept05/business.html
(sítio em inglês).
O problema do enrolamento das proteínas
Uma dada sequência de aminoácidos quase sempre se enrola numa estrutura tridimensional característica. Por isso, os cientistas argumentam que as instruções para esse enrolamento devem estar codificadas na própria sequência de aminoácidos. Os investigadores podem facilmente determinar a sequência de aminoácidos de uma proteína. Mas há mais de 50 anos que tentam – sem conseguir – decifrar o código que governa o enrolamento.
Os cientistas chamam a isto o "mistério do enrolamento das proteínas" e este continua a ser um dos grandes desafios da biologia estrutural. Embora os investigadores tenham proposto algumas das regras gerais e, em alguns casos, possam fazer previsões aproximadas da forma da proteína, não podem prever a posição de todos os átomos da molécula com rigor, tendo como base apenas a sequência de aminoácidos.
Os incentivos médicos para decifrar o código de enrolamento são muitos. Pensa-se que várias doenças, incluindo a de Alzheimer, a fibrose quística e a das "vacas loucas", possam resultar de proteínas mal enroladas. Muitos cientistas acreditam que, se pudessem decifrar as estruturas das proteínas a partir das suas sequências, poderiam compreender melhor o modo de funcionamento das proteínas, para depois usar esse conhecimento na melhoria do tratamento destas doenças.
Genómica estrutural: Do gene à estrutura e talvez à função
O valor potencial de decifrar o código de enrolamento das proteínas subiu em flecha após o lançamento, na década de 1990, dos projetos de sequenciação genómica. Estes projetos, ainda a decorrer, dão aos cientistas acesso direto à sequência genética completa de centenas de organismos, incluindo os humanos.
A partir destas sequências genéticas, os cientistas podem facilmente obter os aminoácidos correspondentes usando o "código genético".
A disponibilidade de sequências genómicas (e de aminoácidos) completas tem aberto novas vias de investigação, tais como o estudo da estrutura de todas as proteínas de um organismo ou a comparação de proteínas que têm um papel biológico específico em muitas espécies diferentes.
O maior sonho dos biólogos estruturais de todo o mundo é determinarem diretamente, a partir das sequências genéticas, não só a estrutura tridimensional, nas também alguns aspetos da função de todas as proteínas.
Estão a caminho: já identificaram as sequências de aminoácidos que codificam certas características estruturais, como um cilindro "trançado" a partir de folhas beta.
Os investigadores também já catalogaram características que têm um papel biológico específico. Por exemplo, um aglomerado característico de hélices alfa sugere fortemente que a proteína se liga ao DNA.
Mas há ainda um longo caminho a percorrer para determinarem com rigor a estrutura de uma proteína com base apenas na sequência genética ou de aminoácidos. Os cientistas reconhecem que, para chegar a este objetivo de longo prazo, será necessário um grande esforço de colaboração. E assim nasceu um novo campo de estudo chamado Genómica Estrutural.
Em 2000, o NIGMS lançou um projeto de Genómica Estrutural chamado "Iniciativa da Estrutura Proteica" (Protein Structure Initiative) ou PSI. Este projeto de milhões de dólares envolve centenas de cien-tistas de todo o país [EUA].
Os cientistas PSI estão a usar um atalho cauteloso. A sua estratégia baseia-se em dois factos.
Primeiro, as proteínas podem ser agrupadas em famílias, com base na sua sequência de aminoácidos. Os membros da mesma família de proteínas têm frequentemente características estruturais semelhantes, tal como os membros de uma família humana podem ter todos pernas longas ou maçãs do rosto salientes.
Segundo, programas de computador sofisticados podem usar estruturas previamente decifradas como guia para prever outras estruturas proteicas.
A equipa PSI espera que, ao decifrar alguns milhares de estruturas proteicas cuidadosamente selecionadas, seja possível usar a modelação computacional para prever as estruturas de centenas de milhar de proteínas relacionadas.
Até ao momento, a equipa PSI decifrou um total de mais de 2400 estruturas. Destas, mais de 1600 parecem não estar relacionadas entre si, o que sugere que possam vir a servir como guias para modelar as estruturas de outras proteínas da sua família.
Talvez ainda mais importante, os investigadores PSI já desenvolveram novas tecnologias que permitem aumentar a velocidade e facilidade de determinação das estruturas moleculares. Muitas destas novas tecnologias são robots que automatizaram alguns passos do laborioso processo de determinação da estrutura. Graças a estes robots, é possível decifrar as estruturas mais rápido que nunca. Para além dos benefícios para a equipa PSI, estas tecnologias também aceleraram a investigação noutros campos.
Os cientistas PSI (e biólogos estruturais em todo o mundo) enviam os seus resultados para a Base de Dados de Proteínas (Protein Data Bank) em http://www.pdb.org. Aí, a informação fica livremente disponível para o avanço da investigação por toda a comunidade científica.
Para ver outras estruturas decifradas pela equipa PSI, vai a http://images.nigms.nih.gov/index.cfm?event=doSearch&searchTerm=psi&typeID=.
O código genético
Para além do código de enrolamento das proteínas, que permanece por decifrar, há um outro código, um código genético, que os cientistas descobriram a meados da década de 1960. O código genético revela o modo como os organismos vivos usam os genes como manuais de instruções para fazer proteínas.
U | C | A | G | |
---|---|---|---|---|
U | UUU fenilalanina UUC fenilalanina UUA leucina UUG leucina |
UCU serina UCC serina UCA serina UCG serina |
UAU tirosina UAC tirosina UAA stop UAG stop |
UGU cisteína UGC cisteína UGA stop UGG triptofano |
C | CUU leucina CUC leucina CUA leucina CUG leucina |
CCU prolina CCC prolina CCA prolina CCG prolina |
CAU histidina CAC histidina CAA glutamina CAG glutamina |
CGU arginina CGC arginina CGA arginina CGG arginina |
A | AUU isoleucina AUC isoleucina AUA isoleucina AUG metionina |
ACU treonina ACC treonina ACA treonina ACG treonina |
AAU asparagina AAC asparagina AAA lisina AAG lisina |
AGU serina AGC serina AGA arginina AGG arginina |
G | GUU valina GUC valina GUA valina GUG valina |
GCU alanina GCC alanina GCA alanina GCG alanina |
GAU ác. aspártico GAC ác. aspártico GAA ác. glutâmico GAG ác. glutâmico |
GGU glicina GGC glicina GGA glicina GGG glicina |
Esta tabela mostra todos os tripletos possíveis de mRNA e os aminoácidos que
eles codificam. Repara que a maioria dos aminoácidos pode ser codificado por mais que um tripleto de mRNA. As entradas a
negrito são mostradas na ilustração abaixo.
Proteínas provocadoras
- Cada um de nós tem várias centenas de milhar de proteínas diferentes no corpo.
- As teias de aranha e fibras de seda são feitas de fibroína, uma proteína forte e maleável. A seda da aranha é mais forte do que um fio de aço do mesmo diâmetro, mas é muito mais elástica e, portanto, os cientistas esperam poder usá-la para produtos tão diversos como coletes à prova de bala e articulações artificiais. A dificuldade reside na colheita da seda, uma vez que as aranhas são muito menos cooperantes que os bichos-da-seda!
- A luz dos pirilampos (também chamados vagalume) é possibilitada pela proteína chamada luciferase. Embora a maioria dos predadores evitem estes insetos amargos, algumas rãs comem tantos pirilampos que também elas brilham!
- Os venenos mortais das cobras, escorpiões e peixes-balão contêm pequenas proteínas que atuam como neurotoxinas. Alguns caracóis marinhos paralisam a sua presa (e, por vezes, humanos azarados) com até 50 destas toxinas. Uma destas toxinas foi transformada num medicamento chamado Prialt®, que é usado no tratamento de dores tão fortes que não diminuem nem com morfina.
- Por vezes, os navios no noroeste do Oceano Pacífico deixam um rasto de uma misteriosa luz verde. A luz é produzida por uma proteína das medusas quando estas são "atropeladas" pelos navios. Dado que as pistas fazem o traçado do curso dos navios durante a noite, esta proteína verde fluorescente interessou a Marinha Americana durante muitos anos. Muitos biólogos celulares também a usam para marcar com fluorescência os componentes celulares que estão a estudar.
- Se, para uma receita qualquer, precisares de corno de rinoceronte, penas de íbis ou cerdas de porco-espinho, tenta substitui-los pelo teu próprio cabelo ou unhas. É tudo a mesma matéria-prima: alfa queratina, uma proteína robusta, resistente à água, que é também o principal componente da lã, escamas, cascos, conchas das tartarugas e da camada exterior da tua pele.
O que é uma proteína?
Indica três proteínas do teu corpo e descreve o que fazem.
O que aprendemos ao estudar as estruturas das proteínas?
Descreve o problema do enrolamento das proteínas.
Tradução conjunta de Diana Barbosa e da equipa coordenada por José Pissarra (Maria Susana Jorge Pereira, Luís Gustavo de Carvalho Pereira,
Maria Fernanda Fidalgo Ferro de Beça, Armando Jorge Gomes Teixeira, Armando Jorge Gomes Teixeira e Fernando Manuel dos Santos Tavares).
Revisão científica de Maria João Guimarães Fonseca.