As Estruturas da Vida

Capítulo 1: As proteínas são as moléculas trabalhadoras do corpo

Provavelmente já ouviste dizer que as proteínas são nutrientes importantes que ajudam a construir os nossos músculos. Mas elas são muito mais do que isso. As proteínas são moléculas trabalhadoras que são necessárias para praticamente todas as atividades do nosso corpo. Circulam no sangue, penetram nos tecidos e crescem em longos fios a partir da nossa cabeça. As proteínas são também os componentes chave dos materiais biológicos, desde a seda até às hastes dos veados.

As proteínas são feitas de pequenas unidades estruturais
Proteínas de todos os tamanhos e feitios
A computação gráfica no avanço da investigação
Pequenos erros nas proteínas podem causar doenças
Partes de algumas proteínas enrolam-se numa hélice
O problema do enrolamento das proteínas

Montanhismo e modelação computacional
Genómica Estrutural: Do gene à estrutura e talvez à função
O Código Genético
Proteínas provocadoras
Compreendeste?

As proteínas são moléculas trabalhadoras necessárias para virtualmente todas as atividades do nosso corpo.

As proteínas desempenham várias funções diferentes no nosso corpo. Pelo estudo das estruturas proteicas, percebemos melhor como é que elas normalmente funcionam e como é que algumas proteínas com formas anormais podem causar doenças.

Voltar ao início da página

As proteínas são feitas de pequenas unidades estruturais

As proteínas assemelham-se a longos "colares" com contas de diferentes formas. Cada "conta" é uma pequena molécula designada por aminoácido. Existem 20 aminoácidos padrão, cada um com a sua forma, tamanho e propriedades específicas.

Tipicamente, as proteínas contêm 50 a 2000 aminoácidos ligados pelas extremidades em muitas combinações. Cada proteína tem a sua própria sequência de aminoácidos.

As proteínas são sequências de aminoácidos ligados pelas extremidades, tal como contas de um colar.

Para se tornarem ativas, as proteínas devem-se enrolar e dobrar até chegar à sua conformação final ou "nativa".

É esta forma final que permite que a proteína desempenhe a sua função no corpo.

Estas cadeias de aminoácidos não se mantêm lineares e ordenadas. Elas enrolam e deformam-se, dobrando-se sobre si mesmas (folding), ficando as saliências de uns aminoácidos encaixadas nos entalhes de outros.

Este processo completa-se imediatamente após o fabrico das proteínas. A maioria das proteínas dobra-se em menos de um segundo, embora as maiores e mais complexas possam demorar vários segundos. A maioria das proteínas necessita da ajuda de outras proteínas, designadas por chaperoninas, para se dobrarem de forma eficiente.

Voltar ao início da página

Proteínas de todos os tamanhos e feitios

Uma vez que as proteínas têm papéis diversos no corpo, as formas e tamanhos que apresentam são também muito diversificados. O estudo destas formas ensina-nos como é que as proteínas funcionam no corpo e ajuda-nos a perceber as doenças que são causadas por proteínas anormais.

Para aprenderes mais sobre as proteínas aqui referidas e muitas outras, visita a secção "Molécula do Mês" no sítio RCSB Protein Data Bank (sítio em inglês). (http://www.pdb.org)

Imagens da Molécula do Mês por David S. Goodsell, The Scripps Research Institute

O colagénio presente na cartilagem e tendões deve a sua força à estrutura que apresenta, com três cadeias, entrelaçadas como numa corda.
Clique para ampliar

Os anticorpos são proteínas do sistema imunitário que libertam o nosso corpo de material estranho, incluindo bactérias e vírus. Os dois braços do anticorpo em forma de Y ligam-se à molécula estranha. A parte restante do anticorpo (o "pé") envia sinais para recrutamento de outros elementos do sistema imunitário.
Clique para ampliar

Algumas proteínas fixam-se em torno do material genético, o DNA, e regulam a sua atividade. Algumas destas proteínas têm a forma de uma argola, permitindo-lhes formar um anel completo em volta do DNA. Neste esquema está ilustrada a polimerase III, que se fixa em torno do DNA e se move ao longo da cadeia à medida que copia o material genético.
Clique para ampliar

As enzimas, que são proteínas que facilitam reações químicas, contêm por vezes uma reentrância ou recetáculo que permite fixar a molécula alvo. Em cima, pode ver-se (no sentido dos ponteiros do relógio, a partir do topo): a luciferase, que gera a luz amarelada dos pirilampos; a amilase, que nos ajuda a digerir o amido; e a transcriptase reversa, que permite ao VIH e outros vírus relacionados escravizar as células infetadas.
Clique para ampliar

Voltar ao início da página

A computação gráfica no avanço da investigação

A representação em fita (ribbon diagram) dá destaque às regiões organizadas da proteína (vermelho e azul claro).
Clique para ampliar

O modelo molecular compacto tenta mostrar os átomos como esferas cujo tamanho está correlacionado com o espaço que os átomos ocupam. Os átomos de cor vermelha e azul claro são os mesmos neste modelo e na representação em fita.
Clique para ampliar

A representação da superfície da mesma proteína mostra a sua forma global e as propriedades dessa mesma superfície. A coloração vermelha e azul indica a carga elétrica dos átomos na superfície da proteína.
Clique para ampliar

Há algumas décadas, os cientistas que pretendiam estudar estruturas moleculares tridimensionais passavam dias, semanas ou mais a construir modelos com varetas, bolas e suportes de arame.

Hoje, usam imagens geradas computacionalmente. Em segundos, os cientistas podem mostrar uma molécula de diferentes formas (como as três representações desta proteína), manipulá-la no ecrã do computador, simular como poderá interagir com outras moléculas e estudar de que modo os defeitos na sua estrutura poderão causar doenças.

Para experimentar um desses programas de computador, vai a http://www.proteinexplorer.org ou a http://www.pdb.org (sítios em inglês).

Voltar ao início da página

Pequenos erros nas proteínas podem causar doenças

Glóbulos vermelhos normais

Por vezes, um erro num só aminoácido pode causar uma doença. A anemia falciforme, que afeta frequentemente as pessoas de descendência africana, é causada por um único erro no gene da hemoglobina, a proteína transportadora do oxigénio nos glóbulos vermelhos.

Este erro, ou mutação, resulta num aminoácido incorreto numa posição da molécula. As moléculas de hemoglobina com o aminoácido errado aderem umas às outras e distorcem a forma dos glóbulos vermelhos, que ficam a parecer foices (normalmente são lisos e côncavos), daí a designação de falciforme.

O sintoma mais comum da doença são dores imprevisíveis em qualquer órgão ou articulação do corpo, provocadas pela aglomeração das células distorcidas, incapazes de passar pelos pequenos vasos sanguíneos. Estas obstruções impedem que o sangue carregado de oxigénio chegue aos órgãos e tecidos. A frequência, duração e severidade da dor varia muito entre indivíduos.

A doença afeta cerca de 1 em cada 500 norte-americanos de origem africana e 1 em cada 12 são portadores, o que significa que, embora não sofram da doença, a podem passar aos seus filhos.

Glóbulos vermelhos falciformes

Outra doença causada por um defeito num aminoácido é a fibrose quística. Esta doença é muito comum nos norte-americanos descendentes de norte-europeus, afetando 1 em cada 2500 nos Estados Unidos da América (EUA). Um em cada 25 ou 30 indivíduos são portadores da doença.

A doença ocorre quando a proteína CFTR é enrolada de forma incorreta. Este erro no enrolamento é geralmente causado pela deleção de um único aminoácido da CFTR. A função da CFTR (cystic fibrosis transmembrane conductance regulator – regulador da condutância transmembranar de fibrose quística) é permitir a passagem de iões cloreto (componente do sal de mesa) através das membranas celulares.

Quando esta função é alterada na fibrose quística, as glândulas produtoras de suor e muco são as mais afetadas. Um muco espesso e pegajoso acumula-se nos pulmões e nos órgãos digestivos, provocando desnutrição, atrasos no crescimento, infeções respiratórias frequentes e dificuldades em respirar. Os doentes geralmente morrem de doença pulmonar com cerca de 35 anos de idade.

Voltar ao início da página

Partes de algumas proteínas enrolam-se numa hélice

Mistura de hélices alfa e folhas beta. Imagem cedida pelo RCSB Protein Data Bank (http://www.pdb.org).
Clique para ampliar

Maioritariamente folhas beta. Imagem cedida pelo RCSB Protein Data Bank.
Clique para ampliar

Maioritariamente hélices alfa. Imagem cedida pelo RCSB Protein Data Bank.
Clique para ampliar

Quando as proteínas se enrolam, elas não formam uma massa amorfa ao acaso. Frequentemente, pequenas secções da proteína originam formas reconhecíveis. Quando a cadeia proteica se enrola em espiral, essa secção é chamada de hélice alfa. Quando forma uma tira plana, é uma folha beta.

Estas secções organizadas da proteína aglomeram-se entre si – ou com outras secções menos organizadas – para formar a proteína final enrolada. Algumas proteínas têm maioritariamente hélices alfa (a vermelho nas representações acima). Outras contêm maioritariamente folhas beta (a azul claro) ou uma mistura de hélices alfa e folhas beta.

Voltar ao início da página

Montanhismo e modelação computacional

Muitos cientistas usam os computadores para tentar resolver o problema do enrolamento das proteínas. David Baker, montanhista e biólogo computacional na University of Washington, é um exemplo. Ele desenvolve software para prever a estrutura das proteínas – e, para o fazer, aproveita o poder computacional que fica por usar nas residências universitárias. Lê mais sobre o David Baker em http://publications.nigms.nih.gov/findings/
sept05/business.html (sítio em inglês).

O problema do enrolamento das proteínas

Uma dada sequência de aminoácidos quase sempre se enrola numa estrutura tridimensional característica. Por isso, os cientistas argumentam que as instruções para esse enrolamento devem estar codificadas na própria sequência de aminoácidos. Os investigadores podem facilmente determinar a sequência de aminoácidos de uma proteína. Mas há mais de 50 anos que tentam – sem conseguir – decifrar o código que governa o enrolamento.

Os cientistas chamam a isto o "mistério do enrolamento das proteínas" e este continua a ser um dos grandes desafios da biologia estrutural. Embora os investigadores tenham proposto algumas das regras gerais e, em alguns casos, possam fazer previsões aproximadas da forma da proteína, não podem prever a posição de todos os átomos da molécula com rigor, tendo como base apenas a sequência de aminoácidos.

Os incentivos médicos para decifrar o código de enrolamento são muitos. Pensa-se que várias doenças, incluindo a de Alzheimer, a fibrose quística e a das "vacas loucas", possam resultar de proteínas mal enroladas. Muitos cientistas acreditam que, se pudessem decifrar as estruturas das proteínas a partir das suas sequências, poderiam compreender melhor o modo de funcionamento das proteínas, para depois usar esse conhecimento na melhoria do tratamento destas doenças.

Voltar ao início da página

Genómica estrutural: Do gene à estrutura e talvez à função

Como parte da Protein Structure Initiative, grupos de investigação dos EUA têm determinado milhares de estruturas moleculares, incluindo a estrutura desta proteína do organismo que causa a tuberculose.
Imagem cedida pelo TB Structural Genomics Consortium.
Clique para ampliar

O valor potencial de decifrar o código de enrolamento das proteínas subiu em flecha após o lançamento, na década de 1990, dos projetos de sequenciação genómica. Estes projetos, ainda a decorrer, dão aos cientistas acesso direto à sequência genética completa de centenas de organismos, incluindo os humanos.

A partir destas sequências genéticas, os cientistas podem facilmente obter os aminoácidos correspondentes usando o "código genético".

A disponibilidade de sequências genómicas (e de aminoácidos) completas tem aberto novas vias de investigação, tais como o estudo da estrutura de todas as proteínas de um organismo ou a comparação de proteínas que têm um papel biológico específico em muitas espécies diferentes.

O maior sonho dos biólogos estruturais de todo o mundo é determinarem diretamente, a partir das sequências genéticas, não só a estrutura tridimensional, nas também alguns aspetos da função de todas as proteínas.

Estão a caminho: já identificaram as sequências de aminoácidos que codificam certas características estruturais, como um cilindro "trançado" a partir de folhas beta.

Os investigadores também já catalogaram características que têm um papel biológico específico. Por exemplo, um aglomerado característico de hélices alfa sugere fortemente que a proteína se liga ao DNA.

Mas há ainda um longo caminho a percorrer para determinarem com rigor a estrutura de uma proteína com base apenas na sequência genética ou de aminoácidos. Os cientistas reconhecem que, para chegar a este objetivo de longo prazo, será necessário um grande esforço de colaboração. E assim nasceu um novo campo de estudo chamado Genómica Estrutural.

Em 2000, o NIGMS lançou um projeto de Genómica Estrutural chamado "Iniciativa da Estrutura Proteica" (Protein Structure Initiative) ou PSI. Este projeto de milhões de dólares envolve centenas de cien-tistas de todo o país [EUA].

Membros da Protein Structure Initiative determinaram a estrutura desta enzima de uma bactéria comum no solo. Imagem cedida pelo New York Structural GenomiX Consortium.
Clique para ampliar

Os cientistas PSI estão a usar um atalho cauteloso. A sua estratégia baseia-se em dois factos.

Primeiro, as proteínas podem ser agrupadas em famílias, com base na sua sequência de aminoácidos. Os membros da mesma família de proteínas têm frequentemente características estruturais semelhantes, tal como os membros de uma família humana podem ter todos pernas longas ou maçãs do rosto salientes.

Segundo, programas de computador sofisticados podem usar estruturas previamente decifradas como guia para prever outras estruturas proteicas.

A equipa PSI espera que, ao decifrar alguns milhares de estruturas proteicas cuidadosamente selecionadas, seja possível usar a modelação computacional para prever as estruturas de centenas de milhar de proteínas relacionadas.

Até ao momento, a equipa PSI decifrou um total de mais de 2400 estruturas. Destas, mais de 1600 parecem não estar relacionadas entre si, o que sugere que possam vir a servir como guias para modelar as estruturas de outras proteínas da sua família.

Talvez ainda mais importante, os investigadores PSI já desenvolveram novas tecnologias que permitem aumentar a velocidade e facilidade de determinação das estruturas moleculares. Muitas destas novas tecnologias são robots que automatizaram alguns passos do laborioso processo de determinação da estrutura. Graças a estes robots, é possível decifrar as estruturas mais rápido que nunca. Para além dos benefícios para a equipa PSI, estas tecnologias também aceleraram a investigação noutros campos.

Os cientistas PSI (e biólogos estruturais em todo o mundo) enviam os seus resultados para a Base de Dados de Proteínas (Protein Data Bank) em http://www.pdb.org. Aí, a informação fica livremente disponível para o avanço da investigação por toda a comunidade científica.

Para ver outras estruturas decifradas pela equipa PSI, vai a http://images.nigms.nih.gov/index.cfm?event=doSearch&searchTerm=psi&typeID=.

Voltar ao início da página

O código genético

Para além do código de enrolamento das proteínas, que permanece por decifrar, há um outro código, um código genético, que os cientistas descobriram a meados da década de 1960. O código genético revela o modo como os organismos vivos usam os genes como manuais de instruções para fazer proteínas.

	U	C	A	G
U	UUU fenilalanina UUC fenilalanina UUA leucina UUG leucina	UCU serina UCC serina UCA serina UCG serina	UAU tirosina UAC tirosina UAA stop UAG stop	UGU cisteína UGC cisteína UGA stop UGG triptofano
C	CUU leucina CUC leucina CUA leucina CUG leucina	CCU prolina CCC prolina CCA prolina CCG prolina	CAU histidina CAC histidina CAA glutamina CAG glutamina	CGU arginina CGC arginina CGA arginina CGG arginina
A	AUU isoleucina AUC isoleucina AUA isoleucina AUG metionina	ACU treonina ACC treonina ACA treonina ACG treonina	AAU asparagina AAC asparagina AAA lisina AAG lisina	AGU serina AGC serina AGA arginina AGG arginina
G	GUU valina GUC valina GUA valina GUG valina	GCU alanina GCC alanina GCA alanina GCG alanina	GAU ác. aspártico GAC ác. aspártico GAA ác. glutâmico GAG ác. glutâmico	GGU glicina GGC glicina GGA glicina GGG glicina

Esta tabela mostra todos os tripletos possíveis de mRNA e os aminoácidos que eles codificam. Repara que a maioria dos aminoácidos pode ser codificado por mais que um tripleto de mRNA. As entradas a negrito são mostradas na ilustração abaixo.

Ilustração que mostra como os genes são feitos de DNA que, por sua vez, é composto por pequenas moléculas, chamadas nucleótidos, ligadas em longas cadeias. Uma sequência de três nucleótidos codifica um aminoácido.

Clique para ampliar

Voltar ao início da página

Proteínas provocadoras

Cada um de nós tem várias centenas de milhar de proteínas diferentes no corpo.
As teias de aranha e fibras de seda são feitas de fibroína, uma proteína forte e maleável. A seda da aranha é mais forte do que um fio de aço do mesmo diâmetro, mas é muito mais elástica e, portanto, os cientistas esperam poder usá-la para produtos tão diversos como coletes à prova de bala e articulações artificiais. A dificuldade reside na colheita da seda, uma vez que as aranhas são muito menos cooperantes que os bichos-da-seda!
A luz dos pirilampos (também chamados vagalume) é possibilitada pela proteína chamada luciferase. Embora a maioria dos predadores evitem estes insetos amargos, algumas rãs comem tantos pirilampos que também elas brilham!
Os venenos mortais das cobras, escorpiões e peixes-balão contêm pequenas proteínas que atuam como neurotoxinas. Alguns caracóis marinhos paralisam a sua presa (e, por vezes, humanos azarados) com até 50 destas toxinas. Uma destas toxinas foi transformada num medicamento chamado Prialt®, que é usado no tratamento de dores tão fortes que não diminuem nem com morfina.
Por vezes, os navios no noroeste do Oceano Pacífico deixam um rasto de uma misteriosa luz verde. A luz é produzida por uma proteína das medusas quando estas são "atropeladas" pelos navios. Dado que as pistas fazem o traçado do curso dos navios durante a noite, esta proteína verde fluorescente interessou a Marinha Americana durante muitos anos. Muitos biólogos celulares também a usam para marcar com fluorescência os componentes celulares que estão a estudar.
Se, para uma receita qualquer, precisares de corno de rinoceronte, penas de íbis ou cerdas de porco-espinho, tenta substitui-los pelo teu próprio cabelo ou unhas. É tudo a mesma matéria-prima: alfa queratina, uma proteína robusta, resistente à água, que é também o principal componente da lã, escamas, cascos, conchas das tartarugas e da camada exterior da tua pele.

Voltar ao início da página

Compreendeste?

O que é uma proteína?

Indica três proteínas do teu corpo e descreve o que fazem.

O que aprendemos ao estudar as estruturas das proteínas?

Descreve o problema do enrolamento das proteínas.

Voltar ao início da página

Traduzido e adaptado para a Casa das Ciências em setembro de 2013.
Tradução conjunta de Diana Barbosa e da equipa coordenada por José Pissarra (Maria Susana Jorge Pereira, Luís Gustavo de Carvalho Pereira,
Maria Fernanda Fidalgo Ferro de Beça, Armando Jorge Gomes Teixeira, Armando Jorge Gomes Teixeira e Fernando Manuel dos Santos Tavares).
Revisão científica de Maria João Guimarães Fonseca.

As Estruturas da Vida

Capítulo 1: As proteínas são as moléculas trabalhadoras do corpo

As proteínas são feitas de pequenas unidades estruturais

Proteínas de todos os tamanhos e feitios

A computação gráfica no avanço da investigação

Pequenos erros nas proteínas podem causar doenças

Partes de algumas proteínas enrolam-se numa hélice

O problema do enrolamento das proteínas

Genómica estrutural: Do gene à estrutura e talvez à função

O código genético

Proteínas provocadoras

Page Footer