Arxiu d'etiquetes: triplet

Cracking the genetic code

In the same way that Alan Turing decoded Enigma, the encryption machine used by the German army in World War II, several scientists managed to decipher the genetic code. The solution to this framework has allowed us to understand how cells work and make genetic manipulation possible.

INTRODUCTION

A code is a system of replacing the words in a message with other words or symbols, so that nobody can understand it unless they know the system. For example the genetic code.

Although it seems to be a lie, all living beings (except for some bacteria) biologically work in the same way. And it is that Jacques Monod already said, everything that is verified as true for E. coli must also be true for elephants.

From the cells of the blue whale, the largest animal on the planet, to the cells of a hummingbird, passing through humans, are the same. This is thanks to the genetic code, which allows the information of each gene to be transmitted to the proteins, the executors of this information.

This flow of information was named by Francis Crick, in 1958, as the central dogma of molecular biology (Figure 1). In it he claimed that information flows from DNA to RNA, and then from RNA to proteins. This is how genetic information is transmitted and expressed unidirectionally. However, later modifications were added. Crick claimed that only DNA can be duplicated and transcribed to RNA. However, it has been seen that the replication of its RNA also occurs in viruses and that it can perform a reverse transcription to generate DNA again.

main-qimg-eee77f2b58be05c964ce0c04756f2cfb
Figure 1. Central dogma of molecular biology. Red arrows: Francis Crick’s way. Grey arrows: later modifications (Source: Quora)

THREE LANGUAGES OF CELLS

Inside the cells three different languages ​​are spoken, but they can be related through the genetic code.

The one we already know is the language of deoxyribonucleic acid (DNA), wound in a double chain and composed of 4 letters that correspond to the nitrogenous bases: adenine (A), thymine (T), cytosine (C) and guanine (G).

Another language very similar to the latter is that of RNA. It differs from DNA mainly in three aspects: (i) it is composed of a single chain instead of being double-stranded, (ii) its sugars are ribose instead of deoxyribose (hence the name of ribonucleic acid) and (iii) it contains the base uracil (U) instead of T. Neither the change of sugar nor the substitution of U by T alters the pairing with base A, so that RNA synthesis can be performed directly on a DNA template.

The last language that remains for us to know is that of proteins, formed by 20 amino acids. The amino acids constitute each and every one of the proteins of any living organism. The order of the amino acids that form the chain of the protein determines its function (Figure 2).

aminoacids
Figure 2. Table of 20 amino acids (Source: Compound Interest)

THE GENETIC CODE

As we have been saying, the genetic code is the rules that follow the nucleotide sequence of a gene, through the RNA intermediary, to be translated into an amino acid sequence of a protein. There are several types of RNA, but the one that interests us is the messenger RNA (mRNA), essential in the transcription process.
The cells decode the RNA by reading its nucleotides in groups of three (Figure 3). Since mRNA is a polymer of four different nucleotides, there are 64 possible combinations of three nucleotides (43). This brings us to one of its characteristics: it is degenerate. This means that there are several triplets for the same amino acid (synonymous codons). For example, proline is coded by the triplets CCU, CCC, CCA and CCG.

genetic_code_med
Figure 3. The genetic code with the table of 20 amino acids (Source: BioNinja)

The genetic code is not ambiguous since each triplet has its own meaning. All triplets make sense, either encode a particular amino acid or indicate read completion. Most amino acids are encoded by at least two codons. Methionine and tryptophan are the only amino acids that are codified only by a codon. But each codon codes only for an amino acid or stop sign. In addition, it is unidirectional, all triplets are read in the 5′-3′ direction.
The AUG codon serves as the start codon at which translation begins. There is only one start codon that codes for the amino acid methionine, while there are three stop codons (UAA, UAG and UGA). These codons cause the polypeptide to be released from the ribosome, where the translation occurs.
The position of the start codon determines the point where translation of the mRNA and its reading frame will begin. This last point is important because the same nucleotide sequence can encode completely different polypeptides depending on the frame in which it is read (Figure 4). However, only one of the three reading patterns of a mRNA encodes the correct protein. The displacement in the reading frame causes the message no longer to make sense.

Marco de Lectura
Figure 4. Possible frameshifts (Source: marcoregalia.com)

 

As we said at the beginning, one of the main characteristics of the genetic code is that it is universal, since almost all living beings use it (with the exception of some bacteria). This is important because a genetic code shared by such diverse organisms provides important evidence of a common origin of life on Earth. The species of the Earth of today probably evolved from an ancestral organism in which the genetic code was already present. Because it is essential for cellular function, it should tend to remain unchanged in the species through the generations. This type of evolutionary process can explain the remarkable similarity of the genetic code in present organisms.

Although the human being itself continues to be an enigma for science, the revolution of the deciphering of the genetic code has allowed us to delve into the functioning of our body, specifically that of our cells, and cross borders to genetic manipulation.

 

REFERENCES

  • Alberts, B. et al. Biología molecular de la célula (2010). Editorial Omega, 5a edición
  • Cooper, G.M., Hausman R.E. La Célula (2009). Editorial Marbán, 5a edición
  • Gotta Love Cells
  • BioNinja
  • Main picture: eldiario.es

MireiaRamos-angles

Desxifrant el codi genètic

De la mateixa manera que Alan Turing va descodificar Enigma, la màquina de xifrat que utilitzava l’exèrcit alemany en la Segona Guerra Mundial, varis científics van aconseguir desxifrar el codi genètic. La solució a aquest entramat ha permès entendre com funcionen les cèl·lules i fer possible la manipulació genètica.

INTRODUCCIÓ

Un codi és una sèrie de símbols que per separat no representen res, però al combinar-los poden generar un llenguatge comprensible només per aquells qui l’entenen. Això és el que passa amb el codi genètic.

Tot i que ens pugui semblar mentida, tots els éssers vius (a excepció d’alguns bacteris) biològicament funcionem de la mateixa manera. I és que ja ho deia Jacques Monod, tot el que es constata com a veraç per E. coli també ha de ser cert pels elefants.

Des de les cèl·lules de la balena blava, l’animal més gran del planeta, fins a les cèl·lules d’un colibrí, passant pels éssers humans, són iguals. Això és gràcies al codi genètic, que permet que la informació de cada gen sigui transmesa a les proteïnes, les executores d’aquesta informació.

Aquest flux d’informació va ser anomenat per Francis Crick, el 1958, com el dogma central de la biologia (Figura 1). En ell afirmava que la informació flueix de l’ADN al ARN, i després de l’ARN a les proteïnes. És així com es transmet i s’expressa la informació genètica unidireccionalment. No obstant, posteriorment es van afegir modificacions. Cric afirmava que només l’ADN pot duplicar-se i transcriure’s a ARN. Però s’ha vist que en virus també es produeix la replicació del seu ARN i que aquest pot realitzar una transcripció inversa per generar ADN de nou.

main-qimg-eee77f2b58be05c964ce0c04756f2cfb
Figura 1. Dogma central de la biologia. En vermell es mostra el cami que va senyalar Francis Crick (replicació de l’ADN, transcripció a ARN i traducció a proteïnes); i en gris les posteriors modificacions (Font: Quora)

ELS 3 LLENGUATGES DE LES CÈL·LULES

A l’interior de les cèl·lules es parlen tres idiomes diferents, però que es poden arribar a relacionar a través del codi genètic.

El que ja coneixem és el llenguatge de l’àcid desoxiribonucleic (ADN), enrotllat en una doble cadena i format per 4 lletres que corresponen a les bases nitrogenades: adenina (A), timina (T), citosina (C) i guanina (G).

Un altre llenguatge molt semblant a aquest últim és el de l’ARN. Difereix de l’ADN principalment en tres aspectes: (i) es compon d’una cadena única en comptes de ser de doble cadena, (ii) els seus sucres són riboses en comptes de desoxiriboses (d’aquí el nom d’àcid ribonucleic) i (iii) conté la base uracil (U) en comptes de T. Ni el canvi de sucre ni la substitució de U per T altera l’aparellament amb la base A, pel que la síntesi d’ARN pot ser realitzada de manera directa sobre un motlle d’ADN.

L’últim llenguatge que ens resta per conèixer és el de les proteïnes, format per 20 aminoàcids. Els aminoàcids constitueixen totes i cada una de les proteïnes de qualsevol organisme viu. L’ordre dels aminoàcids que formen la cadena de la proteïna determina la seva funció (Figura 2).

aminoacids
Figura 2. Taula dels 20 aminoàcids (Font: Compound Interest)

EL CODI GENÈTIC

Com venim dient, el codi genètic són les regles que segueix la seqüència de nucleòtids d’un gen, a través de l’intermediari ARN, per ser traduïda a una seqüència d’aminoàcids d’una proteïna. Existeixen varis tipus d’ARN, però el que ens interessa és el ARN missatger (ARNm), imprescindible en el procés de transcripció.

Les cèl·lules descodifiquen l’ARN llegint els seus nucleòtids en grups de tres (Figura 3). Com que l’ARNm és un polímer de quatre nucleòtids diferents hi ha 64 combinacions possibles de tres nucleòtids (43). Això ens porta a una de les característiques del codi genètic: està degenerat. Això significa que hi ha varis triplet per un mateix aminoàcid (codons sinònims). Per exemple, la prolina és codificada pels triplets CCU, CCC, CCA i CCG.

genetic_code_med
Figura 3. El codi genètic amb els 20 aminoàcids (Font: BioNinja)

El codi genètic no és ambigu ja que cada triplet té el seu propi significat. Tots els triplets tenen sentit, o bé codifiquen un aminoàcid en particular o bé indiquen final de lectura. La majoria dels aminoàcids es codifiquen almenys per dos codons. La metionina i el triptòfan són els únics aminoàcids que es codifiquen només per un codó. Però cada codó codifica només per un aminoàcid o senyal d’stop. A més, és unidireccional, tots els triplets es llegeixen en sentit 5’-3’.

El codó AUG serveix com a codó d’inici per començar la traducció. Només hi ha un codó d’inici que codifica per l’aminoàcid metionina, mentre que existeixen tres codons stop (UAA, UAG i UGA). Aquests codons fan que el polipèptid (polímer format per cadenes llargues d’aminoàcids) s’alliberi del ribosoma, lloc on ocorre la traducció.

La posició del codó d’inici determina el punt on comença la traducció de l’ARNm i el seu marc de lectura. Aquest últim punt és important perquè la mateixa seqüència de nucleòtids pot codificar polipèptids completament diferents depenent del marc en el que es llegeix (Figura 4). No obstant, només una de les tres pautes de lectures d’un ARNm codifica la proteïna correcta. El desplaçament en el marc de lectura provoca que el missatge ja no tingui sentit.

Marco de Lectura
Figura 4. Possibles marcs de lectura (Font: marcoregalia.com)

Com dèiem al principi, una de les principals característiques del codi genètic és que és universal, ja que gairebé tots els éssers vius l’utilitzen (a excepció d’alguns bacteris). Això és important perquè un codi genètic compartit per tan diversos organismes proporciona una important evidència d’un origen comú de la vida a la Terra. Les espècies de la Terra d’avui en dia probablement van evolucionar d’un organisme ancestral en el qual ja es trobava present el codi genètic. Degut a que és essencial per la funció cel·lular, hauria de tenir a romandre sense canvis en les espècies a través de les generacions. Aquest tipus de procés evolutiu pot explicar la notable similitud del codi genètic en els organismes presents en l’actualitat.

Tot i que l’ésser humà en sí continua sent un enigma per la ciència, la revolució del desxiframent del codi genètic ha permès endinsar-nos en el funcionament del nostre cos, en concret el de les nostres cèl·lules, i traspassar les fronteres cap a la manipulació genètica.

REFERÈNCIES

  • Alberts, B. et al. Biología molecular de la célula (2010). Editorial Omega, 5a edición
  • Cooper, G.M., Hausman R.E. La Célula (2009). Editorial Marbán, 5a edición
  • Gotta Love Cells
  • BioNinja
  • Foto portada: eldiario.es

MireiaRamos-catala