Saudações Aureliano,
Vou sugerir a abordagem mais simplista que consegui pensar:
Criar um hash com a correspondência entre aminoácidos e códons:
my %a2c = (
A => [qw[CGA CGC CGT CGG]],
F => [qw[TTC TTT]],
L => [qw[TTA TTG CTA CTG CTC CTT]],
...
);
E em seguida criar o hash %aa do seu exemplo:
my %aa;
foreach my $aminoacido ( keys %a2c ) {
foreach my $codom ( @{ $a2c{$aminoacido} } ) {
$aa{$codom} = $aminoacido;
}
}
Uma vez que você tem o conhecimento de "o quê gera quem", seria possível
ainda modelar o problema no código apenas codificando as regras do
negócio. A implementação (acho) que poderia ser apenas com permutações
e/ou funções/métodos. Eu entendo nada de BIO e fico sem poder ajudar
neste aspecto.
On Wed, Apr 13, 2016 at 12:24:53AM +, Aureliano Guedes wrote:
[...]
> Eu tenho varias códigos que acessam o mesmo valor (no caso que uso são vários
> códons que traduzem o mesmo aminoácido).
>
> Exemplo:
> Aminoacido -> Códons
> Sendo os aminoácidos representados por 20 letras diferentes mais o X (stop
> códon).
> E os codons, combinações de 3 nucleotídeos, sendo um total de 4 nucleotídeos
> (A, T, C e G), logo temos 64 combinações de 3 nucleotídeos (64 codons
> possíveis).
> Por isso um mesmo aminoácido pode ser codificado por mais de um códon.
> No caso do aminoácido Alanina (Ala || A) é códificado pelos códons GCA, GCC,
> GCT ou GCU. Observe que os dois primeiros nucleotídeos são C e G,
> respectivamente, e o terceiro pode ser ocupado por qualquer um dos 4
> nucleotídeo possíveis.
> Dessa forma:
>
> o A -> CGA ou CGC ou CGT ou CGG
>
> Outros:
>
> o F -> TTC || TTT
> o L -> TTA || TTG || CTA || CTG || CTC || CTT
>
> Bom, meu objetivo é simplesmente criar um hash, como esse:
>
> o my %aa = ( "UUU" => "F", "UUC" => "F", "UUA" => "L", "UUG"
> =>
> "L", "UCU" => "S", "UCC" => "S", "UCA" => "S", "UCG" => "S", "UAU"
> => "Y", "UAC" => "Y", "UAA" => "X","UAG" => "X", "UGU" => "C", "UGC"
> =>
> "C", "UGA" => "X", "UGG" => "W", "CUU" => "L", "CUC" => "L", "CUA"
> => "L", "CUG" => "L", "CCU" => "P", "CCC" => "P", "CCA" => "P",
> "CCG" => "P", "CAU" => "H", "CAC" => "H", "CAA" => "Q", "CAG"
> => "Q", "CGU" => "R", "CGC" => "R", "CGA" => "R", "CGG" => "R",
> "AUU" => "I", "AUC" => "I", "AUA" => "I", "AUG" => "M", "ACU"
> => "T", "ACC" => "T", "ACA" => "T", "ACG" => "T", "AAU" => "N",
> "AAC" => "N", "AAA" => "K", "AAG" => "K", "AGU" => "S", "AGC"
> => "S", "AGA" => "R", "AGG" => "R", "GUU" => "V", "GUC" => "V",
> "GUA" => "V", "GUG" => "V", "GCU" => "A", "GCC" => "A", "GCA"
> => "A", "GCG" => "A", "GAU" => "D", "GAC" => "D", "GAA" => "E",
> "GAG" => "E", "GGU" => "G", "GGC" => "G", "GGA" => "G", "GGG" =>
> "G",);
>
> Contudo pensei em tomar outra abordagem, informar pra chave quem ela pode ser.
> Não sei se é possível, mas eu comecei tentando algo como:
>
> o my %codon = ( "CG"./[ACTG]/ => "A", "TT"./[CT]/ => "F",
> ("TT"./[AG]/||"CU"./[ACTG]/) => "L",);
>
> Mas não funcionou.
>
> Pensei em pegar uma abordagem mais IUPAC, onde:
>
> o Y = C ou T
> o R = A ou G
> o N = A, C, G ou T
>
> *tem outros, mas por enquanto apenas estou vendo a possibilidade.
> Então fiz:
>
> o my $Y = /[CT]/;
> o my $R = /[AG]/;
> o my $N = /[ACTG]/;
> o
>
> o my %codon = ( "CG".$N => "A", "TT".$Y => "F", ("TT".$R||"CU".$N) => "L",);
>
> Mas não funcionou.
--
"Não manejo bem as palavras
Mas manipulo bem as strings."
--
http://perspicazsite.wordpress.com
___
Rio-pm mailing list
Rio-pm@pm.org
http://mail.pm.org/mailman/listinfo/rio-pm