Marcelo, A primeira questão que vc deve se colocar é a seguinte: qual modelo estatístico poderia servir para estimar os efeitos ("fenômenos") que se vê no Mundo Real®.
Um segundo, e muito relacionado a ele é o seguinte, para a modelagem "apropriada" qual é o número de casos que seria necessário para ter-se significância estatística, com o limiar aceitável para o campo de estudo do seu problema e mais importante ainda, no estágio da sua pesquisa¹. Um outro ponto que me salta aos olhos da sua descrição (que pode ser uma interpretação minha açodada) é que o 'tipo' de planta automaticamente indica as composições dos 'ene' compostos. SE o estágio da sua pesquisa é de Análise Exploratória, então um caminho seria fazer investigações indo dessa direção para os compostos, e então tentar identificar daqueles os que biologicamente fariam sentido, posto que já deve haver ciência apontando possibilidades. Eu "tenho a impressão" que tratar *proporções* como genes não seria realmente uma abordagem que se pudesse defender mais tarde mesmo que algo "aparecesse" nos resultados. [1] tratar os mesmos dados setenta vezes para cada composto pode exigir uma correção no limiar para evitar o erro devido à FDR, embora na fase exploratória o risco de um Erro Tipo II de deixar escapar um Prêmio Nobel precisa ser balanceado❕❕ Por último, muita calma precisaria ser exercitada para assegurar que o emprego de proporções é adequado e não concentrações absolutas dos compostos, coisa que requer mais informações sobre o domínio do problema que vc estuda, mas em Estatística uso de proporções em algumas circunstâncias pode ser errôneo e de difícil percepção pois os SW modernos ainda não são ChatBots e por isso não criitcam o usuário!! HTH -- Cesar Rabak On Thu, Feb 23, 2023 at 11:08 AM Marcelo Laia por (R-br) < r-br@listas.c3sl.ufpr.br> wrote: > Caro(a) listeiro(a), > > Possuo um grupo de dados com valores representando a proporção de dado > composto na planta. Esses valores variam de 0 a 100%. Assim, o composto Y > pode apresentar valor 41 e o Z valor 0,02, por exemplo. Há em torno de 70 > compostos. Nem todas as plantas contém todos os compostos. > > Hipótese: plantas resistentes possuem compostos exclusivos e/ou em > proporção significativamente diferente das plantas suscetíveis. > > Para os compostos exclusivos, é tranquilo, pois, se o Z está presente > somente no resistente, é muito possível que ele tenha influência sobre a > resistência. > > O problema são aqueles que aparecem tanto no resistente quanto no > suscetível em proporção diferente. > > Outra questão que pode acontecer é a interação entre compostos. Ou seja, > dois ou mais compostos explicarem o efeito de resistência ou > suscetibilidade. Neste caso, um composto pode agir como facilitador para a > ação de outro, que seria o composto tóxico. Logo, sem o primeiro, o > composto tóxico, sozinho, não teria efeito. > > Pensei em usar abordagem genômica, tratando cada composto como um gene. > Não deu certo. Resultado estatístico não explica o biológico. Outra opção > seria pensar na análise de QTLs. Não tentei essa. > > Mas, lendo trabalhos na área médica, vi que alguns utilizam vários > sintomas para explicar a doença. Por exemplo, associam faixas de valores de > hemoglobina, ácido úrico e proteína X para explicar a ocorrência de > determinado câncer. > > Pergunto: você já viu ou já fez análises estatísticas no R para esse > último caso? Explicar a doença com base em um roll de sintomas? Qual pacote > usou? Poderia sugerir alguma literatura? Tutorial? Site? > > Muito obrigado > > Marcelo > _______________________________________________ > R-br mailing list > R-br@listas.c3sl.ufpr.br > https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br > Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça > código mínimo reproduzível. >
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.