PLOS ONE: Distribuições não-gaussianas afetam identificação de padrões de expressão, anotação funcional e classificação prospectivo em Cancer genomas humanos

Abstract

Introdução

Os dados de expressão gênica é frequentemente assumida ser normalmente distribuída, mas esta hipótese não foi testado rigorosamente. Nós investigamos a distribuição de dados de expressão em genomas do câncer humanos e estudar as implicações de desvios da distribuição normal para a pesquisa de oncologia molecular translacional.

Métodos

Foi realizada uma análise de momentos centrais de cinco genomas do câncer e realizou a distribuição empírica encaixe para examinar a verdadeira distribuição de dados de expressão tanto no complete-experimento e nos níveis individuais de genes. Usamos uma variedade de métodos paramétricos e não paramétricos para testar os efeitos de desvios da normalidade no chamado gene, anotação funcional e classificação molecular prospectivo usando um sexto do genoma do câncer.

Resultados

momentos Central analisa revelam desvios estatisticamente significativos de normalidade em todos os genomas de cancro analisadas. Observamos tanto quanto 37% da variabilidade na chamada gene, 39% da variabilidade na anotação funcional, e 30% da variabilidade na subclassificação tumor prospectivo, molecular associado a este efeito.

Conclusões

expressão do gene do cancro perfis não são normalmente distribuídos, tanto no complete-experiência ou no nível individual-gene. Em vez disso, eles apresentam distribuições complexas, com caudas pesadas caracterizadas por assimetria e curtose estatisticamente significativa. A distribuição não-Gaussiana destes dados afecta a identificação de genes diferencialmente expressos,-anotação funcional, e classificação molecular prospectivo. Estes efeitos podem ser reduzidos, em certas circunstâncias, embora não completamente eliminados, por meio de análise não-paramétrica. Esta análise destaca dois pressupostos não confiáveis ​​de análise de expressão gênica do câncer translacional: que os “pequenos” desvios da normalidade na expressão distribuições de dados são analiticamente insignificante e que “robusto” algoritmos de chamar de genes pode compensar plenamente estes efeitos

Citação: Marko NF, Weil RJ (2012) Distribuições não-gaussianas afetam identificação de padrões de expressão, anotação funcional e classificação prospectiva em Câncer genomas humanos. PLoS ONE 7 (10): e46935. doi: 10.1371 /journal.pone.0046935

editor: William B. Coleman, University of North Carolina School of Medicine, Estados Unidos da América

Recebido: 17 Março, 2012; Aceito: 06 de setembro de 2012; Publicado: October 31, 2012

Deixe uma resposta