PLOS ONE: Bayesian agrupamento hierárquico de Estudos de Câncer Gene Expression dados com desconhecidos Estatísticas

Abstract

A análise de agrupamento é uma ferramenta importante no estudo de dados de expressão de genes. O algoritmo de Bayesian de agrupamento hierárquico (BHC) pode inferir automaticamente o número de clusters e usa selecção do modelo Bayesian para melhorar a qualidade de agrupamento. Neste artigo, apresentamos uma extensão do algoritmo BHC. O nosso algoritmo de Gauss BHC (GBHC) representa os dados como uma mistura de distribuição gaussiana. Ela usa distribuição-gama normal, tal como um conjugado antes da média e precisão de cada um dos componentes de Gauss. Testamos GBHC mais de 11 cancro e 3 conjuntos de dados sintéticos. Os resultados sobre conjuntos de dados de câncer mostram que no agrupamento de exemplo, GBHC em média produz uma partição de agrupamento que é mais concordante com a verdade terrestre do que os obtidos a partir de outros algoritmos comumente usados. Além disso, GBHC frequentemente infere o número de grupos que muitas vezes é perto da verdade chão. No agrupamento de genes, GBHC também produz uma partição de agrupamento que é biologicamente mais plausível do que vários outros métodos state-of-the-art. Isto sugere GBHC como uma ferramenta alternativa para o estudo de dados de expressão gênica

A implementação de GBHC está disponível em https://sites.google.com/site/gaussianbhc/

Citation:. Sirinukunwattana K , Savage RS, Bari MF, Snead DRJ, Rajpoot NM (2013) Bayesian hierárquica Clustering de Estudos de Câncer Gene Expression dados com desconhecidos Statistics. PLoS ONE 8 (10): e75748. doi: 10.1371 /journal.pone.0075748

editor: Ferdinando Di Cunto, Universidade de Turim, Itália

Deixe uma resposta