PLOS ONE: A Otimização Combinatória Nova Abordagem para Seleção de Recursos Integrados Usando conjuntos de dados diferentes: Um Estudo do cancro da próstata Transcriptoma

Abstract

Fundo

O estudo conjunto de vários conjuntos de dados tornou-se uma técnica comum para aumentar o poder estatístico para detectar biomarcadores obtidos a partir de estudos menores. A abordagem geralmente seguida é baseada no fato de que, como o número total de amostras aumenta, esperamos ter mais poder para detectar associações de interesse. Esta metodologia foi aplicada a associação e estudos transcriptomic devido à disponibilidade de conjuntos de dados de domínio público amplo genoma. Embora esta abordagem está bem estabelecido em bioestatística, a introdução de novos modelos de otimização combinatória para abordar esta questão não tenha sido explorado em profundidade. Neste estudo, nós introduzimos um novo modelo para a integração de vários conjuntos de dados e mostramos sua aplicação em transcriptomics.

Métodos

propomos um novo problema de otimização combinatória que aborda a questão central do biomarcador detecção em conjuntos de dados integrados. as melhores soluções para este modelo entregar uma seleção de características de um painel de biomarcadores potenciais. O modelo que propomos é uma versão generalizada da

,

β) -k

-feature Set problema. Nós ilustrar o desempenho desta nova metodologia através de uma tarefa desafiadora meta-análise envolvendo seis próstata conjuntos de dados de microarranjos câncer. Os resultados são, então, em comparação com a ferramenta de meta-análise RankProd populares, e em que pode ser obtida através da análise dos conjuntos de dados individuais por métodos estatísticos e combinatórias sozinho.

Resultados

A aplicação do método integrado resultou em uma assinatura mais informativa do que a meta-análise baseada em classificação ou os resultados do conjunto de dados individuais, e supera problemas decorrentes de conjuntos de dados do mundo real. O conjunto de genes identificados é altamente significativo no contexto do cancro da próstata. O método utilizado não depende de homogeneização ou transformação de valores de uma escala comum, e ao mesmo tempo é capaz de capturar os marcadores associados com a doença de subgrupos

citação:. Puthiyedth N, Riveros C, R Berretta , Moscato P (2015) a Otimização Combinatória Nova Abordagem para Seleção de Recursos Integrados Usando conjuntos de dados diferentes: Um Estudo Transcriptoma do cancro da próstata. PLoS ONE 10 (6): e0127702. doi: 10.1371 /journal.pone.0127702

Editor do Academic: Holger Fröhlich, da Universidade de Bonn, Centro Internacional de Bonn-Aachen para a TI, Alemanha

Deixe uma resposta