PLOS ONE: Preciso e confiável Cancer classificação baseada em probabilística inferência de Caminho Activity

Abstract

Com o advento das tecnologias de alta capacidade para a medição de perfis de expressão do genoma, um grande número de métodos têm sido propostos para descobrir marcadores de diagnóstico que podem discriminar com precisão entre diferentes classes de uma doença. No entanto, fatores como o tamanho reduzido da amostra de dados clínicos típicos, o ruído inerente medições de alto rendimento, ea heterogeneidade entre diferentes amostras, muitas vezes tornam difícil encontrar marcadores genéticos confiáveis. Para superar este problema, vários estudos têm proposto o uso de marcadores baseada via, em vez de marcadores de genes individuais, para a construção do classificador. Dado um conjunto de vias conhecidas, estes métodos estimar o nível de cada via atividade resumindo os valores de seus genes membro expressão, e usar as atividades da via para a classificação. Tem sido demonstrado que os classificadores baseados em vias normalmente produzem resultados mais fiáveis ​​em comparação com os classificadores tradicionais baseadas em genes. Neste trabalho, propomos um novo método de classificação baseada em inferência probabilística de actividades da via. Para uma determinada amostra, calculamos a razão de verossimilhança entre os diferentes fenótipos da doença com base no nível de cada gene de expressão. A actividade de um dado caminho é então inferido através da combinação dos índices do Log-Likelihood dos genes constitutivos. Nós aplicamos o método proposto para a classificação da metástase do câncer de mama, e mostrar que ele consegue maior precisão e identifica marcadores da via mais reproduzíveis em comparação a vários métodos de inferência atividade da via existentes

Citation:. Su J, Yoon BJ, Dougherty ER (2009) Classificação Cancer Preciso e confiável com base probabilística inferência de Caminho Atividade. PLoS ONE 4 (12): e8161. doi: 10.1371 /journal.pone.0008161

Edição: Gustavo Stolovitzky, IBM Thomas J. Watson Research Center, Estados Unidos da América

Recebido: 18 setembro de 2009; Aceito: 13 de novembro de 2009; Publicação: 07 de dezembro de 2009

Direitos de autor: © 2009 Su et al. Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution, que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que o autor original ea fonte sejam creditados

Financiamento:. Edward R . Dougherty é apoiado em parte pela National Science Foundation, CCF-0.634.794. Os financiadores não tiveram nenhum papel no desenho do estudo, coleta de dados e análise, decisão de publicar ou preparação do manuscrito

CONFLITO DE INTERESSES:.. Os autores declararam que não existem interesses conflitantes

Introdução

a introdução de tecnologias de microarray acessíveis para medir perfis de expressão do genoma levou ao desenvolvimento de vários métodos para discriminar entre diferentes classes de uma doença complexa, como o câncer, por meio de análise de transcriptoma [1] – [4 ]. Especialmente, têm sido feitos esforços significativos de investigação para identificar genes expressos diferencialmente em diferentes fenótipos [5] – [9], que podem ser usados ​​como marcadores de diagnóstico para a classificação dos estados de doença ou prever o resultado de tratamentos médicos [1] – [4] , [10] – [12]. No entanto, encontrar marcadores genéticos de confiança é um problema desafiador, e vários estudos recentes têm questionado a confiabilidade de muitos classificadores com base em marcadores de genes individuais [13] – [19]. O pequeno tamanho da amostra de dados clínicos típicos que são usados ​​para construir um classificador é um dos principais fatores que tornam este problema difícil. Muitas vezes temos que procurar por um pequeno número de bons genes marcadores entre milhares de genes com base em um número limitado de amostras, o que torna o desempenho dos métodos de seleção de características tradicionais bastante imprevisíveis [20]. O ruído de medição inerente a dados experimentais de alto rendimento ea heterogeneidade entre as amostras e os pacientes tornar o problema ainda mais formidável.

Uma maneira possível para resolver este problema é interpretar os dados de expressão ao nível dos módulos funcionais, tais como as vias de sinalização e complexos moleculares, em vez de no nível de genes individuais. Na verdade, uma das fraquezas de muitos métodos de classificação baseadas em genes é que os genes marcadores são frequentemente seleccionados independentemente, mesmo que seus produtos funcionais podem interagir uns com os outros. Portanto, os marcadores de genes seleccionados pode conter informação redundante, e não pode sinergicamente melhorar o desempenho global de classificação. Podemos aliviar este problema por meio da análise em conjunto dos níveis de grupos de genes funcionalmente relacionados, que podem ser obtidos com base na análise de transcriptoma [21] expressão – [23], GO anotações [24], ou de outras fontes. Na verdade, vários estudos [23], [25] – [28] mostraram que a via marcadores são mais reprodutível em comparação com marcadores de um único gene e podem fornecer informações biológicas importantes sobre os mecanismos subjacentes que levam a diferentes fenótipos da doença. Além disso, classificadores baseados em via muitas vezes alcançar um desempenho de classificação comparável ou melhor em comparação com os classificadores tradicionais baseadas em genes.

Para usar marcadores à base de vias de classificação, precisamos de uma maneira para inferir a atividade de um determinado percurso com base em os níveis de expressão dos genes constituintes. Recentemente, um número de métodos de inferência actividade da via têm sido propostas para este fim. Por exemplo, Guo et ai. [25] proposto utilizar o valor médio ou mediano expressão dos genes membro para inferir a actividade da via. Tomfohr et ai. [28] e Bild et ai. [23] utilizado o primeiro componente principal do perfil de expressão dos genes membro para estimar a actividade de um determinado percurso. Mais recentemente, Lee et al. [26] proposto um método que prevê a actividade da via utilizando apenas um subconjunto de genes da via, chamados genes responsivos condição (CORGs), cujos níveis de expressão combinado pode discriminar com precisão os fenótipos de interesse.

neste trabalho, propomos um novo método para inferência probabilística de actividades da via. Para uma determinada via, o método proposto calcula o rácio de probabilidade logarítmica entre diferentes fenótipos com base no nível de cada gene membro da expressão. O nível de actividade da via é então inferido através da combinação dos índices do Log-Likelihood dos genes que pertencem a via. Nós aplicamos o nosso método para a classificação das metástases do cancro da mama, e demonstrar que ele pode alcançar maior precisão em comparação com várias abordagens baseadas em vias anteriores. Além disso, mostramos que a via método de atividade de inferência proposto pode encontrar marcadores da via mais reprodutíveis que retêm o poder de discriminação entre diferentes conjuntos de dados.

Métodos

Os conjuntos de dados

Nós obtidos dois independentes conjuntos de dados de câncer de mama de grande escala estudos de expressão gênica por Wang et al. [11] (referida como o conjunto de dados “EUA” neste trabalho) e van’t Veer et al. [10] (referida como o conjunto de dados “Holanda”). Wang et al. conjunto de dados [11] contém os perfis de expressão gênica de 286 pacientes com câncer de mama a partir dos EUA, onde a metástase foi detectado em 107 deles, enquanto os restantes 179 estavam livres de metástase. O outro conjunto de dados de van’t Veer estudada por et al. [10] contém os perfis de 295 pacientes da Holanda, onde 79 tiveram metástase e 216 estavam livres de metástase de expressão gênica. Neste estudo, nós não considerar o tempo de seguimento ou a ocorrência de metástases à distância.

Para obter o conjunto de caminhos biológicos conhecidos, que se refere ao (banco de dados assinaturas moleculares) MSigDB versão 2.4 (atualizado abril 7, 2008) [21]. Baixamos os caminhos canônicos nos conjuntos de genes C2 curadoria, que contém 639 conjuntos de genes obtidos a partir de várias bases de dados da via, incluindo a KEGG (Enciclopédia Kyoto de genes e genomas) do banco de dados [29] e do GenMAPP [30]. Estes conjuntos de genes são compilados por especialistas de domínio e eles fornecem representações canônicas de processos biológicos. O conjunto de vias obtidos a partir do MSigDB abrange mais de 5000 genes distintos, em que 3271 deles pode ser encontrado em ambas as plataformas de microarray utilizados pelos dois estudos de expressão de genes do cancro da mama em [10], [11].

Inferência probabilística de caminho Atividade

Para cada caminho, que pela primeira vez identificado os genes que foram incluídos nos perfis de expressão nos dois conjuntos de dados de câncer de mama. Os genes que não foram incluídos nestes conjuntos de dados foram removidos a partir do gene definido para a via dada. Considerar uma via que contém genes após a remoção dos genes cuja expressão valores não estavam disponíveis. Dada uma amostra que contém os níveis de expressão dos genes dos membros, que estimam a actividade da via do seguinte modo (1), onde é a relação de probabilidade logarítmica (LLR) entre os dois fenótipos de interesse para o gene. A LLR é dado por (2), onde é a função densidade de probabilidade condicional (PDF) do nível de expressão de gene sob o fenótipo 1, e é o PDF condicional sob fenótipo 2. A relação é um indicador probabilístico que nos diz que o fenótipo é mais provável com base no nível do gene membro th expressão. Nós combinamos as provas de todos os genes de membros para inferir a actividade global via. A actividade da via pode servir como um marcador discriminatório para classificar a amostra em diferentes fenótipos com base no nível de activação da via dada. Conceitualmente, podemos ver esta abordagem como calcular o apoio relativo para os dois fenótipos diferentes, utilizando um modelo Naive Bayes [31], [32] com base no perfil da via expressão gênica.

A fim de calcular o valor de LLR, precisamos estimar o PDF para cada fenótipo. Supomos que o nível de expressão genética do gene sob o fenótipo segue uma distribuição normal de média e desvio padrão. Estes parâmetros foram estimados com base em todas as amostras disponíveis que correspondem ao fenótipo. Os PDF estimados podem então ser utilizados para calcular os rácios de probabilidade logarítmica. Em aplicações práticas, muitas vezes não têm dados de treinamento suficientes para estimativa fiável dos PDFs e. Isto pode fazer a contagem dos LLRs sensível a pequenas alterações no perfil da expressão do gene. Para evitar este problema, a normalizar o do seguinte modo (3), onde e são a média e o desvio padrão de entre todas as amostras, respectivamente. A Figura 1 ilustra o procedimento geral para inferir a actividade de uma determinada via.

para cada gene na via, estimamos que as funções de densidade de probabilidade condicionais (PDFs) sob diferentes fenótipos. Com base nos PDF estimados, podemos transformar os valores dos genes membro de expressão em rácios de probabilidade logarítmica (LLRs) para se obter uma matriz de LLR a partir da matriz a expressão do gene. A matriz de LLR é então normalizado, ea atividade da via é inferida pela combinação dos LLRs normalizados de seus genes membros.

poder discriminativo do Caminho Marcadores

A fim de comparar a via proposta esquema de inferência atividade com outros métodos existentes, foram realizados os seguintes experimentos. Em nosso primeiro experimento, foram selecionadas as 50 principais vias diferencialmente expressos usando o método proposto por Tian et al. [22]. Para avaliar a capacidade de um determinado percurso em discriminar entre diferentes fenótipos, Tian et ai. calcula as pontuações estatísticas -teste para todos os genes de membros e tomar a sua média para calcular um escore global que pode servir como um indicador do poder discriminativo do percurso. Após prescreening os 50 principais vias que têm os maiores valores absolutos, calculamos o índice de actividade de cada uma destas vias, utilizando o método de inferência proposto, bem como outros métodos. As pontuações actividade da via obtidos foram então utilizados para calcular as estatísticas -test pontuação para cada marcador de itinerário. . As pontuações -Test foram utilizados para avaliar o poder discriminatório dos marcadores da via e comparar diferentes métodos de inferência

Neste trabalho, foram comparados cinco diferentes métodos de atividade da via de inferência: a média e os métodos mediana [25], o método baseado-PCA [23], [28], o método baseado em CORG [26], bem como o método de inferência proposto neste trabalho. Para a média, mediana e métodos baseados em CORG, calculamos a pontuação média das pontuações -teste de os valores dos genes membro expressão. Para o método baseia-APC, que calculado pela média

absoluta -test pontuação dos valores de expressão de gene, uma vez que a APC pode, naturalmente, combinar os valores de expressão independentemente de se eles estão correlacionados positivamente ou negativamente correlacionada com o fenótipo de interesse. Para o nosso método proposto, calculado pela média das pontuações -Test dos LLRs dos genes membros, uma vez que estima a atividade da via pontuação baseada no LLRs em vez dos valores de expressão originais.

Também avaliamos a robustez cada método de inferência na identificação de bons marcadores da via, classificando as vias usando um dos dois conjuntos de dados de câncer de mama, e depois avaliar o poder discriminatório das vias com base em outro conjunto de dados. Mais uma vez, -test estatísticas dos escores de atividade da via foram usadas para comparar diferentes métodos de inferência.

Em nosso segundo experimento, foram computados os -Test pontuações estatísticas para todas as 639 vias sem qualquer prescreening, e comparou a eficácia de diferentes métodos de inferência atividade da via com base nos escores computados. Tal como no primeiro experimento, também avaliamos a robustez de cada método de inferência para encontrar marcadores da via eficazes, classificando as vias de acordo com a pontuação -Test estimados usando um dos conjuntos de dados e, em seguida, avaliar o seu poder discriminativo do outro conjunto de dados.

Avaliação de classificação de Espectáculos

a fim de avaliar o desempenho de classificação do método de atividade de inferência via proposta, foram realizadas as seguintes experiências de validação cruzada.

para

dentro experimentos -dataset

, as amostras em um conjunto de dados foram divididos aleatoriamente em cinco subconjuntos de tamanho igual, onde as amostras em quatro desses subconjuntos foram utilizados para treinar o classificador eo subconjunto restante foi utilizado para avaliar o desempenho de classificação. Isto foi repetido usando cada subconjunto como o conjunto de teste para obter resultados mais confiáveis. O conjunto de treino foi novamente dividido em três subgrupos de igual tamanho. Dois terços foram usados ​​para classificar os marcadores da via e construir o classificador (o “marcador de avaliação” conjunto de dados), e um terço do conjunto de treinamento foi usado para seleção de características (o “recurso de seleção” conjunto de dados). Todas as amostras no conjunto de treino foram utilizados para estimar os PDFs dos valores de expressão gênica em diferentes fenótipos. Para construir o classificador, avaliamos cada via com base no poder discriminativo do seu escore de atividade para classificar amostras. As vias foram classificados em ordem do -valor aumentando. Depois de classificar os caminhos, nós construímos o classificador, seja com base em regressão logística ou LDA (análise discriminante linear), como se segue. Com base no conjunto de dados marcador de avaliação, foi construído primeiro o classificador com apenas uma característica, ou seja, o marcador de percurso com o menor -valor. O desempenho do classificador foi então medida pelo cálculo da AUC (área sob a curva ROC) [33] sobre o conjunto de dados de longa-selecção. Em seguida, ampliamos o conjunto de características selecionando o marcador de itinerário com o menor -valor entre os caminhos restantes. Um novo classificador foi treinado usando os recursos selecionados no conjunto de dados marcador de avaliação e seu desempenho classificação foi novamente avaliada no conjunto de dados recurso de seleção. O marcador de itinerário adicionado foi mantido no conjunto de recursos se a AUC aumentou, e ele foi removido de outra forma. Repetimos o processo anterior para todos os marcadores da via para optimizar o classificador. O desempenho do classificador aperfeiçoado foi avaliada pelo cálculo da AUC no conjunto de dados de teste. Estas experiências foram repetidas para 100 partições aleatórias de todo o conjunto de dados. Relatamos o AUC, em média, mais de 500 experimentos, como a medida de desempenho global do método de classificação na mão. O processo geral do experimento intra-conjunto de dados está ilustrado na Fig. 2A.

(A) Nas experiências intra-conjunto de dados, que faz parte do conjunto de treinamento, conhecido como o conjunto marcador de avaliação, é usado para classificar os marcadores de via de acordo com seu poder de discriminação e construir o classificador. O melhor conjunto de recursos são selecionados com base no restante do conjunto de treinamento, referido como o conjunto de recursos-selecção. O desempenho do classificador resultante é avaliada usando o conjunto de dados de teste. (B) Nos experimentos cruzada do conjunto de dados, um dos conjuntos de dados é usado para encontrar o melhor conjunto de recursos, eo outro conjunto de dados é usada para construir um classificador com base nas características pré-seleccionadas e avaliar o classificador.

a fim de avaliar a reprodutibilidade dos marcadores da via em todo conjunto de dados diferente, foi realizada

cross-dataset experimentos

, onde um conjunto de dados foi usado para selecionar os marcadores caminho, e outro conjunto de dados foi utilizado para a construção o classificador com base nos marcadores seleccionados e avaliar o seu desempenho. Primeiro, foi selecionado o melhor conjunto de recursos (isto é, marcadores da via) com base em um conjunto de dados, otimizando a métrica AUC. O processo para a escolha do conjunto de recursos foi semelhante à usada nas experiências intra-conjunto de dados. As amostras em outro conjunto de dados foram divididos em cinco subconjuntos de igual tamanho. Quatro quintos de amostras foram usadas para treinar o classificador utilizando as características seleccionadas, e um quinto das amostras foram utilizadas para avaliar o desempenho do classificador construído. Nós repetimos esta experiência usando cada um dos cinco subgrupos como o conjunto de teste e usar o resto para o treinamento. O experimento anterior foi repetido para 100 divisórias aleatórias de todo o conjunto de dados, e a AUC média ao longo dos 500 experiências foi reportado como a medida do desempenho. É importante notar que a seleção de recursos é realizada exclusivamente com base no primeiro conjunto de dados. Durante os experimentos de validação cruzada usando o segundo conjunto de dados, o conjunto de treinamento (que consiste em quatro quintos das amostras no mesmo conjunto de dados) é usado simplesmente para construir o classificador com base no conjunto pré-selecionado de recursos. O objetivo geral desses experimentos cruzada do conjunto de dados é avaliar a reprodutibilidade do conjunto de recursos, selecionado usando o esquema de inferência atividade da via proposta, através de diferentes conjuntos de dados. Figura 2B ilustra o processo geral do experimento cross-dataset.

Para comparar o método proposto com outros métodos existentes, foi realizado o experiências intra-conjunto de dados e as experiências cross-conjunto de dados utilizando outros métodos de atividade da via de inferência descrito ( média, mediana, PCA, e CORG). Além disso, também foi avaliado o desempenho de um classificador com base em genes que usa genes individuais como marcadores de diagnóstico, seguindo um procedimento semelhante. Neste estudo, foram incluídos os 50 melhores marcadores da via no conjunto marcador inicial, que foram selecionados de acordo com o método no Tian et al. [22], como se explica na subseção anterior. Para o classificador com base em genes, que incluiu as 50 melhores marcadores de genes com os mais baixos -Valores no conjunto marcador inicial, a fim de manter o número máximo de características idênticas.

calcular a área sob a curva ROC

neste trabalho, foi avaliado o desempenho de um classificador com base na AUC (área sob a curva ROC). A métrica AUC tem sido amplamente utilizada para avaliar os métodos de classificação, uma vez que podem proporcionar uma útil estatísticas resumo da classificação de desempenho ao longo de toda a gama de valores de sensibilidade e especificidade. Para calcular o AUC, adotamos o método proposto em [33]. Para um dado classificador, deixe ser a saída do classificador para amostras positivas, e serão a saída para as amostras negativas. Em seguida, a métrica de AUC para o classificador é dada por: (4) onde a é a função do indicador. A AUC é realmente a probabilidade empírica de que uma amostra positiva escolhidos aleatoriamente é mais alto do que uma amostra negativa escolhido aleatoriamente. Pode ser demonstrado que a medida AUC é equivalente ao Mann-Whitney -test (também chamado de teste de soma de postos de Wilcoxon) estatísticas.

Resultados

probabilística Pathway Atividade Inference Melhora o poder discriminativo de Caminho marcadores

foi avaliado o poder discriminatório dos marcadores caminho, onde as atividades da via foram inferidos utilizando o método proposto, bem como outros métodos de inferência. Para efeito de comparação efectiva do método de inferência proposto com outros métodos existentes, foram realizadas experiências semelhantes às realizadas em [26] para avaliar o poder discriminatório dos marcadores da via. Para cada conjunto de dados do cancro da mama, primeiro utilizado o método de Tian et al. [22] para selecionar os 50 melhores caminhos entre os 639 caminhos obtidos a partir da MSigDB [21] (ver Métodos). Nós computados os escores de atividade reais dos 50 melhores caminhos com base em cada esquema de inferência atividade da via, e classificado como as vias de acordo com seu poder de discriminação. A Figura 3 mostra o poder discriminatório das principais vias, onde o -axis corresponde ao número de percursos superiores que foram considerados, e a -axis mostra a-Score absoluta média das principais vias. Foram comparados cinco métodos atividade da via de inferência, método ou seja, o método baseado em CORG [26], baseado no PCA [23], [28], média e métodos mediana [25], eo método baseado em LLR proposto neste trabalho. Para efeito de comparação, também avaliamos o poder discriminativo dos 50 melhores marcadores de genes individuais, que foram escolhidos entre os 3.271 genes abrangidos pelas 639 vias utilizadas neste estudo. Os resultados obtidos a partir do conjunto de dados Holanda cancro da mama [10] e o conjunto de dados do cancro da mama EUA [11] são mostradas na Fig. 3A e a fig. 3B, respectivamente. Como podemos ver a partir destes resultados, o esquema de inferência atividade da via proposta, que calcula a pontuação de atividade da via, combinando os índices de log-verossimilhança dos genes membros, melhorou significativamente o poder de marcadores da via para discriminar entre amostras metastáticos e amostras não-metastáticos . Curiosamente, os genes marcadores top muitas vezes comparado favoravelmente com a via marcadores. No conjunto de dados Países Baixos, os níveis dos principais genes de expressão tinha maior poder discriminativo do que os escores de atividade via inferida pelo CORG, PCA, média e métodos medianos. Apenas as pontuações actividade da via estimados pelo método proposto foram mais discriminativo do que os valores de expressão de genes. No conjunto de dados EUA, marcadores de genes foram mais discriminativo do que os marcadores com base na via de média, mediana, e métodos de PCA, mas menos discriminativo em comparação com a via marcadores com base no método proposto e o método CORG.

(a) Média -Score absoluta dos melhores marcadores para o conjunto de dados do cancro da mama Holanda. atividades via têm sido inferida usando cinco métodos diferentes: CORG, PCA, média, mediana e LLR (método proposto). O poder discriminatório dos marcadores de genes top foi estimado para comparação (rotulado como “Gene”). (B) Média-Score absoluta dos melhores marcadores para o conjunto de dados do cancro da mama EUA. (C) Os marcadores foram classificados com base no conjunto de dados Países Baixos e no-Score médio absoluto dos melhores marcadores foi calculado com base no conjunto de dados nos EUA. (D) Os marcadores foram classificados com base no conjunto de dados EUA e-Score médio absoluto dos melhores marcadores foi calculado com base no conjunto de dados Países Baixos.

Para avaliar a reprodutibilidade de marcadores da via, que classificou o marcadores com base em um conjunto de dados e avaliaram a-Score médio absoluto usando outro conjunto de dados. Figura 3C mostra o resultado para o ranking dos marcadores com base no conjunto de dados Países Baixos e calcular a-Score médio absoluto dos melhores marcadores, utilizando o conjunto de dados nos EUA. Do mesmo modo, a Fig. 3D mostra o resultado para o ranking dos marcadores com base no conjunto de dados EUA e calcular a pontuação média das principais vias que utilizam o conjunto de dados Países Baixos. Estes resultados mostram claramente que os marcadores da via seleccionada com base no método de inferência proposto reter significativamente grande poder discriminatório entre os diferentes conjuntos de dados. De facto, em ambas as experiências transversal do conjunto de dados, as pontuações actividade da via calculados pelo método de LLR eram muito mais discriminativo do que a pontuação de actividade calculados por outros métodos de inferência, bem como os valores dos marcadores de genes topo de expressão. Em conjunto, esses resultados sugerem que o método proposto pode encontrar melhores marcadores de diagnóstico com maior reprodutibilidade. Observe também que os marcadores de um único gene, que tiveram bastante grande poder discriminatório dentro de um conjunto de dados (ver Figs. 3A e 3B), perdeu a maior parte do poder discriminativo em um conjunto de dados diferente.

Em seguida, realizamos experimentos semelhantes para todos os 639 caminhos e todos os 3.271 genes abrangidos por estas vias, sem qualquer prescreening (ver Métodos). Os resultados destas experiências são mostrados na Fig. 4, onde a -axis indica a razão entre os melhores caminhos que foram utilizados para calcular a-Score absoluta média, e o -axis corresponde à prevista-Score absoluta média das principais vias. O poder discriminatório dos marcadores da via e os marcadores de genes individuais no conjunto de dados Países Baixos é mostrado na Fig. 4A, e o poder de discriminação dos marcadores no conjunto de dados EUA é mostrado na Fig. 4B. Os resultados obtidos a partir de experiências transversal do conjunto de dados estão resumidos na Fig. 4C e 4D. Na Fig. 4C, os marcadores foram classificados de acordo com seu poder discriminativo no set Holanda, e seus -scores absolutos médios foram calculados com base no conjunto de dados nos EUA. Os resultados para classificar os marcadores com base no conjunto de dados e de computação EUA as contagens utilizando o conjunto Holanda são mostrados na Fig. 4D. Todas estas experiências mostram que as pontuações actividade da via, medida pelo método de LLR proposto são muito mais discriminativo do que as pontuações calculados por outros métodos de inferência e também os valores de genes individuais de expressão. Além disso, podemos ver que os marcadores da via que foram escolhidos com base nos escores de atividade via baseados em LLR são mais reprodutível e seus escores de atividade reter quantidade significativa de capacidade discriminativa através conjuntos de dados independentes

(A) Média absoluto. – pontuação dos melhores marcadores para o conjunto de dados Países Baixos. (B) Média-Score absoluta dos melhores marcadores para o conjunto de dados nos EUA. (C) Os marcadores foram classificados com base no conjunto de dados Países Baixos e no-Score médio absoluto dos melhores marcadores foi calculado com base no conjunto de dados nos EUA. (D) Os marcadores foram classificados com base no conjunto de dados EUA e a pontuação média dos melhores marcadores foi calculado com base no conjunto de dados Países Baixos.

Proposta Pathway Atividade Esquema Inference leva a Classificadores mais precisa e confiável

Foi utilizado o esquema de inferência atividade da via proposta para a classificação de metástase do câncer de mama, para avaliar a sua utilidade em discriminar diferentes fenótipos cancerosas. Para uma comparação justa e eficaz com outros esquemas de inferência, mais uma vez aprovou uma montagem experimental similar que foi utilizado em [26] para avaliar o desempenho do método baseado em CORG, um esquema de percurso atividade inferência state-of-the-art que utiliza apenas os genes condição de resposta em um determinado percurso. Para cada conjunto de dados do cancro da mama, foi realizada cinco vezes experimentos de validação cruzada, onde quatro quintos das amostras foram utilizadas para a construção do classificador e os restantes de um quinto das amostras foram utilizados para avaliar o desempenho da classificação (ver Métodos). Embora a construção do classificador, utilizou-se o método de inferência actividade da via base-LLR para avaliar o poder de discriminação de cada marcador de itinerário e selecção do melhor conjunto de marcadores a serem utilizados no classificador. O classificador construídos também usou os escores de atividade via calculadas pelo método de inferência proposto para distinguir amostras de cancro da mama metastático a partir de amostras não-metastáticos. Em nossos experimentos, nós definimos o conjunto inicial de marcadores da via como os 50 melhores caminhos seleccionados através do método por Tian et al. [22] (ver Métodos). Foi avaliado o desempenho da classificação através da métrica AUC. Repetimos o quíntuplo de validação cruzada, para 100 partições aleatórios do conjunto de dados dada, e a média das 500 AUC resultante para obter uma medida de desempenho fiável do método de classificação. Para comparar o desempenho de classificação de diferentes métodos de inferência, nós também repetiu as experiências anteriores usando o CORG, PCA, média e métodos medianos para inferir as atividades da via. Para comparação, nós também avaliado o desempenho do método de classificação com base em genes. Foram incluídos os 50 genes discriminativas em conjunto o marcador inicial, para manter o número máximo de características idênticas para todos os métodos de classificação.

A Figura 5 resume os resultados das experiências de validação cruzada. No primeiro conjunto de experiências, utilizou-se regressão logística para a classificação das amostras. Os resultados da classificação de abordagens diferentes com base em regressão logística são mostrados na Fig. 5A. Os dois gráficos de barras no lado esquerdo da Fig. 5 correspondem às duas experiências intra-conjunto de dados com base no conjunto de dados do cancro da mama EUA (rotulado como “EUA”) e o conjunto de dados Holanda (rotulado como “Holanda”), respectivamente. Nestas experiências intra-conjunto de dados, o conjunto inicial de topo 50 marcadores foram seleccionados utilizando todo o conjunto de dados, a fim de reduzir o efeito de sensibilidade em marcador de selecção quando se comparam diferentes métodos baseados em pathway. Os experimentos de validação cruzada foram realizados com base no conjunto inicial seleccionada de marcadores (ver Métodos). Como podemos ver nestes gráficos de barras, o método proposto alcançou a precisão da classificação mais elevada entre todos os métodos, em ambos os experimentos. O método baseia-CORG são favoravelmente comparados com outros métodos à base da via, embora superado pelo método proposto. Nós também podemos ver que o classificador com base em genes desempenho muito bom no interior experimentos conjunto de dados, o que não é surpreendente se considerarmos o alto poder discriminativo dos marcadores de genes principais observados nas figuras. 3A e 3B.

A barra de gráficos mostram as AUC médias de diferentes métodos de classificação. Cinco métodos baseados em vias que usam esquemas de inferência atividade da via distintas (LLR, CORG, PCA, média e mediana) e um método baseado em genes foram comparados. Classificadores (A) foram construídos com base em regressão logística. Os resultados das experiências intra-conjunto de dados com base em conjuntos de dados dos EUA e Holanda são mostradas nos dois quadros à esquerda. Os dois gráficos à direita mostram os resultados dos experimentos cruzada do conjunto de dados. (B) O desempenho de diferentes métodos de classificação com base em LDA (análise discriminante linear).

Os resultados dos experimentos cruzada do conjunto de dados são mostrados nos dois gráficos de barras no lado direito da Fig. 5A. O gráfico rotulado como “EUA-Países Baixos” mostra os resultados para selecionar os recursos utilizando o conjunto de dados de EUA, e formação /avaliação do classificador usando o conjunto de dados de Holanda. 5A.

Deixe uma resposta